금융연구/인과강화학습

Chapter 2. 인과추론의 수리적 기초 (Causal Inference Foundations)

hertzalpha 2026. 4. 1. 09:43

Chapter 2. 인과추론의 수리적 기초 (Causal Inference Foundations)

"Correlation is not causation but it sure is a hint."
— Edward Tufte

"You cannot answer a question about intervention from data alone, no matter how big the data."
— Judea Pearl

2.1 Structural Causal Models (SCM)

2.1.1 정의

인과추론의 수학적 기초는 Structural Causal Model (SCM)이다. Pearl (2000)이 체계화한 SCM은 시스템 내 변수들의 인과 관계를 구조 방정식, 그래프, 확률 분포의 삼위일체로 표현한다.

Definition 2.1 (Structural Causal Model). SCM은 4-tuple $\mathcal{M} = \langle \mathbf{U}, \mathbf{V}, \mathbf{F}, P(\mathbf{U}) \rangle$로 정의되며, 각 구성 요소는 다음과 같다:

$\mathbf{U}$: 외생 변수(exogenous variables) 집합. 모델 외부에서 결정되는 변수.
$\mathbf{V} = {V_1, V_2, \ldots, V_n}$: 내생 변수(endogenous variables) 집합. 모델 내에서 결정되는 변수.
$\mathbf{F} = {f_1, f_2, \ldots, f_n}$: 구조 방정식(structural equations) 집합. 각 $V_i$에 대해:

$$V_i = f_i(\text{Pa}(V_i), U_i)$$

여기서 $\text{Pa}(V_i) \subseteq \mathbf{V} \setminus {V_i}$는 $V_i$의 부모(parents) — 즉, 직접적 원인 — 이며, $U_i \subseteq \mathbf{U}$는 $V_i$에 영향을 미치는 외생 변수이다.

$P(\mathbf{U})$: 외생 변수에 대한 확률 분포. 시스템의 불확실성의 근원.

SCM의 핵심 통찰은 각 구조 방정식 $V_i = f_i(\text{Pa}(V_i), U_i)$가 자율적 메커니즘(autonomous mechanism)을 나타낸다는 것이다. 이는 하나의 메커니즘을 변경해도 다른 메커니즘에 영향을 주지 않는다는 모듈성 가정(modularity assumption)에 해당한다.

2.1.2 금융에서의 SCM: 기본 예시

금융 시스템을 SCM으로 모델링하는 간단한 예시를 구성하자.

Example 2.1 (금리-자산가격 SCM).

내생 변수: $\mathbf{V} = {I, S, B, E}$

$I$: 기준금리 (Central Bank Rate)
$S$: 주식 시장 수익률
$B$: 채권 수익률
$E$: 경제 성장률

외생 변수: $\mathbf{U} = {U_I, U_S, U_B, U_E}$ (각 변수의 고유한 불확실성)

구조 방정식:
$$E = f_E(U_E)$$
$$I = f_I(E, U_I)$$
$$S = f_S(I, E, U_S)$$
$$B = f_B(I, U_B)$$

이 SCM은 다음을 인코딩한다: 경제 성장률이 금리에 영향을 미치고, 금리와 경제 성장률이 함께 주식 시장에 영향을 미치며, 금리가 채권 수익률에 영향을 미친다.

여기서 중요한 것은 이 방정식들이 대칭적 상관관계가 아니라 비대칭적 인과 관계를 표현한다는 점이다. $I = f_I(E, U_I)$는 "경제 성장이 금리를 결정한다"를 의미하지, "금리와 경제 성장이 상관되어 있다"를 의미하지 않는다.

2.1.3 SCM vs 전통적 금융 모델

전통적 금융 계량경제학의 연립방정식 모델(Simultaneous Equation Model, SEM)과 SCM의 관계를 명확히 해야 한다. 역사적으로 경제학자들은 구조 방정식의 "구조적" 해석을 채택하면서도, 인과적 의미 부여를 회피해 왔다. Pearl의 SCM은 이 모호성을 해결한다:

측면	전통 SEM/VAR	SCM
방정식의 의미	균형 조건 (대칭적)	인과 메커니즘 (비대칭적)
개입 모델링	외생 변수 충격 (축약형)	$do(\cdot)$ 연산자 (구조적)
반사실	명시적 지원 없음	완전한 반사실 추론 가능
Granger 인과	시간적 선행 = "인과"	구조적 인과 (시간 독립적)

특히 Granger 인과(Granger Causality)는 "예측적 선행(predictive precedence)"을 측정할 뿐, 진정한 인과 관계를 식별하지 못한다. $X$가 $Y$를 Granger-cause한다는 것은 $X$의 과거 값이 $Y$ 예측에 도움이 된다는 것이지, $X$가 $Y$의 원인이라는 것이 아니다. 교란변수 $Z$가 $X$에 먼저, $Y$에 나중에 영향을 미치면, $X$는 $Y$를 Granger-cause하지만 $X$는 $Y$의 진정한 원인이 아니다.

2.2 Causal Graphs와 d-Separation

2.2.1 Directed Acyclic Graph (DAG)

SCM $\mathcal{M}$은 자연스럽게 Directed Acyclic Graph (DAG) $G = (\mathbf{V}, \mathbf{E})$를 유도한다.

Definition 2.2 (Causal Graph). SCM $\mathcal{M}$의 causal graph $G$는 다음과 같이 구성된다:

노드: 내생 변수 $\mathbf{V}$의 각 원소
방향 간선: $V_j \in \text{Pa}(V_i)$이면 $V_j \to V_i$

Example 2.1의 DAG는:

$$E \longrightarrow I \longrightarrow B$$

$$E \longrightarrow S \longleftarrow I$$

2.2.2 경로의 유형과 세 가지 기본 구조

DAG에서 세 노드 간의 연결에는 정확히 세 가지 기본 패턴이 존재한다. 이 세 패턴을 이해하는 것이 인과추론의 핵심이다.

1. Chain (매개, Mediation): $X \to M \to Y$

$X$가 $M$을 통해 $Y$에 영향을 미친다. $M$은 매개변수(mediator)이다.

금융 예시: 금리 인하($X$) → 기업 차입 비용 감소($M$) → 주가 상승($Y$)

$M$에 조건을 걸면(conditioning), $X$와 $Y$ 사이의 인과 경로가 차단(blocked)된다.

2. Fork (교란, Confounding): $X \leftarrow Z \to Y$

$Z$가 $X$와 $Y$ 모두의 공통 원인이다. $Z$는 교란변수(confounder)이다.

금융 예시: 경제 성장($Z$) → 기업 이익 증가($X$), 경제 성장($Z$) → 주가 상승($Y$). 기업 이익과 주가가 상관되지만, 이 상관의 일부는 경제 성장이라는 공통 원인 때문이다.

$Z$에 조건을 걸면, $X$와 $Y$ 사이의 허위 연관(spurious association)이 제거된다.

3. Collider (충돌, Selection Bias): $X \to Z \leftarrow Y$

$X$와 $Y$가 $Z$의 공통 원인이다. $Z$는 충돌변수(collider)이다.

금융 예시: 높은 수익률($X$) → 펀드 선정($Z$), 낮은 변동성($Y$) → 펀드 선정($Z$). 선정된 펀드($Z$에 조건을 건 상태)만 보면, 수익률과 변동성 사이에 인위적 음의 상관이 나타난다 — 생존자 편향(survivorship bias)의 인과적 메커니즘.

$Z$에 조건을 걸지 않으면, $X$와 $Y$는 (조건부) 독립이다.
$Z$에 조건을 걸면, $X$와 $Y$ 사이에 허위 연관이 생성된다.

핵심 원칙: Fork에서는 교란변수에 조건을 걸어야 하고, Collider에서는 조건을 걸면 안 된다. 이 두 원칙의 혼동이 금융 분석에서 흔한 오류의 근원이다.

2.2.3 d-Separation

Definition 2.3 (d-Separation). DAG $G$에서, 노드 집합 $\mathbf{Z}$가 주어졌을 때, $X$에서 $Y$로의 경로가 차단(blocked)되려면 경로 상에 다음 중 하나를 만족하는 노드 $W$가 존재해야 한다:

(a) $W$가 chain 또는 fork의 중간 노드이고 $W \in \mathbf{Z}$ (조건부)
(b) $W$가 collider이고 $W \notin \mathbf{Z}$이며 $W$의 어떤 자손(descendant)도 $\mathbf{Z}$에 속하지 않음

$X$에서 $Y$로의 모든 경로가 $\mathbf{Z}$에 의해 차단되면, $X$와 $Y$는 $\mathbf{Z}$가 주어졌을 때 d-separated라 하고, $(X \perp!!!\perp Y \mid \mathbf{Z})_G$로 표기한다.

d-Separation의 핵심 성질:

Theorem 2.1 (Global Markov Property). SCM $\mathcal{M}$이 DAG $G$를 유도하고, $P$가 $\mathcal{M}$이 유도하는 관측 분포이면:

$$(X \perp\!\!\!\perp Y \mid \mathbf{Z})_G \implies X \perp\!\!\!\perp Y \mid \mathbf{Z} \text{ in } P$$

즉, 그래프 상의 d-separation은 확률 분포에서의 조건부 독립을 함의한다.

2.2.4 Backdoor Criterion과 Adjustment Formula

Definition 2.4 (Backdoor Criterion). 변수 집합 $\mathbf{Z}$가 순서쌍 $(X, Y)$에 대해 backdoor criterion을 만족하려면:

(i) $\mathbf{Z}$의 어떤 노드도 $X$의 자손(descendant)이 아니다.
(ii) $\mathbf{Z}$가 $X$에서 $Y$로의 모든 backdoor path (즉, $X$로 들어오는 화살표를 포함하는 경로)를 차단한다.

Backdoor criterion이 만족되면, $X$가 $Y$에 미치는 인과 효과를 관측 데이터만으로 식별할 수 있다:

Theorem 2.2 (Backdoor Adjustment). $\mathbf{Z}$가 $(X, Y)$에 대해 backdoor criterion을 만족하면:
$$P(Y \mid do(X = x)) = \sum_{\mathbf{z}} P(Y \mid X = x, \mathbf{Z} = \mathbf{z}) , P(\mathbf{Z} = \mathbf{z})$$

연속 변수의 경우:
$$P(Y \mid do(X = x)) = \int P(Y \mid X = x, \mathbf{Z} = \mathbf{z}) , dP(\mathbf{z})$$

금융 해석: 포트폴리오 전략 $X$가 수익률 $Y$에 미치는 진정한 인과 효과를 추정하려면, 교란변수 $\mathbf{Z}$ (시장 레짐, 거시 환경 등)를 통제해야 한다. 단순히 $P(Y \mid X)$를 보는 것은 — 교란변수를 무시한 — 편향된 추정이다.

2.2.5 Frontdoor Criterion

Backdoor adjustment가 불가능할 때 — 즉, 교란변수가 비관측일 때 — Frontdoor criterion이 대안을 제공한다.

Definition 2.5 (Frontdoor Criterion). 변수 집합 $\mathbf{M}$이 $(X, Y)$에 대해 frontdoor criterion을 만족하려면:

(i) $\mathbf{M}$이 $X$에서 $Y$로의 모든 방향 경로(directed path)를 매개한다.
(ii) $X$에서 $\mathbf{M}$으로의 backdoor path가 없다.
(iii) $\mathbf{M}$에서 $Y$로의 모든 backdoor path가 $X$에 의해 차단된다.

Theorem 2.3 (Frontdoor Adjustment). $\mathbf{M}$이 frontdoor criterion을 만족하면:
$$P(Y \mid do(X = x)) = \sum_{\mathbf{m}} P(\mathbf{M} = \mathbf{m} \mid X = x) \sum_{x'} P(Y \mid X = x', \mathbf{M} = \mathbf{m}) , P(X = x')$$

금융 예시: 투자자 심리($X$)가 주가($Y$)에 미치는 효과를 추정하고 싶지만, 비관측 교란변수(예: 내부자 정보 $U$)가 존재한다. 만약 투자자 심리가 거래량($M$)을 통해서만 주가에 영향을 미친다면, $M$은 frontdoor criterion을 만족하고, 비관측 교란에도 불구하고 인과 효과를 식별할 수 있다.

2.3 do-calculus와 Interventional Distribution

2.3.1 개입(Intervention)의 형식화

SCM의 가장 강력한 특성은 개입(intervention)을 형식적으로 정의할 수 있다는 것이다.

Definition 2.6 (Perfect Intervention). SCM $\mathcal{M} = \langle \mathbf{U}, \mathbf{V}, \mathbf{F}, P(\mathbf{U}) \rangle$에서 $X = x$로의 완전 개입(perfect intervention) $do(X = x)$은 새로운 SCM $\mathcal{M}_x$를 생성한다:
$$\mathcal{M}_x = \langle \mathbf{U}, \mathbf{V}, \mathbf{F}_x, P(\mathbf{U}) \rangle$$
여기서 $\mathbf{F}_x$는 $\mathbf{F}$에서 $X$의 구조 방정식 $X = f_X(\text{Pa}(X), U_X)$를 상수 $X = x$로 교체한 것이다. 다른 모든 구조 방정식은 변경되지 않는다 (모듈성).

그래프적으로, $do(X = x)$는 $G$에서 $X$로 들어오는 모든 화살표를 제거한 절단 그래프(mutilated graph) $G_{\overline{X}}$에 해당한다.

관측 vs 개입의 근본적 차이:

$$\underbrace{P(Y \mid X = x)}_{\text{관측: "X=x인 사람들에서 Y는?"}} \neq \underbrace{P(Y \mid do(X = x))}_{\text{개입: "X를 x로 설정하면 Y는?"}}$$

금융에서 이 구분은 실질적이다:

$P(\text{Return} \mid \text{Strategy} = A)$: Strategy A를 선택한 투자자들의 수익률 (선택 편향 포함)
$P(\text{Return} \mid do(\text{Strategy} = A))$: 모든 투자자에게 Strategy A를 배정했을 때 수익률 (인과 효과)

2.3.2 do-calculus의 세 가지 규칙

Backdoor과 frontdoor criterion은 특수한 경우이다. Pearl의 do-calculus는 관측 분포와 개입 분포 사이의 변환을 위한 완전한(complete) 규칙 체계를 제공한다.

Theorem 2.4 (do-calculus, Pearl 1995). $G$를 SCM $\mathcal{M}$의 DAG, $P$를 $\mathcal{M}$이 유도하는 분포라 하자. $X, Y, Z, W$를 $\mathbf{V}$의 부분 집합이라 하면, 다음 세 규칙이 성립한다:

Rule 1 (관측의 삽입/삭제):

$$(Y \perp\!\!\!\perp Z \mid X, W)_{G_{\overline{X}}} \implies P(Y \mid do(X), Z, W) = P(Y \mid do(X), W)$$

Rule 2 (행동/관측 교환):

$$(Y \perp\!\!\!\perp Z \mid X, W)_{G_{\overline{X}, \underline{Z}}} \implies P(Y \mid do(X), do(Z), W) = P(Y \mid do(X), Z, W)$$

Rule 3 (개입의 삽입/삭제):

$$(Y \perp\!\!\!\perp Z \mid X, W)_{G_{\overline{X}, \overline{Z(S)}}} \implies P(Y \mid do(X), do(Z), W) = P(Y \mid do(X), W)$$

여기서 $Z(S)$는 $G_{\overline{X}}$에서 $Z$의 조상이 아닌 $Z$의 노드 집합이며, $G_{\overline{X}}$는 $X$로 들어오는 간선을 제거한 그래프, $G_{\underline{Z}}$는 $Z$에서 나가는 간선을 제거한 그래프이다.

do-calculus의 완전성(completeness)은 다음을 의미한다: 만약 어떤 인과 효과가 관측 데이터에서 식별 가능하다면, 이 세 규칙의 유한 반복 적용으로 반드시 그 식별 공식을 도출할 수 있다.

2.3.3 금융에서의 개입 예시

개입	$do(\cdot)$ 표현	관측과의 차이
중앙은행 금리 변경	$do(I = 0.05)$	경제 상황과 무관하게 금리를 5%로 설정
포트폴리오 리밸런싱	$do(w = w^*)$	시장 신호와 무관하게 목표 배분으로 조정
규제 변경	$do(\text{Reg} = \text{strict})$	시장 상황과 무관하게 규제를 강화
양적완화	$do(\text{QE} = $100B)$	시장 조건과 무관하게 자산 매입 실행

핵심은 각각에서 "무관하게"라는 표현이다. 개입은 원인에서 $X$로의 화살표를 절단하므로, $X$의 값이 더 이상 그 원인들에 의해 결정되지 않는다.

2.4 Pearl의 인과 계층 (Causal Hierarchy Theorem)

2.4.1 세 계층의 정의

Pearl과 협력자들은 인과 정보를 세 가지 계층으로 분류하는 인과 계층(Causal Hierarchy)을 제안했다. 이는 단순한 분류가 아니라, 수학적으로 증명된 정보 장벽을 반영한다.

Definition 2.7 (Pearl의 인과 계층).

계층	이름	전형적 질문	수학적 표현
L1	Association (관측)	"$Y$를 관측하면 $X$에 대해 무엇을 알 수 있는가?"	$P(Y \mid X)$
L2	Intervention (개입)	"$X$를 바꾸면 $Y$는 어떻게 되는가?"	$P(Y \mid do(X))$
L3	Counterfactual (반사실)	"$X$가 달랐더라면 $Y$는 어떠했을까?"	$P(Y_x \mid X = x', Y = y')$

2.4.2 각 계층의 금융 해석

Layer 1 — Association (관측적 추론):

이 계층의 연산은 관측 데이터의 조건부 확률로 표현된다. 현대 금융의 대부분의 예측 모델이 여기에 속한다.

팩터 모델: $\mathbb{E}[R_i \mid F_1, F_2, \ldots, F_K]$
수익률 예측: $P(\text{Return} > 0 \mid \text{Features})$
상관관계 분석: $\text{Corr}(R_i, R_j)$

Layer 1만으로는 "왜 수익률이 높았는가?"라는 질문에 답할 수 없다. 높은 수익률이 전략의 효과인지, 시장 환경(교란변수) 때문인지 구분할 수 없다.

Layer 2 — Intervention (개입적 추론):

이 계층은 $do(\cdot)$ 연산자를 포함하며, 능동적 행동의 효과를 다룬다.

리밸런싱 효과: $P(\text{Return} \mid do(\text{Weight}_A = 0.6))$
금리 변경 효과: $P(\text{GDP} \mid do(\text{Rate} = 0.03))$
헤지 효과: $P(\text{Loss} < \ell \mid do(\text{Hedge Ratio} = h))$

Layer 2는 "이 행동을 취하면 무슨 일이 일어나는가?"에 답한다. RL의 정책 학습이 주로 이 계층에서 작동한다.

Layer 3 — Counterfactual (반사실적 추론):

이 계층은 개체 수준(individual-level)의 "만약 다른 행동을 했다면?"이라는 질문을 다룬다.

반사실적 전략 평가: $P(Y_{A'} \mid \text{실제 전략} = A, \text{실제 수익} = y)$
- "전략 A를 사용해서 수익 $y$를 얻었는데, 만약 전략 $A'$을 사용했다면?"
개별 거래 귀인: "이 특정 거래가 성공한 것은 전략 때문인가, 운 때문인가?"
자유의지와 자율성: "AI 에이전트가 이 결정을 스스로 내린 것인가?"

2.4.3 Causal Hierarchy Theorem (CHT)

Theorem 2.5 (Causal Hierarchy Theorem, Bareinboim et al., 2020). 인과 계층의 각 계층은 엄격한 정보 장벽(strict information barrier)에 의해 분리된다. 구체적으로:

(i) $P(Y \mid X)$ (L1)의 완전한 지식만으로는 $P(Y \mid do(X))$ (L2)를 결정할 수 없다 (일반적으로).
(ii) $P(Y \mid do(X))$ (L2)의 완전한 지식만으로는 $P(Y_{x'} \mid X = x, Y = y)$ (L3)를 결정할 수 없다 (일반적으로).

더 정확하게:

임의의 L1 분포 $P(X, Y)$에 대해, 이를 유도하는 두 개의 SCM $\mathcal{M}_1, \mathcal{M}_2$가 존재하여:

$$P^{\mathcal{M}_1}(Y \mid X) = P^{\mathcal{M}_2}(Y \mid X) \quad \text{but} \quad P^{\mathcal{M}_1}(Y \mid do(X)) \neq P^{\mathcal{M}_2}(Y \mid do(X))$$

금융에서의 함의:

이 정리는 금융에 파괴적 함의를 가진다:

백테스트의 한계: 과거 관측 데이터(L1)에서의 전략 성과가 아무리 좋아도, 그것만으로는 전략을 실제 배포했을 때(L2)의 성과를 보장할 수 없다. 이는 백테스트 과적합 문제의 수학적 기초이다.
실전 성과의 한계: 전략의 실전 성과(L2)가 있더라도, "만약 다른 전략이었다면?"(L3)이라는 질문에 답하려면 추가적 구조적 가정이 필요하다.
계층 간 이동을 위한 조건: L1 → L2 이동은 인과 그래프(구조적 가정)가 있을 때 가능하다 (backdoor/frontdoor criterion, do-calculus). L2 → L3 이동은 SCM의 구조 방정식(함수적 가정)까지 필요하다.

2.4.4 수학적 직관: 왜 계층 간 장벽이 존재하는가

직관적으로, 각 계층이 추가 정보를 요구하는 이유는:

L1 → L2: 관측 데이터 $P(Y \mid X)$는 $X$와 $Y$ 사이의 모든 경로 — 인과 경로와 교란 경로 모두 — 를 반영한다. 개입 $do(X)$는 교란 경로를 절단하므로, 이 두 기여를 분리하려면 그래프 구조(어떤 경로가 교란인지)가 필요하다.

L2 → L3: 개입 분포 $P(Y \mid do(X))$는 모집단 수준(population-level)의 효과이다. 반사실은 개체 수준(individual-level)의 질문이므로, 특정 개체의 외생 변수 값 $U = u$를 복원(abduction)해야 한다. 이를 위해 구조 방정식의 함수 형태가 필요하다.

반사실 추론의 3단계:

반사실 추론 알고리즘 (Pearl, 2000):

Step 1. Abduction (역추론): 관측된 증거 $(X = x', Y = y')$를 사용하여 외생 변수의 사후 분포를 업데이트:
$$P(\mathbf{U} \mid X = x', Y = y')$$

Step 2. Action (개입): $X = x$로의 개입을 적용하여 절단 모델 $\mathcal{M}_x$를 구성.

Step 3. Prediction (예측): $\mathcal{M}_x$와 업데이트된 $P(\mathbf{U} \mid X = x', Y = y')$ 하에서 $Y$의 분포를 계산:
$$P(Y_x \mid X = x', Y = y')$$

금융 예시: 2020년 3월 COVID 충격 시 전략 A를 사용하여 -15% 수익을 얻었다. "만약 전략 B를 사용했다면?"이라는 질문에 답하려면:

Abduction: 2020년 3월의 시장 상태 $U$를 역추론 (관측된 변동성, 유동성, 심리 지표 등으로부터)
Action: 전략 B를 $do$로 설정
Prediction: 동일한 시장 상태 $U$ 하에서 전략 B의 결과를 예측

2.5 Identifiability와 Data Fusion

2.5.1 식별 가능성 (Identifiability)

Definition 2.8 (Identifiability). 인과 효과 $P(Y \mid do(X))$가 식별 가능(identifiable)하다 함은, DAG $G$의 가정 하에서, 관측 분포 $P(\mathbf{V})$만으로 $P(Y \mid do(X))$를 유일하게 결정할 수 있음을 의미한다.

식별 가능성은 데이터의 양이 아니라 인과 구조에 의해 결정된다. 무한한 관측 데이터가 있어도, 구조적으로 식별 불가능한 효과는 추정할 수 없다.

ID 알고리즘 (Tian & Pearl, 2002; Shpitser & Pearl, 2006): DAG가 주어졌을 때, 임의의 인과 효과가 관측 데이터에서 식별 가능한지 판별하고, 가능하다면 식별 공식을 도출하는 완전한(sound and complete) 알고리즘이 존재한다.

2.5.2 Data Fusion: 관측과 실험 데이터의 결합

Definition 2.9 (Data Fusion). 서로 다른 실험 조건에서 생성된 데이터셋들을 결합하여, 개별 데이터셋만으로는 식별할 수 없는 인과 효과를 추정하는 과정.

Bareinboim & Pearl (2016)은 이 문제에 대한 일반적 해법을 제시했다. 핵심 아이디어는, 일부 변수에 대한 관측 데이터와 다른 변수에 대한 실험 데이터를 체계적으로 결합하면, 어느 한쪽만으로는 식별할 수 없는 효과도 식별할 수 있다는 것이다.

금융에서의 Data Fusion:

금융은 순수한 실험이 거의 불가능한 분야이지만, 다양한 "자연 실험(natural experiment)"과 관측 데이터가 공존한다:

데이터 유형	인과 계층	예시
과거 시장 데이터	L1 (관측)	일별 수익률, 팩터 노출, 거래량
이벤트 스터디	L1 + 준실험	합병 공시, 실적 발표, 정책 변경
A/B 테스트	L2 (개입)	마켓메이킹 전략 비교, 알고 트레이딩 테스트
중앙은행 정책 변경	L2 (외생 개입)	금리 결정, 양적완화
규제 변경	L2 (외생 개입)	공매도 금지, 거래세 도입

Data Fusion의 금융 적용 시나리오:

$$\underbrace{P(\text{Return} \mid \text{Factor})}_{\text{관측 데이터 (L1)}} + \underbrace{P(\text{Factor} \mid do(\text{Policy}))}_{\text{정책 변경 데이터 (L2)}} \implies P(\text{Return} \mid do(\text{Policy}))$$

이 결합은 do-calculus의 규칙들을 적용하여 정당화된다. 본서의 Part II에서 CRL의 각 과업이 이 결합을 어떻게 활용하는지 체계적으로 다룬다.

2.5.3 금융에서의 식별 전략

금융에서 인과 효과를 식별하기 위한 주요 전략을 정리한다.

1. Backdoor Adjustment (공변량 보정)

관측 가능한 교란변수 $\mathbf{Z}$를 통제하여 인과 효과를 추정. 금융에서 가장 흔히 사용되는 접근이지만, 비관측 교란(unobserved confounding)이 존재하면 편향된다.

$$\text{ATE} = \mathbb{E}[Y \mid do(X=1)] - \mathbb{E}[Y \mid do(X=0)] = \sum_{\mathbf{z}} \left[\mathbb{E}[Y \mid X=1, \mathbf{Z}=\mathbf{z}] - \mathbb{E}[Y \mid X=0, \mathbf{Z}=\mathbf{z}]\right] P(\mathbf{z})$$

2. Instrumental Variables (도구 변수)

비관측 교란이 존재할 때, 처치 변수 $X$에는 영향을 미치지만 결과 변수 $Y$에는 $X$를 통해서만 영향을 미치는 도구 변수 $Z$를 활용.

조건: (a) Relevance: $Z \to X$, (b) Exclusion: $Z \not\to Y$ except through $X$, (c) Independence: $Z \perp!!!\perp U$

선형 모델에서의 IV 추정량:

$$\hat{\beta}_{IV} = \frac{\text{Cov}(Z, Y)}{\text{Cov}(Z, X)}$$

금융 예시: Haddad et al. (2025)은 자산 가격의 인과적 추론을 위해, 지수 편입/편출(index inclusion)을 도구 변수로 활용하여 수요 탄력성을 추정했다. 지수 편입은 자산의 수요에 영향을 미치지만(관련성), 기업의 내재 가치에 직접 영향을 미치지는 않으므로(배제 제약), 유효한 IV가 된다.

3. Difference-in-Differences (이중차분법)

정책 변경 전후, 처치군과 대조군의 변화량 차이로 인과 효과를 추정. 평행 추세 가정(parallel trends assumption)이 핵심.

$$\text{ATT} = \left[\mathbb{E}[Y_{\text{post}} - Y_{\text{pre}} \mid \text{Treated}]\right] - \left[\mathbb{E}[Y_{\text{post}} - Y_{\text{pre}} \mid \text{Control}]\right]$$

금융 예시: 특정 국가의 공매도 금지 조치의 효과를 추정할 때, 금지 대상 종목(처치군)과 비대상 종목(대조군)의 수익률 변화를 비교.

4. Regression Discontinuity (회귀 단절)

처치가 연속 변수의 특정 임계값에서 결정될 때, 임계값 주변의 불연속을 이용하여 인과 효과를 추정.

금융 예시: 신용등급 BBB-에서 BB+로의 강등 임계값 근처에서, 등급 강등이 채권 수익률에 미치는 인과 효과를 추정.

2.5.4 식별 불가능한 경우: 부분 식별과 경계

식별이 완전히 불가능한 경우에도, 인과 효과의 경계(bounds)를 도출할 수 있다.

Theorem 2.6 (Balke & Pearl, 1994). 비관측 교란이 존재하여 인과 효과가 점 식별(point identification)되지 않는 경우에도, 관측 데이터와 그래프 구조로부터 인과 효과의 상한과 하한을 도출할 수 있다.

$$L(P) \leq P(Y = 1 \mid do(X = 1)) \leq U(P)$$

여기서 $L(P)$와 $U(P)$는 관측 분포 $P$의 함수로 계산되는 날카로운(sharp) 경계이다.

금융에서 이 접근은 매우 유용하다: 정확한 인과 효과를 모르더라도, 그 효과의 범위를 알면 최악의 경우(worst-case) 기반 의사결정이 가능하다. 이는 리스크 관리의 핵심 원칙인 보수적 추정과 자연스럽게 연결된다.

핵심 요약 (Key Takeaways)

SCM $\mathcal{M} = \langle \mathbf{U}, \mathbf{V}, \mathbf{F}, P(\mathbf{U}) \rangle$은 인과 관계를 구조 방정식, 그래프, 확률의 삼위일체로 표현하며, 금융 시스템의 메커니즘을 모델링한다.
DAG의 세 기본 구조 — Chain, Fork, Collider — 를 이해하는 것이 인과 추론의 핵심이며, 금융에서 교란(Fork)과 생존자 편향(Collider)의 인과적 메커니즘을 설명한다.
d-Separation은 그래프 구조에서 조건부 독립을 읽어내는 도구이며, Backdoor/Frontdoor Criterion은 관측 데이터에서 인과 효과를 식별하는 충분 조건이다.
do-calculus의 세 규칙은 $do(\cdot)$ 연산자를 포함한 표현을 관측 가능한 양으로 변환하는 완전한 체계이다.
Causal Hierarchy Theorem은 관측(L1) → 개입(L2) → 반사실(L3) 사이에 넘을 수 없는 정보 장벽이 존재함을 증명하며, 이는 백테스트의 한계와 실전 배포의 불확실성에 대한 수학적 기초이다.
Data Fusion은 관측 데이터와 실험 데이터를 체계적으로 결합하여, 개별 데이터만으로는 불가능한 인과 식별을 가능케 하며, 금융의 다양한 데이터 소스 결합에 직접 적용된다.
식별 불가능한 경우에도 부분 식별(bounds)을 통해 보수적 의사결정이 가능하며, 이는 리스크 관리의 핵심 원칙과 자연스럽게 연결된다.

더 읽을거리

Pearl, J. (2009). Causality: Models, Reasoning, and Inference. 2nd ed. Cambridge University Press. — SCM, do-calculus, 인과 계층의 원전.
Pearl, J., Glymour, M., Jewell, N.P. (2016). Causal Inference in Statistics: A Primer. Wiley. — 접근 가능한 입문서.
Bareinboim, E., Correa, J., Ibeling, D., Icard, T. (2020). On Pearl's Hierarchy and the Foundations of Causal Inference. ACM Books. — Causal Hierarchy Theorem의 정식 증명.
Bareinboim, E. & Pearl, J. (2016). Causal Inference and the Data-Fusion Problem. PNAS, 113(27), 7345-7352. — Data Fusion의 일반 이론.
Hernán, M.A. & Robins, J.M. (2020). Causal Inference: What If. Chapman & Hall/CRC. — 역학 관점의 인과추론으로, 금융과의 방법론적 유사성이 크다.

'금융연구 > 인과강화학습' 카테고리의 다른 글

Chapter 6. Task 3 — Counterfactual Decision-Making: 반사실적 의사결정 (0)	2026.04.01
Chapter 5. Task 2 — When and Where to Intervene: 정책 공간 정제 (1)	2026.04.01
Chapter 4. Task 1 — Causal Offline-to-Online Learning: 일반화된 정책 학습 (0)	2026.04.01
Chapter 3. 강화학습의 수리적 기초 (RL Foundations) (0)	2026.04.01
Chapter 1. 왜 금융에 인과적 강화학습인가? (0)	2026.04.01

현재글Chapter 2. 인과추론의 수리적 기초 (Causal Inference Foundations)

hertzalpha 님의 블로그

hertzalpha 님의 블로그 입니다.

Today :
Yesterday :

hertzalpha 님의 블로그