Chapter 8. Task 5 — Learning Causal Models: 인과 구조 발견
"Most of the work done in factor investing and economic indices' analysis rely on the correlation between the variables and do not consider the fundamental question of 'why'."
— Sadeghi, Gopal & Fesanghary (2024)
8.1 문제 정의: 인과 그래프의 학습
8.1.1 CRL Task 5의 위치
Task 5 (Learning Causal Models). 관측(L1)과 실험(L2)을 체계적으로 결합하여 SCM $\mathcal{M}$의 인과 그래프 $G$를 학습하라.
앞선 Chapter들(Ch.4–7)은 인과 그래프 $G$가 주어진 상태에서 출발했다. Task 5는 더 근본적인 질문을 다룬다: 인과 그래프 자체를 어떻게 데이터로부터 학습하는가?
금융에서 이 질문의 중요성:
- 팩터 간 인과 관계를 모르면, Task 2(어디에 개입할 것인가)의 POMIS를 계산할 수 없다
- 자산 간 인과 네트워크를 모르면, Task 4(전이가능성)의 Selection Diagram을 설계할 수 없다
- 인과 구조를 잘못 특정하면, 모든 후속 인과 추론이 편향된다
8.1.2 인과 발견 vs 상관 분석
| 상관 분석 | 인과 발견 | |
|---|---|---|
| 출력 | 무방향 연관 네트워크 | 방향성 인과 그래프 (DAG) |
| 해석 | "$X$와 $Y$가 함께 움직인다" | "$X$가 $Y$의 원인이다" |
| 방향성 | 없음 | 있음 ($X \rightarrow Y$ vs $Y \rightarrow X$) |
| 교란 처리 | 허위 연관 제거 불가 | 교란 경로 식별 및 차단 |
| 금융 사례 | 상관 행렬 기반 포트폴리오 | 인과 네트워크 기반 리스크 관리 |
8.1.3 인과 발견의 세 가지 접근 패러다임
| 패러다임 | 핵심 원리 | 대표 알고리즘 | 가정 |
|---|---|---|---|
| Constraint-based | 조건부 독립 테스트 | PC, FCI, PCMCI, LPCMCI | Faithfulness, Markov |
| Score-based | 그래프 점수 최적화 | GES, NOTEARS, DYNOTEARS | 점수 함수의 일관성 |
| FCM-based | 함수적 인과 모델의 비대칭성 | LiNGAM, ANM, CAM | 노이즈 분포 가정 |
8.2 Constraint-Based 방법론
8.2.1 PC 알고리즘의 기본 구조
PC 알고리즘(Peter-Clark)은 인과 발견의 기초적 알고리즘이다.
Phase 1: Skeleton Discovery (뼈대 발견)
모든 변수 쌍 $(X_i, X_j)$에 대해, 조건화 집합 $\mathbf{S}$를 점진적으로 확대하며 조건부 독립을 테스트:
$$X_i \perp\!\!\!\perp X_j \mid \mathbf{S} \quad \Rightarrow \quad X_i \text{와 } X_j \text{ 사이의 간선 제거}$$
Phase 2: Edge Orientation (간선 방향 결정)
Collider 패턴($X_i \rightarrow X_k \leftarrow X_j$)을 식별하고, 추가 규칙으로 간선을 방향화.
한계: PC는 인과 충분성(causal sufficiency)을 가정 — 모든 공통원인이 관측됨. 금융에서 이 가정은 거의 항상 위반.
8.2.2 FCI: 잠재 교란 허용
FCI (Fast Causal Inference)는 비관측 교란변수를 허용하는 확장:
- 간선 유형 확장: $\rightarrow$(인과), $\leftrightarrow$(비관측 공통원인), $\circ$(미확정)
- 출력: PAG (Partial Ancestral Graph) — 마르코프 동치 클래스를 대표
- 금융에서 비관측 교란(시장 심리, 내부 정보)의 존재를 허용
8.2.3 PCMCI: 시계열 인과 발견의 표준
시계열 데이터에서의 인과 발견을 위해 Runge et al. (2019)이 개발한 PCMCI:
Algorithm (PCMCI). 두 단계로 구성:
Stage 1: PC-stable 기반 조건 선택. 각 변수 $X_t^j$에 대해, 그 부모(parents) 후보를 조건부 독립 테스트로 축소:
$$\hat{\mathcal{P}}(X_t^j) = \{X_{t-\tau}^i : X_{t-\tau}^i \not\perp\!\!\!\perp X_t^j \mid \mathbf{S}\}$$
Stage 2: Momentary Conditional Independence (MCI) 테스트. 축소된 부모 집합을 조건으로, 각 잠재적 인과 링크를 테스트:
$$X_{t-\tau}^i \perp\!\!\!\perp X_t^j \mid \hat{\mathcal{P}}(X_t^j) \setminus \{X_{t-\tau}^i\}, \hat{\mathcal{P}}(X_{t-\tau}^i)$$
PCMCI의 핵심 장점:
- 고차원 시계열에서의 효율적 조건 선택 (차원의 저주 완화)
- 자기상관(autocorrelation)의 영향 통제
- 거짓 양성(false positive) 제어
PCMCI+ 확장: 동시점(contemporaneous) 인과 관계도 발견 가능.
가정:
- 인과 충분성 (causal sufficiency)
- 인과 마르코프 조건
- Faithfulness
- 인과 정상성 (causal stationarity)
- 유한 최대 시차 $\tau_{max}$
8.2.4 LPCMCI: 잠재 교란 + 시계열
Gerhardus & Runge (2020)의 LPCMCI는 PCMCI를 잠재 교란 허용으로 확장:
- FCI의 아이디어를 시계열에 적용
- Middle marks 도입: 알고리즘 실행 중 중간 인과 정보를 표현
- LPCMCI-PAG: 잠재 교란 하에서도 모호하지 않은 인과 해석 제공
- 거짓 양성 문제 완화
금융 적합성: 시장 심리, 내부 정보 등 비관측 교란이 보편적인 금융 데이터에 PCMCI보다 더 적합.
8.3 Score-Based 방법론
8.3.1 NOTEARS: 연속 최적화로의 전환
Zheng et al. (2018)의 NOTEARS는 인과 발견의 패러다임을 전환한 알고리즘:
기존: DAG 학습 = 이산적 조합 최적화 (NP-hard)
NOTEARS: DAG 학습 = 연속 제약 최적화 (경사하강법 적용 가능)
핵심 혁신 — 비순환성의 대수적 특성화:
$$h(\mathbf{W}) = \text{tr}(e^{\mathbf{W} \circ \mathbf{W}}) - d = 0$$
여기서 $\mathbf{W} \in \mathbb{R}^{d \times d}$는 인접 행렬, $\circ$는 원소별 곱, $d$는 변수 수. $h(\mathbf{W}) = 0$이면 $\mathbf{W}$에 대응하는 그래프는 비순환(acyclic).
최적화 문제:
$$\min_{\mathbf{W}} \frac{1}{2n} \|\mathbf{X} - \mathbf{X}\mathbf{W}\|_F^2 + \lambda \|\mathbf{W}\|_1 \quad \text{s.t.} \quad h(\mathbf{W}) = 0$$
8.3.2 DYNOTEARS: 시계열 확장
Pamfil et al. (2020)의 DYNOTEARS는 NOTEARS를 시계열로 확장:
구조적 VAR 모델:
$$X_t = \mathbf{W}0 X_t + \sum{\tau=1}^{p} \mathbf{W}\tau X{t-\tau} + \epsilon_t$$
- $\mathbf{W}_0$: 동시점(intra-slice) 인과 관계
- $\mathbf{W}_\tau$: 시차(inter-slice) 인과 관계
비순환성 제약은 $\mathbf{W}_0$에만 적용 (시차 관계는 자연스럽게 비순환).
8.3.3 NTS-NOTEARS: 비선형 시계열
NTS-NOTEARS는 NOTEARS의 비선형 + 비정상 확장:
- 신경망 기반 비선형 관계 모델링
- 시간에 따라 변하는 인과 구조 허용
- 금융 데이터의 비선형성과 비정상성에 더 적합
8.4 금융 시계열을 위한 인과 발견
8.4.1 CD-NOTS: 비정상 금융 시계열의 인과 발견
Sadeghi, Gopal & Fesanghary (2024)의 CD-NOTS는 금융 데이터에 특화된 인과 발견 알고리즘:
CD-NOTS (Causal Discovery for Non-Stationary Time Series). CD-NOD (비정상 데이터 인과 발견) 알고리즘을 시계열의 시차 의존성에 맞게 확장.
금융 데이터 특성에 대한 대응:
| 금융 데이터 특성 | PCMCI의 한계 | CD-NOTS의 대응 |
|---|---|---|
| 비정상성 (분포 이동) | 정상성 가정 위반 | 분포 변화점 감지 + 적응 |
| 고차원 | 조건부 독립 테스트의 검정력 저하 | 효율적 조건 선택 |
| 비선형 의존성 | 선형 테스트의 한계 | 커널 기반 CI 테스트 (KCIT, RCoT) |
| 잠재 교란 | 인과 충분성 가정 위반 | 부분적 대응 |
실증 결과: CD-NOTS는 다양한 시뮬레이션 데이터셋에서 PCMCI를 일관되게 F-score로 상회. 정밀도(precision)에서 특히 우수하며, 이는 금융에서 거짓 인과 관계의 비용이 높은 맥락에서 중요.
8.4.2 CD-NOTS의 금융 적용 사례
사례 1: Fama-French 팩터와 개별 주식 수익률
CD-NOTS를 Fama-French 5팩터와 Apple 수익률에 적용하여, 어떤 팩터가 Apple 수익률의 인과적 동인인지 식별.
- 상관 분석: 모든 팩터와 유의한 상관
- CD-NOTS: 시장 팩터(MKT)와 수익성 팩터(RMW)만이 인과적 링크로 식별
- 나머지 팩터의 연관은 교란 경로를 통한 허위 상관
사례 2: 글로벌 매크로 인과 네트워크
다국가 실업률, CPI, PPI 간의 인과 관계를 CD-NOTS로 발견:
- 미국 CPI → 유럽 CPI의 시차 인과 관계 식별
- 일부 국가 간 연관은 공통 글로벌 요인(비관측 교란)에 의한 것으로 진단
사례 3: S&P 500 내 PBR과 주식 수익률
금융 기업의 PBR과 수익률 간 인과 관계:
- 비정상성을 무시하면 허위 인과 관계 다수 발견
- CD-NOTS는 비정상성을 고려하여 강건한 인과 관계만 식별
8.4.3 Granger Causality의 한계
전통적 Granger 인과성은 금융에서 여전히 광범위하게 사용되지만, 본질적 한계가 있다:
Granger Causality (1969): $X$가 $Y$의 Granger-cause라면, $X$의 과거 값이 $Y$의 예측에 유의하게 기여한다.
$$Y_t = \alpha + \sum_{i=1}^{p} \beta_i Y_{t-i} + \sum_{j=1}^{q} \gamma_j X_{t-j} + \epsilon_t$$
$H_0: \gamma_1 = \gamma_2 = \cdots = \gamma_q = 0$ 을 기각하면 "Granger 인과".
Granger 인과 ≠ 진정한 인과:
- 방향성 오류: $X \rightarrow Y$와 $Y \rightarrow X$ 중 어느 방향인지 시차 순서에만 의존 — 동시점 인과 불가
- 교란 무시: 비관측 $Z$가 $X$와 $Y$ 모두의 원인이면, $X$가 $Y$를 Granger-cause하지만 진정한 인과는 아님
- 선형성 가정: 표준 Granger는 선형 관계만 탐지
- 정상성 가정: 비정상 시계열에서 허위 Granger 인과 빈발
López de Prado (2023)의 지적: "Granger 인과는 불행한 오명(unfortunate misnomer)이다. 경제학자들이 인과(causation)를 말할 때 연관(association)을 의미하고, 연관을 말할 때 인과를 의미하는 혼란의 대표적 사례."
8.5 관측 + 실험 데이터의 결합
8.5.1 CRL Task 5의 고유한 특성
Task 5가 다른 인과 발견 문헌과 구별되는 점은, 관측($\mathcal{L}_1$)과 실험($\mathcal{L}_2$) 데이터를 체계적으로 결합하여 인과 구조를 학습한다는 것이다.
순수 관측 데이터만으로는 마르코프 동치 클래스까지만 식별 가능 (방향 불확정). 실험 데이터(개입)가 추가되면 방향 식별이 가능해진다.
8.5.2 금융에서의 "실험"
금융에서 통제된 무작위 실험은 거의 불가능하지만, 준실험(quasi-experiment)과 자연 실험(natural experiment)이 존재한다:
| 준실험/자연실험 | 개입 변수 | 인과 발견에의 기여 |
|---|---|---|
| 중앙은행 금리 변경 | 금리 | 금리→자산가격 방향 확인 |
| 지수 편입/편출 | 수요 충격 | 수요→가격 방향 확인 |
| 규제 변화 (공매도 금지 등) | 시장 구조 | 규제→유동성/변동성 방향 확인 |
| 예상치 못한 지정학적 이벤트 | 외생 충격 | 충격 전파 경로 식별 |
| COVID-19 봉쇄 | 경제 활동 | 매크로→금융 전파 경로 식별 |
이러한 자연 실험은 관측 데이터로부터 식별할 수 없었던 간선 방향을 확정하는 데 활용된다.
8.5.3 Budgeted Experiment Design
Ghassami, Salehkaleybar, Kiyavash & Bareinboim (2018, ICML)은 예산 제약 하의 실험 설계를 연구:
문제: 인과 구조를 최대한 많이 식별하기 위해, 제한된 예산으로 어떤 변수에 어떤 순서로 개입해야 하는가?
금융 적용: 제한된 실험 예산(페이퍼 트레이딩, A/B 테스트)으로 최대한 많은 인과 관계를 확인하기 위한 최적 실험 설계.
8.6 인과 지식 그래프 (Financial Causal Knowledge Graph)
8.6.1 전문 지식 기반 인과 구조
데이터 기반 인과 발견의 보완으로, 도메인 전문 지식을 인과 그래프에 통합하는 접근:
FinCaKG (Financial Causal Knowledge Graph, Xu et al., 2024): 금융 전문 지식에서 인과 개념을 추출하고, 이를 기반으로 도구 변수를 식별하여 인과 추론의 신뢰성을 높이는 프레임워크.
프로세스:
- 금융 텍스트(보고서, 논문, 뉴스)에서 인과 관계 추출
- 인과 지식 그래프로 구조화
- 그래프에서 도구 변수(IV) 후보 식별
- 2SLS 등으로 인과 효과 추정
8.6.2 하이브리드 접근: 전문 지식 + 데이터
최적의 인과 발견은 전문 지식과 데이터의 결합이다:
Step 1: 도메인 전문가가 인과 그래프의 초안(prior DAG) 구성
- 확실한 인과 관계: 금리 → 채권 가격 (방향 확정)
- 불확실한 관계: 심리 → 주가? 또는 주가 → 심리? (방향 미확정)
- 불가능한 관계: 주가 $\not\rightarrow$ 금리 (대형 기관의 경우 무시 가능)
Step 2: 데이터 기반 알고리즘으로 불확실한 관계를 검증/발견
- PCMCI+로 시차 인과 관계 발견
- CD-NOTS로 비정상 시계열의 인과 관계 발견
- 전문가 DAG의 제약을 사전 지식(prior)으로 활용
Step 3: 자연 실험으로 방향 확정
- 금리 변경 이벤트로 금리→자산가격 경로 검증
- 지수 편입으로 수요→가격 경로 검증
8.7 인과 발견의 실무적 도전
8.7.1 금융 데이터의 특수성
| 도전 | 설명 | 대응 전략 |
|---|---|---|
| 비정상성 | 분포, 인과 구조 모두 시간에 따라 변화 | CD-NOTS, 윈도우 기반 분석, 변화점 감지 |
| 고빈도 데이터 | 틱/분 단위의 대량 데이터 | 시간 해상도 선택, 집계(aggregation) |
| 비선형성 | 레짐 의존적 비선형 관계 | 커널 CI 테스트, 신경망 기반 점수 |
| 잠재 교란 | 시장 심리, 내부 정보 등 비관측 | LPCMCI, FCI, proxy 변수 활용 |
| 동시성 | 고빈도에서 시차 0의 인과 관계 | PCMCI+, 동시점 방향화 규칙 |
| 피드백 루프 | 가격↔거래량 등 순환 관계 | 시간 인덱싱, 순환 SCM 확장 |
| 다중 검정 | 수십~수백 변수 쌍의 동시 테스트 | FDR 제어 (Benjamini-Hochberg) |
8.7.2 인과 그래프의 검증
학습된 인과 그래프의 검증(validation)은 필수적이다:
- 도메인 전문가 검토: 발견된 인과 관계가 경제적으로 타당한가?
- 자연 실험 기반 검증: 외생적 충격에 대한 반응이 인과 그래프의 예측과 일치하는가?
- Out-of-sample 예측: 인과 그래프 기반 예측이 비인과적 모델보다 OOS에서 우수한가?
- 안정성 검사: 다른 시간 구간, 다른 하이퍼파라미터에서도 핵심 인과 관계가 유지되는가?
- 개입 일관성: 인과 그래프가 예측하는 개입 효과가 실제 정책 변경의 결과와 일치하는가?
8.8 실습: PCMCI+를 이용한 글로벌 자산 간 인과 구조 학습
8.8.1 실습 개요
목표: 주요 글로벌 자산 클래스(미국 주식, 미국 국채, 금, 원유, 달러 인덱스) 간의 시차 인과 구조를 PCMCI+로 발견.
8.8.2 Python 구현
import numpy as np
import tigramite
from tigramite import data_processing as pp
from tigramite.pcmci import PCMCI
from tigramite.independence_tests.parcorr import ParCorr
# 데이터 준비
# 변수: SPX(미국주식), UST(미국국채), GOLD(금), OIL(원유), DXY(달러)
var_names = ['SPX', 'UST', 'GOLD', 'OIL', 'DXY']
data = load_asset_returns(var_names, start='2010-01-01', end='2024-12-31')
# Tigramite 데이터 프레임 생성
dataframe = pp.DataFrame(
data=data.values,
var_names=var_names,
datatime=data.index
)
# 조건부 독립 테스트 선택
parcorr = ParCorr(significance='analytic') # 선형 관계용
# 비선형: CMIknn, GPDC 등도 가능
# PCMCI+ 실행
pcmci = PCMCI(
dataframe=dataframe,
cond_ind_test=parcorr,
verbosity=1
)
results = pcmci.run_pcmciplus(
tau_min=0, # 동시점 관계 포함
tau_max=5, # 최대 5일 시차
pc_alpha=0.05 # 유의 수준
)
# 결과 시각화
tp.plot_graph(
val_matrix=results['val_matrix'],
graph=results['graph'],
var_names=var_names,
link_colorbar_label='MCI',
node_colorbar_label='auto-MCI',
figsize=(10, 6)
)
# 시차별 인과 관계 출력
for j, target in enumerate(var_names):
parents = pcmci.return_significant_links(
pq_matrix=results['p_matrix'],
val_matrix=results['val_matrix'],
alpha_level=0.01
)
if parents[j]:
print(f"\n{target}의 인과적 부모:")
for (i, tau), val in parents[j].items():
print(f" {var_names[i]} (t-{tau}): MCI = {val:.3f}")
8.8.3 기대 결과 및 해석
예상되는 주요 인과 관계:
| 원인 → 결과 | 시차 | 경제적 해석 |
|---|---|---|
| DXY → OIL | 1-2일 | 달러 강세 → 원유 가격 하락 (달러 표시) |
| OIL → SPX | 1-3일 | 에너지 가격 충격 → 주식 시장 영향 |
| UST → SPX | 0-1일 | 금리 변동 → 주가 할인율 변화 |
| SPX → GOLD | 0일 | 위험자산 회피 → 안전자산 수요 |
| DXY → GOLD | 0-1일 | 달러 강세 → 금 가격 하락 |
교란 경로 식별 사례:
- SPX와 GOLD의 음의 상관이 단순 관측에서 관찰되지만, DXY를 조건화하면 사라질 수 있음 → DXY가 교란변수
- 이러한 교란 경로의 식별은 포트폴리오 분산투자 전략에 직접적 함의
핵심 요약 (Key Takeaways)
- 인과 발견(Causal Discovery)은 CRL의 기초 인프라다 — 인과 그래프 없이는 후속 Task(개입, 전이, 반사실)가 작동하지 않는다.
- 세 가지 패러다임 (Constraint-based, Score-based, FCM-based) 각각의 장단점이 있으며, 금융 데이터의 특성(비정상, 비선형, 잠재 교란)에 따라 선택해야 한다.
- PCMCI/PCMCI+는 시계열 인과 발견의 현행 표준이지만, 정상성과 인과 충분성을 가정한다. LPCMCI가 잠재 교란을 허용하고, CD-NOTS가 비정상성에 대응한다.
- NOTEARS/DYNOTEARS는 연속 최적화로 대규모 인과 발견을 가능하게 하지만, 선형성 가정에 주의.
- Granger 인과 ≠ 진정한 인과: 교란, 동시성, 비선형성을 처리하지 못하는 근본적 한계.
- 하이브리드 접근(전문 지식 + 데이터 + 자연 실험)이 실무적으로 가장 강건한 인과 그래프를 생성한다.
- 인과 그래프의 검증이 필수적: 도메인 전문가 검토, 자연 실험 기반 확인, OOS 예측, 안정성 검사.
더 읽을거리
- Runge, J. et al. (2019). Detecting and Quantifying Causal Associations in Large Nonlinear Time Series Datasets. Science Advances. — PCMCI의 원논문.
- Gerhardus, A. & Runge, J. (2020). High-Recall Causal Discovery for Autocorrelated Time Series with Latent Confounders. NeurIPS. — LPCMCI.
- Sadeghi, A., Gopal, A. & Fesanghary, M. (2024). Causal Discovery in Financial Markets: A Framework for Nonstationary Time-Series Data. — CD-NOTS와 금융 적용.
- Zheng, X. et al. (2018). DAGs with NO TEARS: Continuous Optimization for Structure Learning. NeurIPS. — NOTEARS 원논문.
- Pamfil, R. et al. (2020). DYNOTEARS: Structure Learning from Time-Series Data. AISTATS. — 시계열 NOTEARS.
- Ghassami, A. et al. (2018). Budgeted Experiment Design for Causal Structure Learning. ICML. — 예산 제약 하 실험 설계.
- Spirtes, P., Glymour, C. & Scheines, R. (2000). Causation, Prediction, and Search. MIT Press. — 인과 발견의 고전적 교과서.
'금융연구 > 인과강화학습' 카테고리의 다른 글
| Chapter 10. Task 7 — Causal Curriculum Learning: 수정된 환경에서의 학습 (0) | 2026.04.01 |
|---|---|
| Chapter 9. Task 6 — Causal Imitation Learning: 보상 비관측 하의 정책 학습 (0) | 2026.04.01 |
| Chapter 7. Task 4 — Generalizability & Robustness: 전이가능성과 구조적 불변성 (0) | 2026.04.01 |
| Chapter 6. Task 3 — Counterfactual Decision-Making: 반사실적 의사결정 (0) | 2026.04.01 |
| Chapter 5. Task 2 — When and Where to Intervene: 정책 공간 정제 (1) | 2026.04.01 |