인과추론

Difference-in-differences instrumental variable

W[더블유] 2023. 4. 30. 11:15

 

"인과추론 관련 (나의) 글 링크 모음" 에서 인과추론에 관한 다양한 토픽을 접하실 수 있습니다. 

 

Instrumental Variable 설명

 

할인률이 결제액에 미치는 영향을 구하고 싶다고 가정합시다. 할인률 선택은 사람들의 특성에 따라서 다를 수 있습니다. 예를 들어서, 가격이 낮을 수록 소득이 낮은 학생은 수요량이 증가할 수 있으나 소득이 높은 직장인의 경우에는 가격에 크게 반응하지 않을 수 있습니다. 이러한 상황에서 할인률에 따라서 결제액에 미치는 영향을 구한다고 하면, 통제되지 않은 변수들이 인과추론에 영향을 줄 수 있습니다. 

 

그렇다면, 어떻게 하면, 인과적인 추론이 가능할까요? 할인률 적용 프로그램과 관련된 안내 푸쉬 메세지를 앱 내에서 유저에게 랜덤으로 보낸다고 가정합시다. 안내를 받은 유저들은 할인률이 적용된 프로그램을 신청할 확률이 더 높을 것입니다. 

 

Difference-in-difference Instrumental Variable 설명

 

논문 (제 다른 포스팅, 정책의 점진적인 도입 효과를 추론하고 싶다면? (two-way fixed effects model) 을 참고해주세요) 에서는 AB 테스팅의 도입이 개별 기업의 퍼포먼스에 미치는 영향을 구하고자 합니다. 이 때, AB 테스팅 도입에는 영향을 주지만 개별 기업의 퍼포먼스와는 관련이 적은 변수가 필요합니다. 해당 논문에서는 GTM 을 기존에 설치한 기업들은 구글 옵티마이즈를 선택하는 비율이 커진다는 사실을 이용합니다. GTM 을 기존에 설치한 기업과 그렇지 않은 기업 사이에 사전에 parallel 트렌드 가정을 확인한 후에, 2017년에 구글에서 구글 옵티마이즈 도입 이후에 이 두 기업 그룹 사이에 퍼포먼스 변화를 측정합니다. 이 때 다음과 같이 두 단계로 회귀식을 돌립니다. 

 

(1단계) GTM 기존 설치 여부 -> 구글 옵티마이즈 설치 여부

- 회귀식에서 예측된 구글 옵티마이즈 설치 확률

(2단계) (예측된) 구글 옵티마이즈 설치 여부 -> 결제액 (기업 퍼포먼스)

 

Z: GTM 기존 설치여부

X: 구글 옵티마이즈 설치 여부

Y: 결제액 

 

Z -> X -> Y

기존에 X -> Y 의 관계에서, 관측되지 않은 내생적인 변인들이 존재했는데, Z->X 의 외생적인 관계를 이용해서 (즉 Z 를 통해서 예측된 X 를 통해서) \hat{X} (Z 에 의해서 예측된 X) 이 Y 에 미치는 영향을 분석합니다. 

 

다음 포스팅에서는 수식과 코드를 이용해서 좀 더 구체적으로 설명을 하도록 하겠습니다.