고수들의 계량경제학 2

[인과추론] 매칭 (feat. PSM)

시작하며 새로운 프로덕트 런칭 등의 효과를 분석하는 일에는 A/B 테스팅과 같은 실험 방법론이 효과적이지만 윤리적인 문제나 기간적인 문제 또는 리소스 부족 등의 문제로 인해 도입하기 어려운 상황이 발생합니다. 이러한 상황에서 PSM (성향점수 매칭)), 이중차분, 회귀단절, 도구변수 등의 인과추론 방법론들을 고려해볼 수 있는데요, 이번 포스팅에서는 PSM 에 대해서 다루어보도록 하겠습니다. PSM 은 성향점수 매칭 방법은 유저(또는 일반적으로 관측치)가 정책(프로덕트 런칭 등)의 treatment 그룹에 속할 확률을 기반으로 treatment 그룹과 control 그룹을 나누는 방법입니다. 예를 들어, 새로운 음악 추천 서비스의 음악 소비에 대한 효과를 추정하고 싶다고 한다면, 새로운 음악을 들을 확률이..

인과추론 2022.05.17

[인과추론] Randomization

첫번째 주제인 "Randomization" 입니다. 정책을 받는 집단과 그렇지 않은 집단을 임의로 나누어야 하는 이유에 대한 설명입니다. 흔히, "인과관계와 상관관계가 다르다"는 구절에서, 상관관계가 "문제"가 있는 이유 (상관관계를 통해서 특정 정책의 효과를 추론할 수 없는 이유)는 두 집단 사이의 특징이 애초에 다르기 때문입니다. 가상의 예시를 통해서 우리가 알고 싶은 효과와 두 집단 사이의 내재된 차이를 수식적으로 구분해보도록 해보겠습니다. 아래 사례는 "고수들의 계량경제학 (Mastering Metrics)" 의 예시의 구조를 한국적으로 각색했습니다 (미국 의료 보험 수급 여부 대신 고등학교 1학년의 영어 과외로 바꿔보았습니다). 영어 과외가 (고등학교 1학년) 학생들의 성적에 미치는 영향을 알고..

인과추론 2022.04.26