데이터 과학 커리어 (feat. 경제학)

블로그를 하는 이유 (feat. 인과관계 추론과 경제학)

W[더블유] 2022. 2. 17. 23:22

 

인터넷에서 정보를 항상 많이 찾는다. 검색하다 내가 원하던 정보를 얻게 되면, 유레카를 외치면서, 그 포스팅을 작성해준 사람에게 절까지는 아니더라도 감사한 마음을 가지게 된다. 항상 내가 이걸 포스팅할 만큼 실력이 되는 걸까, 사람들이 좋아할까 고민이 많지만, 그래도 내가 이 분야에 관심이 많고 나름 경제학 박사 중에서 이야기할 내용들이 많은 사람이라 생각되고, 또 다음 사람에게 도움이 될 정보를 갖고 있다고 생각되고, (말이 많다 역시 난 ㅋㅋㅋ) 내가 여태껏 찾아보고 아는 내용을 정리하는 관점에서 블로그를 시작해본다.

 

티스토리를 통해서 적어보고 싶은 내용은 인과 관계 추론경제학 관련 테크 기업의 소식들과 인과 관계 추론 기법과 관련된 기초적인 내용들을 한글로 정리해보고 싶다. 궁극적인 목표는 초등학교 수학 과정부터 "대체로 해롭지 않은 경제학"의 인과관계 모형들에 대한 이해까지 가는 것인데, 일단 고등학교 수학 과정부터 시작하는 것으로 해야 겠다. 

 

인과관계 추론(Causal Inference) 은 응용미시경제학 (Applied Microecomics) 에서 다루는 내용들 중 데이터 과학과 근접하다. 최근의 응용미시경제학 논문들은 통계분석 방법론 중 이 방법을 자주 사용한다. 데이터 과학의 A/B 테스팅은 인과관계 추론 중 실험적 방법론 (experiment) 에 가까운데, 인과관계 추론은 실험을 하기 어려운 상황에서 실험에 근접한 상황을 최대한 만들어내는 통계학적인 툴도 있다.

 

이 분야의 유명한 책으로는 "대체로 해롭지 않은 계량 경제학" (Mostly Harmless Econometrics) 을 들 수 있다. 인과관계 추론의 주요 토픽인 이중차분(Difference-in-difference), 도구변수(Instrument variable), 회귀단절 (Regression Discontinuity Design) 이 소개되어 있다. 

 

경제학자들의 인과관계 추론 기법 능력을 맛본(?!) 회사들은 경제학자들 채용을 좋아하는 것 같다. 대표적인 예로, 아마존을 들 수 있다. 특히 회사가 성장하는 과정에서 초반에 경제학자들과 교류가 있었던 회사들이 그러한 경향이 큰 것 같다. 

 

+

 

티스토리의 읽다가 오 좋다고 생각했던 점이 LaTeX 기능이다. 수식을 사용할 수 있으니 정말 편리하겠다 싶다. 회귀방정식 작성할 때 바로 작성할 수 있어서이다. 기념으로 인과관계 추론 방법론 중에서 하나 적어봐야지 ㅎㅎ 정답을 아시는 분들은 댓글을 남겨주세요 라고 퀴즈를 내어야 할 것 같다 ㅋㅋㅋ 

 

$y_{it} = \beta_0 + \beta_1 Treat_{i} + \beta_2 Post_{t} + \beta_3 Treat_{i} \times Post_{t} + \Phi X_{it} + \varepsilon_{it}$

 

유학 관련 이야기나 데이터 과학 관련, 생활 관련 이것저것도 적어봐야겠다.