데이터 과학 커리어 (feat. 경제학)

취직 방향 (미국 경제학 박사)

마빈 Marvin 2022. 10. 4. 18:43

 

미국의 테크 회사에 데이터 관련 포지션에 취업하고 싶으나 어떠한 방식이 효율적이고, 내가 원하는 방식인가에 대해서는 고민중이다.  

 

Photo by Markus Winkler on Unsplash

 

 

인더스트리 취업의 관점에서도 박사 과정에서 하던 연구들을 완전히 버리는 것은 어렵다. 회사 입장에서 경제학 박사를 우대할 이유는 그 사람이 경제학적인 내용을 배웠기 때문이다. 그나마 인과추론(Causal Inference)은 계량경제학에서 워낙 많이 다루는 내용이라 아마존 Economist 외에도 필요로하는 경우가 있으나, AB 테스팅을 원하는 것 같다. 근데 AB 테스팅을 하기 위해서는 회사에 들어오는 방법 이외에는 개발경제학 전공에서 field experiment 를 하거나 간단한 field experiment (discrimination 쪽에서는 종종 하는 것을 봤다) 를 하는 것이 대다수일듯 한데, 박사 연구로 하기에는 기회가 많지는 않은 것 같다. 데이터 과학 중에서 머신러닝 분야는 경제학에서 특히 응용미시 분야가 비교우위가 있는 분야는 아닌 것 같다.

 

그래서 일단은 네트워크와 관련된 나의 잡마켓 논문을 수정하면서 링크딘이나 메타 쪽 사람들과의 접점을 찾아볼 생각이다. 테크의 리서치 사이언티스트 보다는 프로덕트 분야가 관심이 있긴 한데, 최근에 발표된 논문들을 보면 좀 생각보다 리서치 쪽도 재밌기도 하고, 회사가 돈이 되지 않는 연구는 하지 않을테니 프로덕트 관련에 대한 걱정은 적게 해도 되지 않을까 생각도 들긴 한다 (그리고 프로덕트 분석가 포지션은 외국인 박사생을 수요로 하지는 않는 것 같다...학부 + 인더스트리 경험...). 최근 8월과 9월에 개제된 논문들도 흥미롭기도 하고, 내 3년차 & 잡마켓 페이퍼와 관련이 있다. 

 

"A Causal Test of the Strength of Weak Ties" (2022, Sept. Science)

링크딘에서 약한 연대 (weak tie) 가 강한 연대 (strong tie) 에 비해 고용 등에 더 효과적이다는 점을 실험을 통해서 인과적으로 밝힌 논문이다. 약한 연대 (weak tie, 약한 연대) 와 강한 연대 (strong tie, 강한 연대)의 차이는 강한 연대는 서로 알고 있는 사람들이 많으나 약한 연대는 그에 비해 서로 알고 있는 사람이 적은 경우이다. 

 

"Social capital I: measurement and associations with economic mobility" (2022, Aug. Nature)

"Social capital II: determinants of economic connectedness" (2022, Aug. Nature) 

메타에서 하버드의 Opportunity Insight 팀과 함께 미국의 사회적 계층 이동에 고등학교 때의 사회적 자본과의 관련성을 보인 논문이다. 첫번째 논문에서는 부모님의 소득 수준이 낮은 학생의 경우 고등학교 때 부모님의 소득 수준이 높은 학생과 페이스북에 연결되어 있을 경우에 그렇지 않은 경우에 비해 성인이 되었을 때 소득 수준이 더 높았다고 한다. 그리고 두번째 논문에서는 소득 수준이 다른 학생들 간의 연결은 서로 다른 계층에 대한 노출 정도 뿐만 아니라 유사한 성향의 사람들끼리 모이는 성향에 의해서 약 절반씩 설명된다고 한다. 두번째 논문은 조금 더 empirical specification 을 자세히 읽어봐야 하긴 하는데, 두 번째 논문 내 잡마켓 논문이랑 관련이 있긴 하다. Opportunity Insight 팀에서 포닥 포지션이 있긴 해서 지원 해도 괜찮겠다 싶다. 

 

내가 궁극적으로 하고 싶은 일은 "교육 불평등을 해소할 플랫폼"을 만드는 것이다. 사람들이 "보다 낮은 가격"으로 교육받을 플랫폼을 제작하는데, 매칭이나 네트워크적인 개념을 기술적으로 이해야할 것 같긴 하다. 많은 테크회사에서 Operation Research 의 기술을 적용하는 것처럼 사람들을 매칭하는 플랫폼에서는 사람의 행동 패턴에 대한 구조적인 이해가 필요한데, 경제학이 그러한 시스템에 대한 내용들이긴 하다. 인센티브 같은 정책을 시행했을 때, 사람들의 네트워크 구조가 어떻게 변화하고, 그로 인해서 그 사람들의 결과값 (생산성, 임금, 플랫폼에서의 리텐션)을 보는 방향의 연구를 최근에 사람들이 하기 시작한 것 같다. 네트워크에서 이론 모델은 많은데 실증 분석하는 건 최근 일이라... (하버드에 최근 임용된 계량경제 이론하는 사람의 경우에는 네트워크에서 간섭이 있을 때 정책을 디자인하는 논문이 잡마켓 페이퍼이다.)

 

위에 작성한 내용들이 내 연구 관련해서, 내 목표와 관련해서 가장 이상적이긴 하다. 

 

NABE 테크 컨퍼런스에 참석을 할 때, 관련 업종의 사람들에게 연락을 해봐야겠다. 링크딘과 메타에는 연락해봐도 괜찮을듯한 사람들이 있다. 그 외 Zillow 도 Experimentation 관련 포지션에 관심이 있어서 현장에서 정보나 사람들을 더 알 수 있을까 기대가 된다. 여기도 사전에 연락해볼 사람을 찾아봐야겠다. Convoy 도 알아보니 Uber 와 유사한 Freight (화물) 업종이라서 흥미롭다.

 

NABE 의 Job Fair 에 우버는 없어서 여기는 따로 더 찾아봐야겠다. Causal ML 관련 블로깅을 하면서 컨텍할 꺼리를 만들어야겠다. 

 

미디엄 블로그를 시작했다. 일단 첫글에 내가 쓰고 싶은 글의 방향을 적고 잠들었는데 (미국시간 10월 7일) 다음 날에 새벽에 일어나서 보니 반응이 와있어서 놀랐다. 

 

AWS S3 버킷에 2019년과 2020년 시카고 택시 데이터 (각각 약 20GB 와 12GB)를 담고, 이를 Glue 를 통해서 Athena 로 크롤링한 다음에 일부 데이터를 SQL 로 풀링해서 CSV 파일로 저장을 해보았다. 구글 Colab 에서 Python (주피터 노트북)으로 EDA 부터 해봐야겠다. Resume 에 적었던 라이브러리 관련 내용들은 이 프로젝트로 증명한다는 느낌이다. 

 

우버나 Zillow 의 "(preferred) qualification" 을 보면, 알고리즘 프로토타임을 개발한 경험을 원하는데, 자바스크립트 + 파이어베이스로 최대한 간단한 추천 시스템을 만들어보려고 기획중이다. 예전에 "스프린트 (by Jake Knapp)" 라는 책을 읽었는데, 5근무일 내에 프로토타입을 만들어내는 시스템에 대한 내용이 있어서 적용해보고자 한다. 물론, 팀으로 하는 내용이고 나의 서비스는 "추천" 관련 웹페이지를 만드는 거라서 조금 다르긴 하지만, 핵심 포인트 위주로 단기간에 효율적으로 일하는 과정에 대해 적용해볼 내용이 많이 있다. 이 책에 대한 내용은 또 간략히 다뤄봐야겠다. 

 

Zillow/Uber Job Description 중에서

Senior Applied Scientist, Experimentation (Zillow): "Experience prototyping, developing, and implementing algorithmic solutions and new technologies with billions of rows of daily data."

Senior Applied Scientist - Uber Freight: "Experience in algorithm development and prototyping" (Preferred Qualification 중에서) 

 

잡서치... 구직자분들 모두 화이팅 하시길!