데이터 과학 커리어 (feat. 경제학)

미국 테크 회사 경제학/데이터 과학 인턴 지원 현황 그리고 앞으로 계획

W[더블유] 2022. 3. 26. 10:22

 

인턴 지원 현황 요약: 18군데 지원

 

미국에서 경제학 박사를 하면서 테크 회사 인턴에 지원 중이다. 현재는 4년차 2학기 (봄학기)인데, 1월 중순부터 시작해서 현재 3월 중순까지 링크딘에 나오는 회사를 중심으로 지원하고 있다. 지원한 회사는 아마존, Wayfair, Salesforce (슬랙), 메타 (예전 페북), 구글, 로쿠 (Rokou), 링크딘, 리프트, 마이크로소프트, Coursera 가 있다. 이 중에 매우 생소할만한 회사는 Wayfair 와 로쿠 인데, Wayfair 는 온라인 가구 회사이고 로쿠는 온라인 스트리밍 회사이다. 둘 다 나스닥에 상장되어 있고, PhD 를 뽑는다. Wayfair 는 경제학 테크 관련 컨퍼런스에서 봤던 시니어 이코노미스트 분이 성격도 좋아보이고 똑똑해보여서 지원하게 되었다. 회사에서 경제학 박사를 따로 채용하므로 경제학이 아닌 지원자들과 차별화가 된다고 생각했었다.  

 

정리를 해보니 총 18 곳을 지원했다. 아마존 인턴을 했던 졸업생의 말로는 아마존은 4월이나 되어야 답신이 온다고 한다. 다른 회사들 중에 세일즈 포스 (슬랙)은 세 군데 지원했는데 가장 먼저 지원한 곳은 3주 만에 답장이 왔다. 다른 회사들은 1월에 지원한 회사도 있는데 감감 무소식이다. 만약 합격을 하게 된다면 OPT 지원을 해야하는데 이렇게 늦게 답신이 와도 괜찮은건가 싶기도 하다. 물론 보통 12주의 인턴 과정이니 6월 전까지 서류가 완료되면 되니까 4월에 면접을 해도 시간 상으로는 가능할 것 같기도 하다. 

 

Wayfair 는 결과적으로 불합격했는데, Hive 와 같은 데이터 베이스 언어를 더 아는 것이 인턴 확률을 높일 것 같다. 물론 Wayfair 는 보스톤에 있는 회사이고 동부에 있는 MIT/Boston College, Boston University, Harvard 의 학생들 중에서 테크는 가고 싶은데 동부에 살고 싶은 사람들이 많이 지원했을 것 같다. 근거는 그 시니어 이코노미스트 분이 현재 있는 회사에 간 이유가 그렇다고 해서이다. 여기 불합격한 이후에 재지원이 가능했지만 재지원하지 않았다.  회사에 지원한 후에 한 번 온라인 웹사이트로 책상을 구매했는데, UI (User Interface) 가 별로였다. 그리고 구매 과정에서 기부를 할 지를 선택하라고 물어봐서 굳이 필요한 기능일까 의문이 들었다. 

 

로쿠 (Rokou) 는 스트리밍 서비스인데, 리서치 데이터 사이언티스트는 PhD 가 기본 조건이어서 해볼만하지 않을까 생각을 했다. 탄뎀으로 스페인 친구랑 이야기하다는데 로쿠 엄청 좋다고 하길래 프로덕트가 좋은 회사라고 생각되었다. 

 

메타는 CDS (Core Data Science) 대부분의 팀을 지원을 했는데 모두 답장이 없다. Economics & Computation 팀은 네트워크 보다는 최적화(optimization)나 광고 가격 책정에 필요한 경매(auction) 전문가를 선호해 보였다. 나는 네트워크 관련 공부를 하고 학위 논문도 간접적으로 관련이 있지만 네트워크 구조를 직접적으로 사용하지는 않아서 엣지가 있다고 보기 어렵지 않을까 싶다. 이번에 UCSD 졸업생 중에서 네트워크로 엄청 좋은 논문을 많이 만들어낸 졸업생이 있던데, 그 분은 CDS 에 인턴을 하면서 네트워크 구조에서 실험을 하는 설계를 직접 했다. 계량 경제학 이론을 직접적으로 해야 CDS 에 도움이 되지 않을까 싶기도 하다. 

 

Coursera 는 에듀테크 분야라서 내가 가장 관심이 있는 분야이지만, PhD 가 필요조건이 아니라 지원자가 매우 많다... "untapped" (링크딘과 유사) 라는 웹사이트를 통해서 지원하라고 하는데, 지원서가 900개나 있다고 나온다... (우버와 비슷한) 리프트라는 회사도 링크딘에 지원자 숫자를 보면 1900명인가 된다... 

 

(+ 우버 인턴은 지원을 못했는데, 이유가 (1) 링크딘에 추천이 안 나와서이고 (2) 경제학자를 "Applied Scientist" 로 채용하는 걸 나중에 알게 되어서이다...)

 

** 지원 현황 엑셀 정리 (회사명/합불여부/직업/최소요건/선호요건):

https://docs.google.com/spreadsheets/d/1u1boj14Weg9YXNmqAVFSh8eMRi0pfY4m/edit?usp=sharing&ouid=110110440007109438226&rtpof=true&sd=true

 

엑셀로 정리한 위의 지원 현황을 살펴보면, Python (or R) 과 SQL기본적으로 필요한 스킬셋이다. 그리고, 하둡 (Hadoop), 하이브 (Hive), 스파크, 실험 방법론 (experimental design) 또는 A/B 테스팅 스킬이 있으면 서류 통과에 도움이 되지 않을까 싶다.

 

인턴을 지원하는 과정에서 얻은 가장 큰 수확은 마인드셋의 변화이다. 박사과정은 연구에 좀 더 집중되어 있는데, 인턴을 지원하면서 회사에서 원하는 스킬셋이나 데이터 과학자로서 회사가 원하는 방향에 대해서 회사의 입장에서 고민해보게 된다. 그리고 "프로덕트" 를 분석하는 것과 회사와 관련된 "리서치"를 하는 것의 차이에 대해서 좀 더 이해하게 되는 것 같다. 아마존이나 Wayfair 처럼 경제학자가 인과관계 추론을 직접 하기 위해 경제학자를 채용하기도 하지만, 우버처럼 가격 책정팀 이외에 earnings policy 처럼 사회적인 이슈에 대응하기 위해 경제학 박사를 채용하기도 한다는 것을 배웠다. 나는 프로덕트에 인과관계 추론을 적용하는 것이 재밌긴 한데, 지금은 경험을 쌓는 것이 중요하기 때문에 불러주면 일단 어디든 갈 예정이다... 

 

앞으로의 계획: MVP (Minium Value Product) 만들기 

 

그래서 앞으로 준비를 어떻게 할 것이냐면 내가 직접 웹에서 MVP (Minimum Value Product) 를 만들어서 사람들이 사용하도록 만들고 직접 A/B 테스팅해서 분석하고 회사들이 원하는 스킬들을 직접 적용해볼 예정이다. 물론 인턴이 되면 인턴에 좀 더 집중을 하겠으나 아니라면 나의 "MVP Project" 를 방학동안에 해봐야겠다. 현재는 파이어베이스와 HTML/CSS/JavaScript 이용해서 당근마켓 클로닝하는 강의를 듣고 직접 웹 호스팅하는 과정까지 해보았다. 하다보니 프론트엔드 스킬이 부족하고, 특히 JavaScript 스킬이 필요해서 전과정을 결재했다. HTML/CSS/JavaScript 의 기보적인 프론트엔드를 먼저 배우고, 리액트 배우고 (리액트 배우면 리액트 네이티브도 비슷하다고 하니 어플도 만들고 싶으면 가능해질듯), NodeJS 까지 배우면 되지 않을까 싶다. Django 도 배우는 게 더 필요할 지는 그 때가서 생각해봐야겠다. 추천 알고리즘을 A/B 테스팅하려면 백엔드를 얼만큼 알아야하는지 아직 모르는데, 일단 최근에 구매한 것들부터 공부하고 나서 생각해봐야겠다. 그리고, 데이터 베이스 프로그래밍 언어는 SQL 인데 Coursera 에서 MySQL 관련 자격증을 따기 위해서 이것저것 해봐서 대충 흐름은 알고 있다. 더 쉬운 유튜브 영상을 보면서 다시 복습 중이다. 

 

나의 MVP 를 만들고 싶은 사람들에게 추천하는 영상이나 강의에 대한 내용들을 추후에 적어봐야겠다 (광고 x 내돈내산). 프론트엔드/백엔드 코딩, 유튜브를 통한 퍼스널 브랜딩 관련 내용이 MVP 만들어서 내 제품을 필요로하는 고객들까지 다가가는데 필요한 내용이 아닐까 생각이 든다. 

 

데이터 과학자에 필요한 포트폴리오를 위한 일에 더 집중하라고 조언을 할 수도 있지만, 일단 내 생각에 numpy, scikit-learn, pytorch, tensorflow, keras, nltk 를 다루는 것은 하루면 쭉 해볼 수 있다... 문제는 '프로덕트'를 이해하는데 이 테크닉들을 어떻게 활용할 것인가 인 것 같다. 이것보다 더 근본적인 문제는 이미 존재하는 데이터로는 실험(A/B 테스팅)을 할 수 없다는 것이다... 그룹을 어떻게 나누고, 데이터베이스에서 가져오고, 추천(recommendation) 과 같은 머신 러닝 테크닝을 어떻게 적용하고 등의 과정은 본인이 직접 프로덕트를 가지고 해보지 않으면 해볼 수 없는 것 같다. 

 

구글링해보면, 데이터 과학자를 위해서 A/B 테스팅을 해주는 사이트가 있어보이는 것 같기는 한데 그걸로 내 스킬셋을 모두 온전히 보여줄 수 있을까는 의문이다. 구글 애닐리틱스는 구글이 대신 해주는 것 같고, 내가 직접 알고리즘을 짜서 적용하는 데는 한계가 있다고 이해한다. 물론 내가 아직 모르는 기능들이 있을 수도 있다.

 

여하튼, 나는 내가 언젠가 나의 Minimum Value Product 를 만들 것을 알기에... 지금 이 기회에 코딩을 배우는 것도 좋은 기회라고 생각한다. 경제학 박사 과정 중에 문제를 정의하고 사람들에게 그것을 설명하는 프레젠테이션/라이팅 트레이닝을 많이 배우고 있는 것 같다. 하지만,나는 이해를 넘어서 실제 행동하고 싶어하는 것 같다...(갤럽 5가지 강점 해봤는데 그 중에 행동Activator 가 강점이다 ). 그리고 Social Engineer 의 스피릿이 있다... 내가 풀고 싶은 문제들에 대한 이야기블로그에 또 적어봐야겠다. 

 

오늘의 에필로그는 나의 다짐 (꾸준히 해야할 일!)

   - 주 80시간 (연구+TA+행정+운동+책읽기+코딩 등의 생산적인 있는 일)

   - 운동 (수영, 헬스, 유산소)

   - 책 읽기