머신 러닝 24

[데이터과학 코세라 강의] (1주차) 데이터 과학을 위한 툴(장비)

1주차 : 총 2시간 데이터 과학의 언어 수업 서론 데이터 과학자는 데이터를 변환하고 시각화하는 능력이 필요하다. 이를 위해서는 관련 프로그래밍 능력과 프레임워크에 대한 이해가 필요하다. 클라우드에 대한 이해도 필요하다. 데이터 과학의 언어 파이썬, R, SQL 은 기본적인 언어이다. 이외에 Scala, Java, C++, Julia 도 유명하다. JS, php, Go, Ruby 도 특별한 능력이 있다. 본인이 풀고자 하는 문제에 따라서 필요한 프로그래밍 언어가 달라진다. 파이썬 서론 파이썬은 매우 유명합니다. 배우기 쉽고, 다큐멘트가 많으며, AI, ML , web 개발 등 여러 기능을 가지고 있으며, 여러 조직에서 사용하고 있습니다. 또한 라이버리가 다양합니다. 데이터 과학자에게는 특히 Pandas,..

머신 러닝 2022.05.17

[데이터과학 코세라 강의] (2주차) 데이터 과학이란 무엇인가?

1주차에 이어서 2주차이다. 3주차는 (일단) 패스하도록 하겠다. 2주차: 총 3시간 빅 데이터와 데이터 마이닝 빅데이터 기초 비즈니스 인사이트를 위한 수집된 대량의 정보를 의미한다. 빅데이터는 엄청난 속도 (velocity) 로 수집된다. 빅데이터의 스케일 (volume) 은 어마어마하다. 빅데이터에는 종류가 다양하다 (variety). 사진, 텍스트 등 다양한 소스에서부터 비롯된다. 데이터의 신빙성 (veracity) 도 높다. 데이터의 가치 (value) 는 고객, 직원, 헬스 등 다양한 분야에서 가치를 가진다. ApacheSpark, Hadoop 은 빅데이터를 분석할 툴이다. 하둡이란 무엇인가? 매우매우 대량의 데이터를 잘게 나누어서 서로 다른 컴퓨터(서버)에 전송한 후에 각자 계산을 한 결과를 ..

머신 러닝 2022.05.16

[데이터과학 코세라 강의] (1주차) 데이터 과학이란 무엇인가?

IBM Data Scientist 과정을 구독했다. 10개의 강의가 있다. 7일 무료 이용이고 이후 월 $39를 지급해야 한다. 완료 시 수료증을 발급받는다. 구독은 어렵지 않다. 클릭하고 신용카드 정보를 기입한다. 나는 이전에 MySQL 과정을 하면서 등록해둔 정보가 있어서 바로 시작되었다. 1월 26일에 총알같이 완료했는데, 수료증받고 구독 취소하는 법을 몰라서 과금이 두 번 되었다... 수료증을 받더라도 구독 취소를 눌러야 하는가 그랬던 것 같다 (한 번은 그렇다 하더라도 두 번은 좀 그렇다...). 이번에는 누구보다빠르게 번개같이 수료증받고 구독취소를 해야겠다. 그래도 "돈"을 걸면 더 열심히 하게 된다. 물론 그렇다고 무조건 빠르게 하는 것만이 중요한 건 아니다. MySQL 때 일단 답 찾는 일..

머신 러닝 2022.05.16

[머신러닝 강의] 코세라 강의 로드맵

들어가며 캐나다 데이터 과학자인 Greg Hogg 라는 유튜버의 Coursera ML 로드맵인데, 구성이 괜찮아 보여서 따라 해봐야지 하고 있다. 데이터 과학자 분들의 링크딘 프로필의 자격증란 (Licenses & certifications) 를 눈팅하는 편인데, 어떤 순서로 강의들을 들어야하나 고민이 있었다. Greg Hogg 의 영상에서 스텝-바이-스텝으로 강의를 추천해줘서 좋은 것 같다. 방학을 계기로 하루에 몰아서 시간을 하루에 4-5시간씩 몰아서 듣고자 한다. 이전에 MySQL 수업 들을 때 일주일 동안 무료였던 걸로 기억한다. 나는 이 방식이 좋았던 것이 "금전적인 인센티브"가 생겨서 기간 안에 수업을 끝낼 수 있는 것 같다. 물론, 그 때 "취소"버튼을 누르지 않아서 결재를 했지만... 이번..

머신 러닝 2022.05.15