머신 러닝[머신러닝 코세라 강의] (10주차) "Large Scale Machine Learning"

머신 러닝

머신 러닝[머신러닝 코세라 강의] (10주차) "Large Scale Machine Learning"

마빈 Marvin 2022. 9. 5. 11:06

Gradient Descent with Large Datasets

Learning With Large Datasets

$J_{C V}$ 와 $J_{t r a i n}$ 이 $m$ 에 따라 변하는 값을 비교하면, $m$ 이 큰 것이 필요한지 여부를 판별할 수 있습니다.

Stochastic Gradient Descent

대용량 데이터를 다룰 때 계산을 빠르게할 방법이 필요합니다. Gradient descent 의 문제는 $m$ 이 매우 클 때 계산이 어려운 점입니다. 모든 트레이닝 데이터에서 파라미터를 업데이트할 때 모든 데이터를 고려하는 것이 아니라, 각각의 데이터 포인트에 대해서 파라미터 업데이트를 합니다.

Mini-Batch Gradient Descent

Stochastic gradient descent 와 batch gradient descent (오리지널 gradient descent) 의 사이의 방식이다. Stochastic gradient descent 에서 한 개의 데이터를 선택하는 것이 아니라, $b$ 개의 mini-batch 를 선택한다. 예를 들어, $b = 10, m = 1, 000$ 를 선택할 수 있다. 이러한 방식을 사용하는 이유는 벡터 형태로 계산을 빠르게 할 수 있기 때문이다.

Stochastic Gradient Descent Convergence

수렴하는지를 확인하는 방법은 cost 를 그래프에 그려보는 것이다. Iteration 숫자가 늘어남에 따라서 감소하면 수렴하는 것으로 볼 수 있다. 하지만, iteration 이 늘어남에 따라 cost 값이 증가하면 값을 늘려야 한다.

Advanced Topics

Online Learning

예를 들어, 웹사이트 같은 곳에서 유저에 대해서 지속적으로 이해하게 되는 것이다. 유저의 새로운 $(x, y)$ 정보가 들어왔을 떄, 파라미터 $θ$ 를 업데이트한다. 유저가 서치를 했을 때, 해당 쿼리의 제품과 유사한 제품을 보여줄 수 있다. 이 때, CTR (Click-through-rate) 를 $y$ 값으로 생각할 수 있다.

Map Reduce and Data Parallelism

하나의 머신이 아니라 여러 개의 머신에서 계산을 할 수 있는 방법에 대해서 다룹니다. 데이터를 나눕니다. 예를 들어, 첫 번째 100개의 데이터로 $\sum_{i = n}^{n + 99} (h_{θ} (x^{(i)})) - y^{(i)}) (x^{(i)})$ 를 각각 계산한 후 합칩니다. 일반적으로, 합으로 이루어진 경우에 나눌 수 있습니다.

'머신 러닝' 카테고리의 다른 글

머신 러닝[머신러닝 코세라 강의] (11주차) "Problem Description and Pipeline" (0)	2022.10.09
머신 러닝[머신러닝 코세라 강의] (9주차) "Anomaly Detection/Recommender System" (이상징후 탐지 / 추천시스템) (0)	2022.08.18
머신 러닝[머신러닝 코세라 강의] (8주차) "Unsupervised Learning" (비지도학습) (0)	2022.08.11
[머신러닝 코세라 강의] (7주차) "SVM (Support Vector Machines" Machine Learning (by Andrew Ng) (0)	2022.06.28
[머신러닝 코세라 강의] (6주차) "알고리즘 선택 가이드라인" Machine Learning (by Andrew Ng) (0)	2022.06.21

현재글머신 러닝[머신러닝 코세라 강의] (10주차) "Large Scale Machine Learning"

데이터 과학과 경제학 PhD 경제학 PhD 마빈입니다. 데이터 과학과 관련해서 경제학과 관련된 내용을 작성합니다. 박사 때는 인과추론과 네트워크 관련 내용을 공부했습니다. 실증산업조직론과 경매이론에도 관심이 있습니다. 양면시장과 매칭 관련해서 산업공학적인 내용도 공부하고자 합니다. 추천 시스템과 양면시장의 관계도 궁금합니다. 프로덕트 개발을 위한 데이터 분석 중 실험과 관련된 통계적인 내용에 관심이 많습니다. 개발경제학 관련해서는 위성 사진을 머신러닝 기법을 통해서 경제학적인

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

데이터 과학과 경제학 PhD