서브메뉴
검색
본문
Powered by NAVER OpenAPI
-
머신 러닝과 통계 (파이썬과 R로 배우는 머신 러닝)
저자 : 프라탑 단게티
출판사 : 에이콘출판
출판년 : 2018
정가 : 35000, ISBN : 9791161751191
책소개
통계와 머신 러닝의 관계에 대해 기초적인 개념을 정립할 수 있도록 돕는다. 또한 지도학습, 비지도학습, 강화학습에 이르기까지 머신 러닝에서 주로 사용되는 대부분의 기법에 대해 파이썬과 R 예제를 제공한다.
책의 초반에 통계와 머신 러닝의 전반적인 관계에 대해 설명한 다음, 지도학습, 비지도학습, 강화학습 순으로 각각의 기법에서 통계적 방법과 머신 러닝 기법을 비교하며 설명한다. 거의 대부분의 예제에 대해서 파이썬과 R 코드를 같이 제공하기 때문에 코드를 직접 실행해 가면서 책을 읽을 수 있다.
목차
1장. 통계학에서 머신 러닝으로의 여행
__모델 구축과 검증을 위한 통계 용어
____머신 러닝
____통계 모델링과 머신 러닝의 주요 차이점
____머신 러닝 모델 개발과 배치를 위한 단계
____통계학 기초 및 모델 구축과 검증에 관련된 용어
____편향과 분산의 트레이드 오프
____훈련 데이터와 테스트 데이터
__모델 구축과 검증을 위한 머신 러닝 용어
____선형 회귀 vs 기울기 하강법
____머신 러닝 손실
____머신 러닝 모델 튜닝을 멈추는 시점
____훈련, 검증, 테스트 데이터
____교차 검증
____그리드 검색
__머신 러닝 모델 개관
__요약
2장. 통계학과 머신 러닝의 유사점
__회귀와 머신 러닝 모델의 비교
__머신 러닝 모델의 보상 요인들
____선형 회귀의 가정들
____선형 회귀 모델링에 적용된 단계들
____기본 원리로 해결하는 간단한 선형 회귀 예제
____와인 품질 데이터를 이용한 단순 선형 회귀 예제
____다중 선형 회귀 예제 - 모델 구축을 위한 단계별 기법
________후진 제거법과 전진 선택법
__머신 러닝 모델 - 리지와 라소 회귀
____리지 회귀 분석 머신 러닝 예
____라소 회귀 분석 머신 러닝 모델
____선형 회귀와 리지/라소 회귀의 매개변수 정규화
__요약
3장. 로지스틱 회귀 vs 랜덤 포레스트
__최대 우도 추정
__로지스틱 회귀 - 소개 및 장점
____로지스틱 회귀에서 사용되는 용어
____로지스틱 회귀 모델링의 적용 단계
____독일 신용 데이터를 이용한 로지스틱 회귀 예
__랜덤 포레스트
____독일 신용 데이터를 이용한 랜덤 포레스트 예
________랜덤 포레스트에서의 그리드 검색
__변수 중요도 그래프
__로지스틱 회귀와 랜덤 포레스트 비교
__요약
4장. 트리 기반 머신 러닝 모델
__결정 트리 분류기 소개
____결정 트리에 사용되는 용어들
____기본 원리로 본 결정 트리의 작동 원리
__로지스틱 회귀와 결정 트리 비교
__다양한 모델 형식 간의 오차항 비교
__이상적인 영역으로 가는 개선책
__HR 퇴직율 데이터 예제
__의사결정 트리(DT) 분류기
__트리 분류기의 가중값 튜닝
__배깅 분류기
__랜덤 포레스트 분류기
__랜덤 포레스트 - 그리드 검색
__에이다 부스트 분류기
__기울기 부스팅 분류기
__에이다 부스팅과 기울기 부스팅의 비교
__극단 기울기 부스팅 - XG 부스트 분류기
__앙상블들의 앙상블 - 모델 스태킹
__서로 다른 분류기 형태 간의 앙상블들의 앙상블
__동일 형식 분류기를 사용한 부트스트랩 표본을 통한 앙상블들의 앙상블
__요약
5장. K-최근접 이웃과 나이브 베이즈
__K-최근접 이웃
____KNN투표 예제
____차원의 저주
________차원의 저주 1차, 2차, 3차원 예제
__위스콘신 유방암 진단 데이터를 이용한 KNN 분류기
__KNN분류기에서 K 값 튜닝
__나이브 베이즈
__확률 기초
____결합 확률
__조건부 확률과 베이즈 정리의 이해
__나이브 베이즈 분류기
__라플라스 계산
__나이브 베이즈 SMS 스팸 분류 예
__요약
6장. 서포트 벡터 머신과 신경망
__SVM 동작 원리
____최대 마진 분류기
____서포트 벡터 분류기
____서포트 벡터 머신
__커널 함수
__SVM 다중 레이블 분류기를 사용한 문자 인식 예제
____최대 마진 분류기 - 선형 커널
____다항 커널
____RBF 커널
__인공 신경망
__활성 함수
__순전파와 역전파
__신경망의 최적화
____확률 경사 하강법(SGD)
____모멘텀
____NAG
____에이다 그래드
____에이다 델타
____RMS프랍
____적응 모멘트 계산 - Adam
____L-BFGS 최적화 알고리즘
__신경망에서의 드롭아웃
__scikit-learn을 사용해 필기체 숫자 인식에 적용한 ANN 분류기
__딥러닝 소개
____해결 기법
____딥러닝 소프트웨어
____필기체 숫자 인식을 위해 케라스를 사용한 딥 신경망 분류기
__요약
7장. 추천 엔진
__내용 기반 필터링
____코사인 유사도
__협업 필터링
____내용 기반 필터링 대비 협업 필터링의 장점
____협업 필터링을 위한 교대 최소 자승법에 의한 행렬 인수 분해
__추천 엔진 모델의 평가
____그리드 검색을 사용한 추천 엔진의 초매개변수 선택
____무비렌즈 데이터에 적용한 추천 엔진
________사용자-사용자 유사도 행렬
________영화-영화 유사도 행렬
________ALS를 사용한 협업 필터링
________협업 필터링에서의 그리드 검색
__요약
8장. 비지도학습
__K-평균 군집화
____K-평균 군집화 기본 작동 원리362
____최적 클러스터 개수와 클러스터 평가
________엘보 기법
____붓꽃 데이터 예제를 이용한 K-평균 군집화
__주성분 분석 - PCA
____기본 원리로 본 PCA작동 기법
____scikit-learn를 활용한 필기체 숫자 인식에 PCA적용
__특이점 분해 - SVD
________scikit-learn를 사용한 필기체 숫자에 SVD적용
__딥 오토 인코더
__인코더-디코더 구조를 이용한 모델 구축 기법
__케라스를 이용한 필기체 숫자 인식에 딥 오토 인코더 적용
__요약
9장. 강화학습
__강화학습 소개
__지도·비지도·강화학습의 상세 비교
__강화학습의 특성
__강화학습 기초
____범주 1 - 가치 기반
____범주 2 - 정책 기반
____범주 3 - 액터 크리틱
____범주 4 - 비모델 기반
____범주 5 - 모델 기반
____순차적 의사결정의 기본 범주
__마르코프 결정 프로세스와 벨만 방정식
__동적 프로그래밍
____동적 프로그래밍으로 최적 정책을 계산하는 알고리즘
__파이썬으로 격자 세상에 가치와 정책 반복 알고리즘 구현
__몬테카를로 기법
____동적 프로그래밍과 몬테카를로 기법의 비교
____DP기법 대비 MC기법의 핵심 우위점
____몬테카를로 예측
____그리드 문제에 적용한 몬테카를로 예측의 적합성
____파이썬을 사용해 블랙잭 게임을 몬테카를로 기법으로 모델링
__시간차 학습
____몬테카를로 기법과 시간차 학습의 비교
____TD 예측
____TD 학습을 위한 회사까지 운전 예제
____SARSA 온-폴리시 TD 제어
__Q-러닝 오프-폴리시 TD 제어
__절벽 걷기 예제에 적용한 온-폴리시와 오프-폴리시 TD 제어
__머신 러닝과 딥러닝을 통합한 강화학습의 응용
____자율 운행 제어 - 자율 주행 차량
____구글 딥마인드의 알파고
____로봇 축구
__참고문헌
__요약