서브메뉴
검색
본문
Powered by NAVER OpenAPI
-
-
머신 러닝 인 파이썬 (파이썬을 활용한, 예측분석을 위한 기계 학습)
저자 : 마이클 보울즈
출판사 : 비제이퍼블릭
출판년 : 2015
정가 : 27000, ISBN : 9791186697061
책소개
파이썬을 이용하여 데이터를 분석하고 결과를 예측하는 간단하고 효과적인 방법
머신 러닝은 예측에 중점을 둔다. 과거의 연관관계를 기반으로 ‘알고 있는 것’을 이용해 ‘알고 싶은 것’을 예측한다. 머신 러닝은 사실 아주 최근까지도 수학과 통계적 콘셉트에 대한 깊은 이해는 물론, R 또는 다른 특별한 프로그래밍 언어를 능숙하게 다룰 수 있는 사람들만 이해할 수 있는 꽤 까다로운 기술이었다. 하지만 이 책은 효과적으로 결과를 예측할 수 있는 두 종류의 알고리즘 군에 집중하고, 사용하기 쉬운 파이썬 프로그래밍 언어를 이용함으로써 많은 이들이 머신 러닝을 더욱 쉽게 이해하고, 폭넓게 적용할 수 있도록 만들어졌다.
저자 마이클 보울즈는 수년간 쌓아온 머신 러닝 전문가로서의 지식을 모두 끌어내 독자 스스로가 설계, 구축, 이행이라는 머신 러닝 솔루션 전 과정을 수행할 수 있도록 도와준다. 복잡한 계산 없이 단순한 용어로 알고리즘을 설명하고, 지금 당장 시작할 수 있도록 샘플 코드도 제공했다. 독자들은 이 책을 통해 구축 과정에 숨어 있는 메커니즘을 깊이 파고들게 될 것이며, 주어진 문제가 단순하든 복잡하든 문제 해결을 위한 최적의 알고리즘을 선택하고 적용하는 법을 배우게 될 것이다. 상세한 예제들은 구체적이고 수정 가능한 소스 코드로 머신 러닝의 절차를 설명해줄 것이다. 또 선형 회귀와 앙상블 기법에 대한 설명은 머신 러닝이 작동하는 가장 기초적인 프로세스를 이해하도록 도와줄 것이다.
『머신 러닝 인 파이썬』은 수학이나 통계학을 전공하지 않은 사람도 머신 러닝을 쉽게 이해할 수 있도록 다음과 같은 내용을 담고 있다.
- 주어진 업무에 사용할 적합한 알고리즘 선택하기
- 메커니즘을 배우고 데이터 준비하기
- 파이썬 머신 러닝 패키지의 핵심 마스터하기
- 실질적으로 적용할 수 있는 예측 모델 생성하기
- 연습한 모델을 다양한 목적으로 적용해보기
- 더 나은 품질 관리와 응용을 위해 모델 성능 측정하기
- 주어진 샘플 코드를 이용하여 스스로 모델을 설계하고 생성하기
목차
1장. 예측할 때 사용하는 두 가지 핵심 알고리즘
- 왜 이 두 가지 알고리즘이 유용한가?
- 피널라이즈드 회귀 기법은 무엇인가?
- 앙상블 기법은 무엇인가?
- 어떤 알고리즘을 사용할 것인지 결정하는 방법
- 예측 모델 생성을 위한 단계별 절차
- 각 장의 내용과 연관관계
- 요약
2장. 데이터 이해로 문제 이해하기
- 새로운 문제의 구조 확인
- 속성과 레이블의 차이 때문에 모델이 선택된다
- 바위와 기뢰 데이터 세트의 특성 시각화
- 요인 변수로 수치 값 예측: 전복의 나이는 몇 살인가?
- 수치 속성을 사용한 수치 예측-와인 테이스트 계산하기
- 다중 분류 문제: 유리의 종류는 무엇인가?
- 요약
3장. 예측 모델 생성: 성능, 복잡성, 빅 데이터의 균형
- 기초 문제: 함수 근사 이해하기
- 알고리즘 선택 및 성능에 영향을 미치는 요인-복잡성과 데이터
- 예측 모델의 성능 측정
- 모델과 데이터의 조화
- 요약
4장. 피널라이즈드 선형 회귀
- 왜 피널라이즈드 선형 회귀 기법이 유용한가
- 피널라이즈드 선형 회귀: 최적 성능을 위한 선형 회귀 조절
- 피널라이즈드 선형 회귀 문제 풀기
- 수치 입력으로 선형 회귀 확장
- 요약
5장. 피널라이즈드 선형 기법을 이용한 예측 모델 생성
- 피널라이즈드 선형 회귀 파이썬 패키지
- 다변수 회귀: 와인 테이스트 예측
- 다중 분류: 범죄 현장의 유리 샘플 분류
- 요약
6장. 앙상블 기법
- 이진 의사결정 트리
- 부트스트랩 애그리게이션: 배깅
- 그래디언트 부스팅
- 랜덤 포레스트
- 요약
7장. 파이썬으로 앙상블 예측 모델 생성
- 파이썬 앙상블 패키지를 이용한 회귀 문제 풀기
- 와인 테이스트 예측을 위한 배깅 코딩
- 파이썬 앙상블 모델에서 비수치형 속성 사용하기
- 파이썬 앙상블 메서드로 이항 분류 문제 풀기
- 파이썬 앙상블 기법으로 다중 분류 문제 풀기
- 알고리즘 비교
- 요약