서브메뉴
검색
본문
Powered by NAVER OpenAPI
-
데이터 분석 전문가를 위한 R 데이터 분석
저자 : 조민호
출판사 : 정보문화사
출판년 : 2019
정가 : 25000, ISBN : 9788956747989
책소개
이 책은 독자들이 간단명료하게 데이터 분석 이론을 습득하고, 오픈 소스 기반이면서 강력한 그래픽 기능을 지원하는 R을 이용하여 실무에서 접할 수 있는 데이터 분석 실습을 할 수 있도록 구성하였다. 이 책의 명령어들을 하나씩 입력하면서 예제를 통해 어떤 기법을 사용해야 하는지 익힐 수 있으며, 명령어 옆에 있는 설명과 ‘명령어 정리’를 참고하여 R과 데이터 분석을 이해하고 다양한 상황에 응용할 수 있다. 이 책은 분명 중간에 포기하지 않고 재미있게 다양한 분석 기법을 익히도록 도울 것이다.
목차
머리말
프롤로그
예제 소스 및 해설 다운로드
이 책의 구성
학습 가이드
PART 1 데이터 분석이란?
CHAPTER 01 데이터의 개념
01 데이터의 정의
02 데이터의 유형
03 데이터와 정보의 관계
CHAPTER 02 데이터베이스와 데이터베이스 관리 시스템
01 데이터베이스의 정의
02 데이터베이스의 특징
03 데이터베이스 적용 분야
04 데이터베이스 관리 시스템(DBMS)
05 데이터베이스 관리 시스템 종류
06 CAP 정리
CHAPTER 03 빅데이터 정의 및 분석 기법
01 빅데이터의 정의
02 빅데이터의 가치
03 빅데이터가 만드는 변화
04 빅데이터 분석을 위한 기법
05 데이터 활용 진화 방향
06 빅데이터 위기와 통제 방안
07 빅데이터의 미래
CHAPTER 04 데이터 사이언스
01 데이터 사이언스의 정의
02 데이터 사이언스 업무 범위
03 데이터 사이언스 영역
04 데이터 사이언스 관련 환경 분석
CHAPTER 05 데이터 분석 및 기획
01 데이터 분석 과정
02 데이터 분석 과정 사례
03 데이터 분석 기획의 정의
CHAPTER 06 데이터 분석 방법론
01 방법론의 구성 요소와 모델 및 진행
02 데이터 분석 방법론
03 KDD 분석 방법론
04 CRISP-DM 분석 방법론
05 빅데이터 분석 방법론
CHAPTER 07 분석 과제 발견
01 하향식 접근 방법
02 상향식 접근 방법
03 분석할 과제의 정의
04 분석 프로젝트 관리 방안
05 분석 프로젝트 추가 관리 대상
CHAPTER 08 분석 마스터 플랜과 분석 거버먼트
01 분석 마스터 플랜
02 분석 거버넌스 체계
PART 2 R 기초 사용법
CHAPTER 01 소개 및 환경 구성
01 R 설치
02 배치 모드 실행
03 R 수행 조정 사항
CHAPTER 02 기초 사용법
01 R을 계산기처럼 사용
02 변수 정의 및 사용
03 데이터 세트 사용
04 R에서 데이터를 파일에 저장하고 읽어 오기
CHAPTER 03 데이터 타입
01 R에서 사용하는 데이터 타입
02 벡터 데이터 처리
03 행렬 데이터 처리
04 데이터 프레임 데이터 처리
05 배열 데이터 처리
06 리스트 데이터 처리
CHAPTER 04 프로그래밍 기능
01 R 프로그래밍 기능
02 함수 선언과 사용
03 함수 저장 및 활용
04 조건문 사용
05 반복문 사용
06 사용자 입력받기
07 메뉴 사용
08 정규식 사용
CHAPTER 05 데이터 조작 관련 명령어
01 rbind, cbind 명령과 행렬 데이터 사용
02 apply 계열 함수 사용
03 summary, order, sample 명령 사용
04 split, subset, with, merge 명령 사용
05 which, aggregate 명령 사용
CHAPTER 06 데이터 조작 관련 패키지 사용
01 dplyr 패키지 사용
02 sqldf 패키지 사용
03 다른 패키지
PART 3 데이터 분석 및 전처리 기법
CHAPTER 01 데이터 분석 전문가 필요 역량
CHAPTER 02 데이터 분석의 유형
CHAPTER 03 데이터 탐색 과정
01 칼럼 사이 연관관계 파악하기
02 정보 파악하기
03 칼럼 사이 연관관계 분석하기
04 종류별 분포 확인하기
05 별도 패키지로 탐색하기
CHAPTER 04 데이터 전처리 - 데이터 클렌징
01 데이터 전처리
02 데이터 확인
03 데이터 형식 변경
04 결측 값 처리
05 이상 값 처리
06 특성 조작
CHAPTER 05 추가적인 데이터 전처리 기법
01 데이터 정규화 - 데이터 변형
02 주성분 분석 - 데이터 개수 축소
03 summary, order, sample 명령 사용
04 split, subset, with, merge 명령 사용
05 which, aggregate 명령 사용
CHAPTER 06 효과적인 분석을 위한 변수 제거 및 선택
01 0에 가까운 분산을 가지는 변수 제거
02 상관관계가 높은 변수 제거
03 카이 제곱 검정을 통한 중요 변수 선발
PART 4 데이터 시각화 의미와 기법
CHAPTER 01 데이터 시각화 의미
CHAPTER 02 R 그래프 그리기 절차
CHAPTER 03 R 그래프 전체 구성 결정
01 split.screen으로 그래프 화면 전체 구성 결정
02 par, mfrow로 그래프 화면 전체 구성 결정
CHAPTER 04 다양한 R 그래프 옵션
CHAPTER 05 R 그래프 그리기
01 그래프에 사용할 데이터 확보하기
02 확보된 데이터를 기반으로 기본 그래프 그리기
03 x축과 y축 넣기
04 그래프에 제목과 x, y축의 의미 설정하기
05 def, ghi 데이터를 그래프에 추가하기
CHAPTER 06 기본 R 그래프 그리기
01 막대 그래프 그리기
02 막대 그래프 응용하기
03 점 그래프 그리기
04 히스토그램 그리기
05 원 그래프 그리기
06 3차원 파이 그래프 그리기
07 박스 그래프 그리기
CHAPTER 07 그래프 그리기의 부가적인 기능
01 R의 그래픽 윈도우 조절법
02 꺾은선 그래프 그리기
03 선분, 화살표, 사각형, 문자열, 직선 그리기
04 두 종류 그래프 조합하기
CHAPTER 08 그래프 종류 소개
01 Sunflowerplot 그래프
02 Stars 그래프
03 Persp, Contour 그래프
CHAPTER 09 패키지로 그래프 그리기
01 plot3D 패키지
02 lattice 패키지
CHAPTER 10 ggplot2 패키지로 그래프 그리기
01 ggplot2 그래픽 그리기 - 12가지 사례
02 ggplot2 그래프 응용 사례 - 7가지 사례
03 Iris 데이터로 ggplot2 그래프 제작 실습
CHAPTER 11 데이터 시각화 방법 정리
01 한 개의 변수가 연속형 데이터인 경우
02 한 개의 변수가 범주형 데이터인 경우
03 두 개 이상의 변수가 연속형 데이터인 경우
04 두 개 이상의 변수가 범주형 데이터인 경우
PART 5 통계 분석
CHAPTER 01 통계 분석 목적과 데이터 유형
01 통계 분석을 수행하는 목적
02 통계에서 사용하는 데이터 유형
CHAPTER 02 표본 만들기 및 기초 통계량
01 확률 분포 함수 의미와 종류
02 난수 만들고 분포 함수 그리기
03 표본 추출 방법
04 통계 기본 - 기초 통계량
05 분할표 작성
CHAPTER 03 독립성 및 적합성 검정
01 독립성 검정
02 적합성 검정
CHAPTER 04 통계 분석 종류
01 통계 분석을 통해 알고자 하는 것
02 통계 분석 방향과 구체적인 기법 정리
CHAPTER 05 차이 검정
01 t-test
02 분산 분석
03 부호 검정
04 비율 검정
CHAPTER 06 인과(상관) 관계 검정
01 상관계수
02 상관관계 분석
PART 6 데이터 마이닝
CHAPTER 01 데이터 마이닝 정의와 사례
01 데이터 분석 역사
02 데이터 마이닝 정의
03 데이터 마이닝 응용 분야
04 데이터 마이닝 적용 사례
05 데이터 마이닝 솔루션
06 데이터 마이닝 수행을 위해 알아야 하는 분야
CHAPTER 02 데이터 마이닝 학습 분류 및 분석 방법 정리
01 지도 학습과 분석 방법
02 자율 학습 또는 비지도 학습과 분석 방법
CHAPTER 03 데이터 마이닝 추진 단계
PART 7 회귀 모델
CHAPTER 01 선형 회귀 - 단순 선형 회귀
CHAPTER 02 선형 회귀 - 중선형 회귀 및 적절한 변수 선택
CHAPTER 03 비선형 회귀 - 신경망 모델
01 신경망이란?
02 신경망 모델
CHAPTER 04 커널 방법론
CHAPTER 05 로지스틱 회귀
CHAPTER 06 다항 로지스틱 회귀
PART 8 지도 학습
CHAPTER 01 지도 학습
CHAPTER 02 의사 결정 나무
01 의사 결정 나무 알고리즘 종류
02 CART 알고리즘
03 조건부 추론 나무
CHAPTER 03 앙상블
01 앙상블의 정의
02 앙상블에서 사용되는 기법
03 배깅
04 랜덤 포레스트
CHAPTER 04 서포트 벡터 기계
01 초평면
02 분리 초평면
03 최대 마진 분류기
04 서포트 벡터 분류기
05 서포트 벡터 머신
06 서포트 벡터 머신 사용
CHAPTER 05 베이지안 방법론
01 베이지안 추론
02 베이지안 추론을 이용한 예측 - 베이지안 방법론
PART 9 비지도 학습
CHAPTER 01 군집 분석
01 개요
02 K 평균 군집법
03 The K-Medoids 군집법
04 계층적 군집법
05 밀도 기반 군집법
CHAPTER 02 차원 축소 기법
01 차원을 줄이는 방법
02 주성분 분석
03 인자 분석
04 독립 성분 분석
05 다차원 척도법
PART 10 빅데이터에 적용되는 분석 기법
CHAPTER 01 연관 규칙 분석
01 연관 규칙 분석 정의
02 연관 규칙 분석 적용 예
03 연관 규칙 분석 실습
04 순차 패턴 분석 개념과 분석 방법
CHAPTER 02 판별 분석
01 판별 분석 종류
02 선형 판별 분석
03 이차 판별 분석
CHAPTER 03 시계열 분석
01 시계열 분석
02 시계열 데이터 생성
03 시계열 데이터 분석 절차(ARIMA 기준)
04 시계열 데이터 분해 단계
05 시계열 데이터 변환 단계
06 최적화된 파라미터 결정 단계
07 모형 만들기와 예측 단계
08 변환하지 않은 시계열 데이터 기반 예측
09 시계열 데이터 군집화
PART 11 특수 분석
CHAPTER 01 워드 클라우드
01 워드 클라우드 제작 사례
02 워드 클라우드를 만드는 프로그램 소개
03 워드 클라우드 제작 실습
CHAPTER 02 소셜 네트워크 분석
01 소셜 네트워크 분석
02 d3SimpleNetwork 패키지 사용
03 igraph 패키지 사용
CHAPTER 03 구조 방정식
01 경로 분석 정의 및 분석 사례
02 구조 방정식 모형 및 사례
에필로그
도판 목록
찾아보기