서브메뉴
검색
본문
Powered by NAVER OpenAPI
-
-
빅데이터 실무 기술 가이드 (A Practical Guide to Big Data Technology)
저자 : 한국데이터베이스진흥원
출판사 : 한국데이터베이스진흥원
출판년 : 2015
정가 : 50000, ISBN : 9788988474822
책소개
빅데이터를 활용하기 위해서는 수집ㆍ처리ㆍ저장ㆍ분석ㆍ시각화까지 일련의 과정을 거치게 된다. 데이터 수집 영역은 모든 작업의 시작이면서 빅데이터를 활용하기 위해 사용되는 기술의 결정까지 영향을 미친다. 데이터 수집을 위해서는 데이터에 대한 정확한 이해가 필요하다. 데이터의 존재라는 존재론적 특성과 목적론적(당위론적) 특성에 대해 고려해야 한다.
목차
과목 Ⅰ 데이터 수집
제1장 데이터수집의 이해
제1절 데이터 수집 개요
제2절 수집 데이터의 분류
제3절 데이터 수집절차
제4절 데이터 수집방법 및 기술
연습문제
제2장 데이터수집 실무
제1절 로그 데이터 수집
제2절 관계형 데이터베이스 수집
제3절 웹 크롤링
제4절 오픈 API 수집방법(소셜 데이터 수집)
연습문제
과목 Ⅱ 데이터 저장
제1장 분산파일시스템
제1절 개요
제2절 하둡 아키텍처
제3절 하둡 설치
제4절 하둡 클라이언트
제5절 하둡 WebHDFS 서비스
연습문제
제2장 분산데이터베이스(NoSQL)
제1절 NoSQL 등장 배경
제2절 NoSQL 범주
제3절 Apache HBase
제4절 MongoDB
제3장 인메모리 데이터 저장
제1절 레디스 개발 환경의 이해
제2절 레디스 성능 개선
제3절 레디스 운영관리
연습문제
제4장 Oozie
제1절 Oozie 개요 및 설치
제2절 설정파일의 구성과 작업순서
제3절 Oozie 실습
연습문제
과목 Ⅲ 데이터 처리
제1장 분산병렬배치처리
제1절 개요
제2절 맵리듀스 개발환경의 이해
제3절 맵리듀스 실습
제4절 맵리듀스 튜닝
제5절 아파치 하둡 YARN
연습문제
제2장 SQL On Hadoop
제1절 SQL-On-Hadoop
제2절 하이브
제3절 타조
제4절 샤크 소개와 아키텍처
연습문제
제3장 스트리밍 데이터 처리
제1절 스톰
제2절 스파크 프로그래밍과 스파크 스트리밍
연습문제
과목 Ⅳ 데이터 분석
제1장 기계학습
제1절 기계학습과 데이터 마이닝
제2절 머하웃
제3절 Spark MLlib
연습문제
제2장 통계분석
제1절 기초통계
제2절 다변량 분석
제3절 R에서의 처리성능 개선
제4절 R에서 맵리듀스 구현
연습문제
주요 용어
과목 Ⅴ 데이터 운영관리
제1장 분석시스템관리
제1절 분석 시스템 성능, 장애분석 및 운영
제2절 거버넌스 체계 수립 및 운영
제3절 업무 처리 프로세스 수립 및 운영
연습문제
제2장 용량/비용관리
제1절 분석 시스템 용량 계획
제2절 관리 도구 및 운영비용 계획
연습문제
제3장 보안관리
제1절 계정 및 권한 관리
제2절 로그 분석 및 탐지
연습문제
[부록] 연습문제 정답 및 해설