서브메뉴

본문

파이썬과 OpenCV를 이용한 컴퓨터 비전 학습 (컴퓨터 비전 애플리케이션을 만들기 위한 강력한 OpenCV 3와 파이썬 활용하기)
파이썬과 OpenCV를 이용한 컴퓨터 비전 학습 (컴퓨터 비전 애플리케이션을 만들기 위한 강력한 OpenCV 3와 파이썬 활용하기)
저자 : 알렉세이 스피쉐보이|알렉산드르 류브니코프
출판사 : 에이콘출판
출판년 : 2019
정가 : 35000, ISBN : 9791161752396

책소개


『파이썬과 OpenCV를 이용한 컴퓨터 비전 학습』은 파이썬에 관한 기본 지식이 있는 개발자를 위한 책이다. 이 책을 통해 픽셀 단위의 조작을 통한 이미지 처리 방법과 히스토그램을 사용해 이미지를 분석하는 방법을 배울 수 있다. 그리고 이미지 콘텐츠를 더 향상시키기 위해서 이미지 필터를 어떻게 사용해야 하는지, 촬영된 장면의 다른 뷰들을 연결 처리하기 위해서 이미지 기하학을 어떻게 사용할 것인지를 보여준다. 카메라 보정과 멀티 뷰 분석을 위한 기법도 제공한다. 객체 검출과 인식과 같은 애플리케이션에서 활용할 수 있는 저수준 픽셀 정보를 고수준 개념으로 전환해주는 방법을 배울 수 있다. 파일이나 카메라에 있는 동영상을 처리하는 방법, 움직이는 객체를 검출하고 추적하는 방법에 대해서도 다룬다. 끝으로 딥러닝, 객체 분류 및 뉴럴 네트워크와 같은 최신 주제에 대해서도 살펴볼 수 있다.

목차


1장. 입출력과 GUI
__소개
__파일에서 이미지 읽어오기
__간단한 이미지 변환: 크기 조절 및 뒤집기
__손실 및 무손실 압축을 사용한 이미지 저장
__OpenCV 창에 이미지 표시
__OpenCV 창에서 버튼 및 탐색바와 같은 UI 요소로 작업
__2D 프리미티브 그리기: 마커, 선, 타원, 사각형 및 텍스트
__사용자의 키보드 입력 처리
__사용자의 마우스 입력을 처리해 앱을 대화형으로 만들기
__카메라 프레임 캡처 및 표시
__비디오 프레임 스트림 재생
__프레임 스트림 프로퍼티 얻기
__프레임 스트림을 비디오로 저장
__비디오 파일의 프레임 간 이동

2장. 행렬, 색상, 필터
__소개
__행렬 조작: 생성하기, 채우기, 요소 접근하기, ROI
__데이터 타입과 스케일 변환
__NumPy를 사용한 비이미지 데이터 영속성
__이미지 채널 조작
__이미지의 색 공간 변환
__감마 보정과 요소 단위의 수학
__평균/분산 이미지 정규화
__이미지 히스토그램 계산
__이미지 히스토그램 평활화
__가우시안 필터, 중앙값 필터, 양방향 필터를 사용한 노이즈 제거
__소벨 필터로 이미지 경사도 계산
__자체 필터 생성과 적용
__실수 값으로 된 가버(Garbor) 필터로 이미지 처리
__이산 푸리에 변환을 사용한 공간 도메인과 주파수 도메인 간 변환
__이미지 필터링을 위한 이미지 주파수 조작
__다양한 이미지 임계 처리법
__형태 연산자
__이미지 마스크와 이진 연산

3장. 윤곽선과 분할
__소개
__Otsu 알고리즘을 사용한 그레이스케일 이미지 이진화
__이진 이미지에서 외부 및 내부 윤곽선 찾기
__이진 이미지에서 연결된 구성 요소 추출
__선과 원을 2차원 점의 집합으로 맞추기
__이미지 모멘트 계산
__곡선으로 작업: 근사, 길이, 면적
__윤곽선 내부에서 점의 포함 여부 확인
__거리 맵 계산
__평균 알고리즘을 k- 이용한 이미지 분할
__분할 시드를 사용해 이미지 분할: 워터쉐드 알고리즘

4장. 객체 검출과 머신 러닝
__소개
__GrabCut 알고리즘을 사용해 객체 마스크 얻기
__Canny 알고리즘을 사용해 에지 찾기
__Hough 변환을 사용해 직선과 원 검출
__템플릿 매칭을 통한 객체 찾기
__메디안 플로우 객체 추적기
__추적 API의 다양한 알고리즘을 사용해 객체 추적
__두 프레임 사이의 밀집 옵티컬 플로우 계산
__체스판과 원 그리드 패턴 검출
__SVM 모델을 사용한 단순 보행자 검출기
__다양한 머신 러닝 모델을 사용한 광학 문자 인식
__Haar/LBP 캐스케이드를 사용해 얼굴 검출
__AR 애플리케이션을 위한 AruCo 패턴 검출
__자연 영상에서 텍스트 검출
__QR 코드 검출기

5장. 딥러닝
__소개
__이미지를 텐서/blobs로 표현
__Caffe, Torch, TensorFlow 형식의 딥러닝 모델 불러오기
__모든 레이어에 대한 입/출력 텐서 형태 가져오기
__이미지 사전 처리와 컨벌루션 네트워크로 추론
__추론 시간과 각 계층의 기여도 측정
__GoogleNet/Inception, ResNet 모델로 이미지 분류
__SSD 모델로 객체 검출
__FCN(Fully Convolution Network) 모델을 사용해 장면 분할
__SSD, ResNet 모델을 사용해 얼굴 검출
__연령 및 성별 예측

6장. 선형 대수
__소개
__직교 프로쿠르스테스 문제
__순위 제한과 행렬 근사 방법
__주성분 분석
__선형 방정식 풀기(underdetermined, overdetermined 포함)
__다항 방정식 풀기
__심플렉스 방법을 사용한 선형 프로그래밍

7장. 검출기와 기술자
__소개
__이미지의 코너 찾기: 해리스(Harris)와 FAST
__추적을 위한 이미지 내 좋은 코너 선택
__키포인트, 기술자 및 매칭 결과 나타내기
__크기 불변 키포인트의 검출
__이미지 키포인트에 대한 컴퓨팅 기술자: SURF, BRIEF, ORB
__여러 기술자 간의 대응 관계를 찾기 위한 매칭 기법
__신뢰할 수 있는 매칭 결과 찾기: 교차 검증 및 비율 테스트
__모델 기반 매칭 필터링: RANSAC
__전역 이미지 기술자 구축을 위한 BoW 모델

8장. 이미지 및 동영상 처리
__소개
__아핀과 원근감 변환을 사용해 이미지 뒤틀기
__임의 변환을 사용한 이미지 재매핑
__루카스-카나데 알고리즘을 사용해 프레임 간 키포인트 추적
__배경 제거
__많은 이미지를 파노라마 형태로 스티칭
__비지역적 평균 알고리즘을 사용해 사진 노이즈 제거
__HDR 이미지 만들기
__이미지 수리 방법을 사용해 사진 내의 결함 제거

9장. 다중 뷰 기하학
__소개
__핀홀 카메라 모델 보정
__어안 렌즈 카메라 모델 보정
__스테레오 장비 보정: 외부 추정
__왜곡 점과 비왜곡 점
__이미지에서 렌즈 변형 효과 제거
__삼각 측량을 통해 두 가지 관찰 지점으로부터 3D 점 복원
__PnP 알고리즘을 사용해 상대적 카메라 객체의 자세(포즈) 찾기
__스테레오 정류기를 통한 두 개의 뷰 정렬
__에피폴라 기하학: 컴퓨팅 기본과 필수 행렬
__회전과 이동을 위한 필수적인 행렬 분해
__스테레오 이미지의 불일치 맵 추정
__호모그래피 변환 추정을 통한 특별한 2개 뷰의 기하학 특성 살펴보기
__평면 영상: 호모그래피 분해 방법을 사용해 회전과 이동
__회전 카메라 케이스: 호모그래피 변환에서 카메라 회전 추정 사용