서브메뉴
검색
본문
Powered by NAVER OpenAPI
-
파이썬과 OpenCV를 이용한 컴퓨터 비전 학습 (컴퓨터 비전 애플리케이션을 만들기 위한 강력한 OpenCV 3와 파이썬 활용하기)
저자 : 알렉세이 스피쉐보이|알렉산드르 류브니코프
출판사 : 에이콘출판
출판년 : 2019
정가 : 35000, ISBN : 9791161752396
책소개
『파이썬과 OpenCV를 이용한 컴퓨터 비전 학습』은 파이썬에 관한 기본 지식이 있는 개발자를 위한 책이다. 이 책을 통해 픽셀 단위의 조작을 통한 이미지 처리 방법과 히스토그램을 사용해 이미지를 분석하는 방법을 배울 수 있다. 그리고 이미지 콘텐츠를 더 향상시키기 위해서 이미지 필터를 어떻게 사용해야 하는지, 촬영된 장면의 다른 뷰들을 연결 처리하기 위해서 이미지 기하학을 어떻게 사용할 것인지를 보여준다. 카메라 보정과 멀티 뷰 분석을 위한 기법도 제공한다. 객체 검출과 인식과 같은 애플리케이션에서 활용할 수 있는 저수준 픽셀 정보를 고수준 개념으로 전환해주는 방법을 배울 수 있다. 파일이나 카메라에 있는 동영상을 처리하는 방법, 움직이는 객체를 검출하고 추적하는 방법에 대해서도 다룬다. 끝으로 딥러닝, 객체 분류 및 뉴럴 네트워크와 같은 최신 주제에 대해서도 살펴볼 수 있다.
목차
1장. 입출력과 GUI
__소개
__파일에서 이미지 읽어오기
__간단한 이미지 변환: 크기 조절 및 뒤집기
__손실 및 무손실 압축을 사용한 이미지 저장
__OpenCV 창에 이미지 표시
__OpenCV 창에서 버튼 및 탐색바와 같은 UI 요소로 작업
__2D 프리미티브 그리기: 마커, 선, 타원, 사각형 및 텍스트
__사용자의 키보드 입력 처리
__사용자의 마우스 입력을 처리해 앱을 대화형으로 만들기
__카메라 프레임 캡처 및 표시
__비디오 프레임 스트림 재생
__프레임 스트림 프로퍼티 얻기
__프레임 스트림을 비디오로 저장
__비디오 파일의 프레임 간 이동
2장. 행렬, 색상, 필터
__소개
__행렬 조작: 생성하기, 채우기, 요소 접근하기, ROI
__데이터 타입과 스케일 변환
__NumPy를 사용한 비이미지 데이터 영속성
__이미지 채널 조작
__이미지의 색 공간 변환
__감마 보정과 요소 단위의 수학
__평균/분산 이미지 정규화
__이미지 히스토그램 계산
__이미지 히스토그램 평활화
__가우시안 필터, 중앙값 필터, 양방향 필터를 사용한 노이즈 제거
__소벨 필터로 이미지 경사도 계산
__자체 필터 생성과 적용
__실수 값으로 된 가버(Garbor) 필터로 이미지 처리
__이산 푸리에 변환을 사용한 공간 도메인과 주파수 도메인 간 변환
__이미지 필터링을 위한 이미지 주파수 조작
__다양한 이미지 임계 처리법
__형태 연산자
__이미지 마스크와 이진 연산
3장. 윤곽선과 분할
__소개
__Otsu 알고리즘을 사용한 그레이스케일 이미지 이진화
__이진 이미지에서 외부 및 내부 윤곽선 찾기
__이진 이미지에서 연결된 구성 요소 추출
__선과 원을 2차원 점의 집합으로 맞추기
__이미지 모멘트 계산
__곡선으로 작업: 근사, 길이, 면적
__윤곽선 내부에서 점의 포함 여부 확인
__거리 맵 계산
__평균 알고리즘을 k- 이용한 이미지 분할
__분할 시드를 사용해 이미지 분할: 워터쉐드 알고리즘
4장. 객체 검출과 머신 러닝
__소개
__GrabCut 알고리즘을 사용해 객체 마스크 얻기
__Canny 알고리즘을 사용해 에지 찾기
__Hough 변환을 사용해 직선과 원 검출
__템플릿 매칭을 통한 객체 찾기
__메디안 플로우 객체 추적기
__추적 API의 다양한 알고리즘을 사용해 객체 추적
__두 프레임 사이의 밀집 옵티컬 플로우 계산
__체스판과 원 그리드 패턴 검출
__SVM 모델을 사용한 단순 보행자 검출기
__다양한 머신 러닝 모델을 사용한 광학 문자 인식
__Haar/LBP 캐스케이드를 사용해 얼굴 검출
__AR 애플리케이션을 위한 AruCo 패턴 검출
__자연 영상에서 텍스트 검출
__QR 코드 검출기
5장. 딥러닝
__소개
__이미지를 텐서/blobs로 표현
__Caffe, Torch, TensorFlow 형식의 딥러닝 모델 불러오기
__모든 레이어에 대한 입/출력 텐서 형태 가져오기
__이미지 사전 처리와 컨벌루션 네트워크로 추론
__추론 시간과 각 계층의 기여도 측정
__GoogleNet/Inception, ResNet 모델로 이미지 분류
__SSD 모델로 객체 검출
__FCN(Fully Convolution Network) 모델을 사용해 장면 분할
__SSD, ResNet 모델을 사용해 얼굴 검출
__연령 및 성별 예측
6장. 선형 대수
__소개
__직교 프로쿠르스테스 문제
__순위 제한과 행렬 근사 방법
__주성분 분석
__선형 방정식 풀기(underdetermined, overdetermined 포함)
__다항 방정식 풀기
__심플렉스 방법을 사용한 선형 프로그래밍
7장. 검출기와 기술자
__소개
__이미지의 코너 찾기: 해리스(Harris)와 FAST
__추적을 위한 이미지 내 좋은 코너 선택
__키포인트, 기술자 및 매칭 결과 나타내기
__크기 불변 키포인트의 검출
__이미지 키포인트에 대한 컴퓨팅 기술자: SURF, BRIEF, ORB
__여러 기술자 간의 대응 관계를 찾기 위한 매칭 기법
__신뢰할 수 있는 매칭 결과 찾기: 교차 검증 및 비율 테스트
__모델 기반 매칭 필터링: RANSAC
__전역 이미지 기술자 구축을 위한 BoW 모델
8장. 이미지 및 동영상 처리
__소개
__아핀과 원근감 변환을 사용해 이미지 뒤틀기
__임의 변환을 사용한 이미지 재매핑
__루카스-카나데 알고리즘을 사용해 프레임 간 키포인트 추적
__배경 제거
__많은 이미지를 파노라마 형태로 스티칭
__비지역적 평균 알고리즘을 사용해 사진 노이즈 제거
__HDR 이미지 만들기
__이미지 수리 방법을 사용해 사진 내의 결함 제거
9장. 다중 뷰 기하학
__소개
__핀홀 카메라 모델 보정
__어안 렌즈 카메라 모델 보정
__스테레오 장비 보정: 외부 추정
__왜곡 점과 비왜곡 점
__이미지에서 렌즈 변형 효과 제거
__삼각 측량을 통해 두 가지 관찰 지점으로부터 3D 점 복원
__PnP 알고리즘을 사용해 상대적 카메라 객체의 자세(포즈) 찾기
__스테레오 정류기를 통한 두 개의 뷰 정렬
__에피폴라 기하학: 컴퓨팅 기본과 필수 행렬
__회전과 이동을 위한 필수적인 행렬 분해
__스테레오 이미지의 불일치 맵 추정
__호모그래피 변환 추정을 통한 특별한 2개 뷰의 기하학 특성 살펴보기
__평면 영상: 호모그래피 분해 방법을 사용해 회전과 이동
__회전 카메라 케이스: 호모그래피 변환에서 카메라 회전 추정 사용