책소개
딥러닝을 진정으로 가치 있게 활용하는 방법!딥러닝은 입출력 데이터와 손실함수만 잘 정의한다면 다양한 분야의 과제를 해결할 수 있다. 딥러닝 응용 방법으로 전이학습과 파인튜닝을 활용한 화상(이미지) 분류, 물체 감지, 시맨틱 분할, 자세 추정, GAN을 활용한 화상 생성 및 이상 탐지, 텍스트 데이터 감정 분석, 동영상 데이터 클래스 분류를 다뤘다. 직무 특성에 따른 도메인 지식과 딥러닝 구현 능력을 갖춘 인재로 성장하여 활약하는 데 이 책이 도움이 될 것이다.
저자소개
SIer의 기술본부 개발기술부 소속. 딥러닝을 비롯한 머신러닝 관련 기술의 연구 개발 및 기술 지원을 담당한다. 아카시 공업고등전문학교, 도쿄대학 공학부를 거쳐 도쿄대학 대학원, 짐보/고타니 실험실에서 뇌 기능 측정 및 계산 신경과학을 연구했으며 2016년에 박사 학위를 취득했다. 도쿄대학 특임 연구원을 거쳐 2017년 4월부터 현재 직무에 종사 중이다. 저서로 『PyTorch를 활용한 강화학습/심층강화학습 실전 입문』, 『つくりながら學ぶ! Pythonによる因果分析』 등이 있다.
목차
CHAPTER 1 화상 분류와 전이학습(VGG)1.1 학습된 VGG 모델을 사용하는 방법1.2 파이토치를 활용한 딥러닝 구현 흐름1.3 전이학습 구현1.4 아마존 AWS의 클라우드 GPU 머신을 사용하는 방법1.5 파인튜닝 구현CHAPTER 2 물체 감지(SSD)2.1 물체 감지란2.2 데이터셋 구현2.3 데이터 로더 구현2.4 네트워크 모델 구현2.5 순전파 함수 구현2.6 손실함수 구현2.7 학습 및 검증 실시2.8 추론 실시CHAPTER3 시맨틱 분할(PSPNet)3.1 시맨틱 분할이란3.2 데이터셋과 데이터 로더 구현3.3 PSPNet 네트워크 구성 및 구현3.4 Feature 모듈 설명 및 구현(ResNet)3.5 Pyramid Pooling 모듈 설명 및 구현3.6 Decoder, AuxLoss 모듈 설명 및 구현3.7 파인튜닝을 활용한 학습 및 검증 실시3.8 시맨틱 분할 추론CHAPTER 4 자세 추정(OpenPose)4.1 자세 추정 및 오픈포즈 개요4.2 데이터셋과 데이터 로더 구현4.3 오픈포즈 네트워크 구성 및 구현4.4 Feature 및 Stage 모듈 설명 및 구현4.5 텐서보드X를 사용한 네트워크의 시각화 기법4.6 오픈포즈 학습4.7 오픈포즈 추론CHAPTER 5 GAN을 활용한 화상 생성(DCGAN, Self-Attention GAN)5.1 GAN을 활용한 화상 생성 메커니즘과 DCGAN 구현5.2 DCGAN의 손실함수, 학습, 생성5.3 Self-Attention GAN의 개요5.4 Self-Attention GAN의 학습, 생성CHAPTER 6 GAN을 활용한 이상 화상 탐지(AnoGAN, Efficient GAN)6.1 GAN을 활용한 이상 화상 탐지 메커니즘6.2 AnoGAN 구현 및 이상 탐지 실시6.3 Efficient GAN의 개요6.4 Efficient GAN 구현 및 이상 탐지 실시CHAPTER 7 자연어 처리에 의한 감정 분석(Transformer)7.1 형태소 분석 구현(Janome, MeCab+NEologd)7.2 torchtext를 활용한 데이터셋, 데이터 로더 구현7.3 단어의 벡터 표현 방식(word2vec, fasttext)7.4 word2vec, fasttext에서 학습된 모델(일본어)을 사용하는 방법7.5 IMDb의 데이터 로더 구현7.6 Transformer 구현(분류 작업용)7.7 Transformer의 학습/추론, 판단 근거의 시각화 구현CHAPTER 8 자연어 처리를 활용한 감정 분석(BERT)8.1 BERT 메커니즘8.2 BERT 구현8.3 BERT를 활용한 벡터 표현 비교(bank: 은행과 bank: 강변)8.4 BERT의 학습 및 추론, 판단 근거의 시각화 구현CHAPTER 9 동영상 분류(3DCNN, ECO)9.1 동영상 데이터에 대한 딥러닝과 ECO 개요9.2 2D Net 모듈(Inception-v2) 구현9.3 3D Net 모듈(3DCNN) 구현9.4 Kinetics 동영상 데이터셋을 데이터 로더로 구현9.5 ECO 모델 구현 및 동영상 분류의 추론 실시