만들면서 배우는 파이토치 딥러닝
딥러닝을 진정으로 가치 있게 활용하는 방법!
딥러닝은 입출력 데이터와 손실함수만 잘 정의한다면 다양한 분야의 과제를 해결할 수 있다. 딥러닝 응용 방법으로 전이학습과 파인튜닝을 활용한 화상(이미지) 분류, 물체 감지, 시맨틱 분할, 자세 추정, GAN을 활용한 화상 생성 및 이상 탐지, 텍스트 데이터 감정 분석, 동영상 데이터 클래스 분류를 다뤘다. 직무 특성에 따른 도메인 지식과 딥러닝 구현 능력을 갖춘 인재로 성장하여 활약하는 데 이 책이 도움이 될 것이다.
SIer의 기술본부 개발기술부 소속. 딥러닝을 비롯한 머신러닝 관련 기술의 연구 개발 및 기술 지원을 담당한다. 아카시 공업고등전문학교, 도쿄대학 공학부를 거쳐 도쿄대학 대학원, 짐보/고타니 실험실에서 뇌 기능 측정 및 계산 신경과학을 연구했으며 2016년에 박사 학위를 취득했다. 도쿄대학 특임 연구원을 거쳐 2017년 4월부터 현재 직무에 종사 중이다. 저서로 『PyTorch를 활용한 강화학습/심층강화학습 실전 입문』, 『つくりながら學ぶ! Pythonによる因果分析』 등이 있다.
CHAPTER 1 화상 분류와 전이학습(VGG)
1.1 학습된 VGG 모델을 사용하는 방법
1.2 파이토치를 활용한 딥러닝 구현 흐름
1.3 전이학습 구현
1.4 아마존 AWS의 클라우드 GPU 머신을 사용하는 방법
1.5 파인튜닝 구현
CHAPTER 2 물체 감지(SSD)
2.1 물체 감지란
2.2 데이터셋 구현
2.3 데이터 로더 구현
2.4 네트워크 모델 구현
2.5 순전파 함수 구현
2.6 손실함수 구현
2.7 학습 및 검증 실시
2.8 추론 실시
CHAPTER3 시맨틱 분할(PSPNet)
3.1 시맨틱 분할이란
3.2 데이터셋과 데이터 로더 구현
3.3 PSPNet 네트워크 구성 및 구현
3.4 Feature 모듈 설명 및 구현(ResNet)
3.5 Pyramid Pooling 모듈 설명 및 구현
3.6 Decoder, AuxLoss 모듈 설명 및 구현
3.7 파인튜닝을 활용한 학습 및 검증 실시
3.8 시맨틱 분할 추론
CHAPTER 4 자세 추정(OpenPose)
4.1 자세 추정 및 오픈포즈 개요
4.2 데이터셋과 데이터 로더 구현
4.3 오픈포즈 네트워크 구성 및 구현
4.4 Feature 및 Stage 모듈 설명 및 구현
4.5 텐서보드X를 사용한 네트워크의 시각화 기법
4.6 오픈포즈 학습
4.7 오픈포즈 추론
CHAPTER 5 GAN을 활용한 화상 생성(DCGAN, Self-Attention GAN)
5.1 GAN을 활용한 화상 생성 메커니즘과 DCGAN 구현
5.2 DCGAN의 손실함수, 학습, 생성
5.3 Self-Attention GAN의 개요
5.4 Self-Attention GAN의 학습, 생성
CHAPTER 6 GAN을 활용한 이상 화상 탐지(AnoGAN, Efficient GAN)
6.1 GAN을 활용한 이상 화상 탐지 메커니즘
6.2 AnoGAN 구현 및 이상 탐지 실시
6.3 Efficient GAN의 개요
6.4 Efficient GAN 구현 및 이상 탐지 실시
CHAPTER 7 자연어 처리에 의한 감정 분석(Transformer)
7.1 형태소 분석 구현(Janome, MeCab+NEologd)
7.2 torchtext를 활용한 데이터셋, 데이터 로더 구현
7.3 단어의 벡터 표현 방식(word2vec, fasttext)
7.4 word2vec, fasttext에서 학습된 모델(일본어)을 사용하는 방법
7.5 IMDb의 데이터 로더 구현
7.6 Transformer 구현(분류 작업용)
7.7 Transformer의 학습/추론, 판단 근거의 시각화 구현
CHAPTER 8 자연어 처리를 활용한 감정 분석(BERT)
8.1 BERT 메커니즘
8.2 BERT 구현
8.3 BERT를 활용한 벡터 표현 비교(bank: 은행과 bank: 강변)
8.4 BERT의 학습 및 추론, 판단 근거의 시각화 구현
CHAPTER 9 동영상 분류(3DCNN, ECO)
9.1 동영상 데이터에 대한 딥러닝과 ECO 개요
9.2 2D Net 모듈(Inception-v2) 구현
9.3 3D Net 모듈(3DCNN) 구현
9.4 Kinetics 동영상 데이터셋을 데이터 로더로 구현
9.5 ECO 모델 구현 및 동영상 분류의 추론 실시