책소개
이론과 실습을 한 번에 잡는 강화 학습 입문서!
파이썬으로 블랙잭 게임 봇 만들기부터 NAS로 자동 신경망 구성까지 Do it!
알파고, 테슬라 오토 파일럿, 스타크래프트2 자동 플레이 봇은 어떻게 만들었을까? 궁금하다면 강화 학습을 공부하자. 영화 <엣지 오브 투모로우>의 이야기로 쉽게 시작하는 강화 학습! 이 책 한 권이면 이론 공부는 물론이고 다양한 실습으로 강화 학습의 실체를 빠르게 파헤쳐 볼 수 있다. 블랙잭, 비행기 게임, 공 균형 유지 게임 봇, GPT-2 질의응답을 해주는 꼬맹이 자비스, 분산 강화 학습, NAS 자동 신경망 생성기 등을 만들면서 강화 학습을 피부로 느껴 보자!
※ 이 책은 PDF 북이므로 화면이 작은 단말기(스마트폰)에서는 보기 불편합니다. ※
목차
_01장 강화 학습이란?
__01-1 강화 학습 멀리서 훑어보기
__01-2 마르코프 결정 과정으로 시작하는 강화 학습
__01-3 모델 프리 강화 학습
_02장 강화 학습에 딥러닝 조합하기
__02-1 딥러닝 쾌속 복습!
__02-2 DQN 공부하기
_03장 알파고 도전을 위한 첫걸음
__03-1 게임을 스스로 플레이하는 에이전트 만들기
__03-2 유니티 엔진으로 에이전트 만들기
_04장 딥레이서로 구현하는 자율 주행
__04-1 PPO 알고리즘 알아보기
__04-2 딥레이서로 공부하는 강화 학습
_05장 영화 <아이언맨>의 자비스 만들기
__05-1 자연어 처리가 뭐죠?
__05-2 자연어 처리 기법 알아보기
__05-3 GPT로 알아보는 자연어 처리와 강화 학습
__05-4 GPT-2로 자비스 만들기
__05-5 GPT-3와 강화 학습의 미래
_06장 분산 강화 학습 공부하기
__06-1 분산 학습 기초 공부하기
__06-2 분산 강화 학습을 위한 RLlib 라이브러리
__06-3 분산 강화 학습 실행해 보기
_07장 강화 학습으로 만드는 신경망 구조
__07-1 NAS란 무엇일까?
__07-2 NAS 흐름 알아보기
__07-3 NAS 직접 사용해 보기
_08장 NAS 더 자세히 알아보기
__08-1 NAS를 만드는 3단계 다시 알아보기
__08-2 탐색 전략 알아보기
__08-3 탐색 공간 알아보기
__08-4 성능 평가 전략 알아보기
__08-5 NAS, NASNet, ENAS 요약하기