책소개
쉽고 빠르게 익히는 자연어 처리 입문 가이드북자연어 처리(NLP)는 인공지능이 지닌 무한한 능력을 이용해 애플 시리, 아마존 알렉사, 구글 번역 등과 같은 제품을 탄생시켰다. 복잡하고 어렵게만 여겨지던 자연어 처리는 파이썬 기반 딥러닝 라이브러리인 파이토치를 통해 딥러닝을 처음 접하는 개발자 및 데이터 과학자도 손쉽게 구현할 수 있게 되었다.『파이토치로 배우는 자연어 처리』는 자연어 처리 및 딥러닝 알고리즘 학습에 필요한 내용을 다룬다. 또한 파이토치를 사용해 자연어 처리 과정에서 직면할 수 있는 문제와 다양한 텍스트를 표현하는 애플리케이션을 구축하는 방법을 보여준다. 딥러닝 및 자연어 처리 기초부터 난도 시퀀스 모델링까지 쉽고 빠르게 익혀보자.
목차
1장_소개1.1 지도 학습1.2 샘플과 타깃의 인코딩1.3 계산 그래프1.4 파이토치 기초1.5 연습문제1.6 요약1.7 참고 문헌2장_NLP 기술 빠르게 훑어보기2.1 말뭉치, 토큰, 타입2.2 유니그램, 바이그램, 트라이그램, …, n-그램2.3 표제어와 어간2.4 문장과 문서 분류하기2.5 단어 분류하기: 품사 태깅2.6 청크 나누기와 개체명 인식2.7 문장 구조2.8 단어 의미와 의미론2.9 요약2.10 참고 문헌3장_신경망의 기본 구성 요소3.1 퍼셉트론: 가장 간단한 신경망3.2 활성화 함수3.3 손실 함수3.4 지도 학습 훈련 알아보기3.5 부가적인 훈련 개념3.6 예제: 레스토랑 리뷰 감성 분류하기3.7 요약3.8 참고 문헌4장_자연어 처리를 위한 피드 포워드 신경망4.1 다층 퍼셉트론4.2 예제: MLP로 성씨 분류하기4.3 합성곱 신경망4.4 예제: CNN으로 성씨 분류하기4.5 CNN에 관한 추가 내용4.6 요약4.7 참고 문헌5장_단어와 타입 임베딩5.1 임베딩을 배우는 이유5.2 예제: CBOW 임베딩 학습하기5.3 예제: 문서 분류에 사전 훈련된 임베딩을 사용한 전이 학습5.4 요약5.5 참고 문헌6장_자연어 처리를 위한 시퀀스 모델링 - 초급6.1 순환 신경망 소개6.2 예제: 문자 RNN으로 성씨 국적 분류하기6.3 요약6.4 참고 문헌7장_자연어 처리를 위한 시퀀스 모델링 - 중급7.1 엘만 RNN의 문제점7.2 엘만 RNN의 문제 해결책: 게이팅7.3 예제: 문자 RNN으로 성씨 생성하기7.4 시퀀스 모델 훈련 노하우7.5 참조 문헌8장_자연어 처리를 위한 시퀀스 모델링 - 고급8.1 시퀀스-투-시퀀스 모델, 인코더-디코더 모델, 조건부 생성8.2 강력한 시퀀스 모델링: 양방향 순환 모델8.3 강력한 시퀀스 모델링: 어텐션8.4 시퀀스 생성 모델 평가8.5 예제: 신경망 기계 번역8.6 요약9장_고전 모델, 최신 모델, 더 배울 것들9.1 지금까지 배운 내용9.2 전통적인 NLP 주제9.3 최신 NLP 모델9.4 NLP 시스템을 위한 디자인 패턴9.5 더 배울 것들9.6 참고 문헌