책소개
생성형 AI의 개요와 함께 LangChain 프레임워크를 사용한 실질적인 구현 사례까지 모두 10개의 장으로 구성해 포괄적으로 제공하는 책이다. 1장은 생성형 AI가 텍스트, 이미지, 그리고 비디오 처리를 어떻게 혁신적으로 변화시키는지 설명한다. 이 장에서는 LLM(Large Language Model, 거대 언어 모델) 등의 생성 모델을 소개하며, 그 잠재력을 자세히 살펴본다. 2장에서는 LangChain의 프레임워크를 활용한다. 낡은 지식, 행동 제한 그리고 환각의 위험과 같은 한계를 다루며, LangChain이 외부 데이터와 개입을 통합해 더 일관된 AI 응용 프로그램을 어떻게 구현하는지 설명한다.3장은 환경 설정의 기본 지식을 다루며, Docker, Conda, Pip, Poetry 설치 안내부터 시작한다. OpenAI의 ChatGPT와 Hugging Face와 같은 다양한 공급 업체로부터 모델을 통합하는 방법에 대한 내용과 필요한 API 키를 얻는 과정을 설명한다. 4장에서는 정보 추출을 위한 밀도 체인(Chain of Density)을 알아보고, LangChain 데코레이터(decorator)와 표현 언어에 대한 논의를 통해 사용자 맞춤형 행동을 정의하는 방법을 설명한다. 5장은 ChatGPT와 같은 챗봇의 능력을 향상시키기 위해 검색 증강 생성(RAG, Retrieval-Augmented Generation)과 같은 방법을 설명한다. 6장은 소프트웨어 개발에서 부상하는 LLM의 역할을 조사하며, AI가 코딩 작업을 자동화하고 동적 코딩 비서로서의 역할 가능성을 알아본다. 7장은 생성형 AI와 데이터 과학의 공통점을 탐색하며, LLM이 생산성을 향상시키고 과학적 발견을 촉진할 수 있는 잠재력을 살펴본다. 8장은 미세 조정(fine-tuning)과 프롬프팅(prompting)과 같은 조건화 기술을 알아본다. 9장은 LLM을 실제 응용 프로그램 내에서 배치하는 데 있어서의 복잡성을 다루며, 성능 보장, 규제 요구 사항 충족, 규모에 대한 강건성 및 효과적인 모니터링을 위한 모범 사례를 살펴본다. 10장은 생성형 AI의 잠재적인 발전과 사회 기술적 도전에 대해 자세히 알아본다.
저자소개
컴퓨터 신경과학 박사 학위를 가진 경험이 풍부한 데이터 과학 리더다. 테라바이트 단위의 데이터를 분석하고 최대 64k 코어를 갖춘 슈퍼 컴퓨터에서 뇌 활동을 시뮬레이션하며, 실험을 설계하고 수행했다. 보험 적용 응용을 처리하는 제품화 시스템을 구축했고, 수백만 건의 문서에 대해 신경망을 훈련시켰다. 『Machine Learning for Time-Series』(Packt, 2021)와 『Artificial Intelligence with Python Cookbook Python』(Packt, 2020)의 저자이며, 현재는 헤이스팅스 다이렉트(Hastings Direct)에서 보험 분야에 몸담고 있다.
목차
1장. 생성형 AI란 무엇인가?__생성형 AI 소개____생성 모델이란 무엇인가?____왜 지금인가?__LLM의 이해____GPT란 무엇인가?____다른 LLM____주요 플레이어____GPT 모델은 어떻게 작동할까?______사전 훈련______토큰화______스케일링______조건화____이러한 모델을 시험하는 방법__텍스트 투 이미지 모델이란?__다른 영역에서 AI가 할 수 있는 일__요약 __문제2장. LLM 응용을 위한 LangChain__확률적 앵무새를 넘어서____LLM의 한계는 무엇인가?____LLM의 한계를 완화하는 방법____LLM 응용이란 무엇인가? __LangChain이란 무엇인가?__LangChain의 핵심 요소 탐색____체인이란 무엇인가?____에이전트는 무엇인가?____메모리는 무엇인가?____도구란 무엇인가?__LangChain의 작동 원리__LangChain과 다른 프레임워크와의 비교__요약__문제3장. LangChain으로 시작하기__이 책을 위한 종속성 설정 방법____pip____Poetry____Conda____Docker__API 모델 통합 탐색____가짜 LLM____OpenAI____Hugging Face____Google Cloud Platform____Jina AI____Replicate____그 외____애저____Anthropic__로컬 모델 탐색____Hugging Face Transformers____llama.cpp____GPT4ALL__고객 서비스를 위한 애플리케이션 구축__요약__문제4장. 능력 있는 비서 구축__팩트 체크를 통한 환각 완화__정보 요약____기본 프롬프팅____프롬프트 템플릿____밀도 체인 ____맵 리듀스 파이프라인____토큰 사용량 모니터링__문서에서 정보 추출__툴을 사용한 질문 응답____툴을 사용한 정보 검색____시각 인터페이스 구축__추론 전략 탐색__요약__문제5장. ChatGPT 같은 챗봇 구축__챗봇이란 무엇인가?__검색과 벡터의 이해____임베딩____벡터 저장소______벡터 인덱싱______벡터 라이브러리______벡터 데이터베이스__LangChain에서의 로딩 및 검색____문서 로더____LangChain에서 검색기______kNN 검색기______PubMed 검색기______맞춤형 검색기__챗봇 구현____문서 로더____벡터 저장소____메모리______대화 버퍼______대화 요약 기억______지식 그래프 저장______여러 메모리 메커니즘의 병합______장기 일관성__응답 중재__요약__문제6장. 생성형 AI를 이용한 소프트웨어 개발__소프트웨어 개발과 AI____코드 LLM__LLM을 사용한 코드 작성____StarCoder____StarChat____LLaMa 2____소형 로컬 모델__소프트웨어 개발 자동화__요약__문제7장. 데이터 과학을 위한 LLM__생성 모델이 데이터 과학에 미치는 영향__자동화된 데이터 과학____데이터 수집____시각화와 탐색적 데이터 분석____전처리와 특징 추출____AutoML__데이터 과학 질문에 답하기 위한 에이전트 사용__LLM을 사용한 데이터 탐색__요약__질문8장. LLM 사용자 정의 및 출력__LLM 조건화____조건화 기법______인간 피드백을 가미한 강화학습______LoRA______추론 시간 조건화__미세 조정____미세 조정 설정____오픈 소스 모델____상업용 모델__프롬프트 공학____프롬프트 기술______제로샷 프롬프팅______퓨샷 러닝______CoT 프롬프팅______자기 일관성______ToT__요약__문제9장. 생성형 AI 제품화__LLM 애플리케이션의 제품화를 준비하는 방법____용어__LLM 앱을 평가하는 방법____두 출력 비교____기준 대비 비교____문자열과 문맥 비교____데이터셋을 대상으로 한 평가 수행__LLM 앱을 배포하는 방법____FastAPI 웹서버____Ray__LLM 앱을 관찰하는 방법____관찰 반응____관측성 도구____LangSmith____PromptWatch__요약__문제10장. 생성형 모델의 미래__생성형 AI의 현 상태____도전 과제____모델 개발에서의 추세____빅테크 대 소기업____AGI__경제적 결과____창의적 산업과 광고____교육____법률____제조____의학____군사__사회적 함의____오정보와 사이버보안____규제와 실행의 어려움__앞으로의 길