상세정보
미리보기
LLM과 RAG로 구현하는 AI 애플리케이션
- 저자
- 대니얼 김,김현지,에디 유 공저
- 출판사
- 위키북스
- 출판일
- 2025-08-22
- 등록일
- 2025-10-20
- 파일포맷
- PDF
- 파일크기
- 10MB
- 공급사
- YES24
- 지원기기
-
PC
PHONE
TABLET
웹뷰어
프로그램 수동설치
뷰어프로그램 설치 안내
책소개
검색 증강 생성(RAG), 펑션 콜링, 에이전트, 벡터 스토어, 그리고 최신 프레임워크 MCP까지!『LLM과 RAG로 구현하는 AI 애플리케이션』은 빠르게 진화하는 AI 기술 트렌드를 단순히 따라가는 데 그치지 않고 실제 구현과 통합에 필요한 핵심 통찰과 실용적인 해법을 제시하는 완성도 높은 실무 가이드이다. 생성형 AI 기술의 주요 흐름을 실무 관점에서 체계적으로 다뤄 개발자와 기획자 모두가 RAG 시스템을 손쉽게 구축할 수 있도록 구성했다. 독자는 라마인덱스를 활용하여 문서 처리, 벡터 인덱싱, 쿼리 라우팅 등 복잡한 구성 요소를 유연하게 조합하고 직관적으로 연결하는 방법을 익힐 수 있을 것이다.
저자소개
자연어 처리 분야의 AI 리서치 엔지니어로, LLM 기반 생성형 모델, RAG, 에이전트 시스템에 주로 관심이 있습니다. 복합 질의 처리, 지식 활용 최적화, 상호작용 기반 응답 설계 등 실전 응용에 초점을 맞춘 연구 및 구현 경험을 쌓아왔습니다. 기술적 깊이와 실무 적용 가능성을 함께 고려하는, 균형 잡힌 접근을 지향합니다.
목차
01장: 라마인덱스 들어가기 1.1 라마인덱스가 지원하는 작업 1.2 라마인덱스 사용 환경 구축하기 __1.2.1 윈도우에서 파이썬 설치하기 __1.2.2 가상 환경 만들기 __1.2.3 비주얼 스튜디오 코드 설치하기 __1.2.4 OpenAI API 키 발급하기 __1.2.5 제미나이 API 키 발급하기 __1.2.6 환경 변수에 API 키 추가하기 1.3 라마인덱스 맛보기 __1.3.1 데이터 준비하기 __1.3.2 가상 환경에 라마인덱스 설치하기 __1.3.3 라마인덱스 실행하기 02장: 라마인덱스 파이프라인 2.1 개발 환경 구축하기 2.2 데이터 로딩 __2.2.1 데이터 리더 __2.2.2 데이터 커넥터 2.3 텍스트 분할 __2.3.1 문서와 노드 __2.3.2 토큰 단위 분할 __2.3.3 문장 단위 분할 __2.3.4 의미 단위 분할 __2.3.5 텍스트 분할 비교 2.4 인덱싱 __2.4.1 인덱싱이란? __2.4.2 벡터 저장소 인덱스 __2.4.3 Top-K 검색 2.5 저장하기 2.6 쿼리 __2.6.1 쿼리 엔진(QueryEngine) __2.6.2 검색(Retrieval) __2.6.3 후처리(Postprocessing) __2.6.4 응답 합성(Response synthesis) __2.6.5 커스터마이징 03장: 벡터 스토어 3.1 개발 환경 구축하기 3.2 크로마 __3.2.1 크로마 클라이언트 생성 __3.2.2 컬렉션 생성 __3.2.3 벡터 데이터 추가 __3.2.4 벡터 검색 __3.2.5 메타데이터 필터링 __3.2.6 임베딩 데이터 추가 __3.2.7 임베딩 데이터 검색 __3.2.8 크로마의 저장 방식 __3.2.9 임베딩 기반 라마인덱스 답변 생성 __3.2.10 라마인덱스 기반 답변 생성 3.3 파인콘 __3.3.1 파인콘 API 초기화 __3.3.2 벡터 데이터 추가 __3.3.3 벡터 검색 __3.3.4 메타데이터 필터링 __3.3.5 임베딩 기반 라마인덱스 답변 생성 __3.3.6 라마인덱스 기반 답변 생성(임베딩 생략) 3.4 쿼드런트 __3.4.1 라마인덱스 기반 답변 생성 __3.4.2 도커를 활용한 로컬 기반 환경 설정 __3.4.3 클라우드 기반 환경 설정 04장: 텍스트 문서를 이용한 RAG 실습 4.1 개발 환경 구축하기 4.2 실습용 데이터 준비 4.3 PDF 파일 다루기 __4.3.1 데이터 준비 __4.3.2 텍스트 분할 __4.3.3 인덱싱 __4.3.4 쿼리 실행 4.4 텍스트 파일 다루기 __4.4.1 기본 RAG 실습 __4.4.2 인덱스 저장: 크로마 사용하기 4.5 CSV 파일 다루기 4.6 HWP 파일 다루기 __4.6.1 HWPReader 이용하기 __4.6.2 SimpleDirectoryReader 이용하기 05장: 다중모달 RAG 실습 5.1 개발 환경 구축하기 5.2 데이터 준비하기 5.3 OpenAI API로 다중모달 벡터 인덱싱하기 5.4 쿼드런트를 활용한 다중모달 RAG 구축하기 __5.4.1 쿼드런트 설치 및 클라이언트 설정 __5.4.2 텍스트 및 이미지 벡터 스토어 생성 __5.4.3 다중모달 벡터 인덱스 생성 __5.4.4 검색 5.5 질의응답 기반 RAG 시스템 구축 __5.5.1 기본 질의 실행 __5.5.2 개선된 프롬프트를 활용한 질의 실행 5.6 이미지 기반 RAG 시스템 구축 __5.6.1 새로운 이미지 내려받기 및 저장하기 __5.6.2 이미지 검색 수행 __5.6.3 비슷한 화풍을 가진 이미지 분석 06장: 에이전트 RAG 6.1 개발 환경 구축하기 6.2 데이터 준비 6.3 허깅페이스 임베딩 6.4 에이전트 만들기 07장: 고급 RAG(Advanced RAG) 7.1 개발 환경 구축하기 7.2 리랭킹(ReRanking) __7.2.1 LLM 기반의 리랭킹 7.3 LLM 기반 리랭킹의 비용 문제 __7.3.1 크로스 인코더 기반의 리랭킹 7.4 하이드(Hyde) __7.4.1 데이터 준비 __7.4.2 거대 언어 모델과 임베딩 설정 __7.4.3 하이드 구현하기 08장: 펑션 콜링 에이전트 8.1 개발 환경 구축하기 8.2 펑션 콜링 작동 방식 이해하기 8.3 외부 API를 활용한 펑션 콜링 __8.3.1 증시 정보 호출 에이전트 만들기 __8.3.2 펑션 콜링 도구 준비 __8.3.3 에이전트 만들고 쿼리 실행하기 8.4 펑션 콜링으로 구현하는 RAG 에이전트 __8.4.1 환경 세팅과 데이터 준비 __8.4.2 펑션 콜링 도구 준비 __8.4.3 에이전트 생성과 쿼리 실행 09장: Text-to-SQL로 구현하는 상담사 에이전트 9.1 개발 환경 구축하기 9.2 에이전트 개발을 위한 환경 설정 9.3 병원 데이터베이스 설계하기 9.4 Text-to-SQL 에이전트 구현하기 9.5 멀티턴 대화 처리 기법 9.6 그라디오를 이용한 사용자 인터페이스 10장: MCP(Model Context Protocol) 10.1 MCP란 10.2 Model Context Protocol 개발 환경 구축하기 10.3 MCP 서버 __10.3.1 어댑터(Adapter)를 활용한 툴 등록 __10.3.2 MCP 인스펙터(Inspector) __10.3.3 메시지 형식 __10.3.4 문서 검색 에이전트 MCP 실습 10.4 MCP 클라이언트 10.5 날씨 에이전트 실습 __10.5.1 OpenWeatherMap API 키 발급받기 __10.5.2 도시명 추출하기 __10.5.3 OpenWeatherMap API 연동 __10.5.4 MCP 도구 등록 및 서버 실행 __10.5.5 MCP 클라이언트 구현하기: 날씨 질문하기 __10.5.6 정리