책소개
업계와 학계에서 다루는 가장 일반적인 생성형 AI 활용 사례와 작업을 이해할 수 있습니다!오늘날 기업은 자사의 제품과 서비스에 생성형 AI를 빠르게 도입하고 있다. 그러나 이 기술의 영향력과 잠재력에 대해 과장된 정보와 오해가 많이 존재한다. AWS의 크리스 프레글리, 안체 바르트, 셸비 아이겐브로데는 이 책에서 CTO, 머신러닝 실무자, 애플리케이션 개발자, 비즈니스 분석가, 데이터 엔지니어, 데이터 사이언티스트가 이 흥미로운 신기술을 실용적으로 활용하는 방법을 찾도록 도와준다.이 책을 통해 활용 사례 정의, 모델 선택, 모델 미세 조정, 검색 증강 생성, 인간 피드백을 통한 강화 학습, 모델 양자화, 최적화, 배포 등 생성형 AI 프로젝트의 생명 주기를 배울 수 있다. 또한 대규모 언어 모델(LLM), 이미지 생성을 위한 스테이블 디퓨전, 이미지 관련 질문에 답하는 Flamingo, IDEFICS 같은 멀티모달 모델 등 다양한 유형의 모델도 살펴본다.
저자소개
캘리포니아 샌프란시스코에 위치한 아마존 웹 서비스의 생성형 AI 부문 수석 솔루션 아키텍트이다. 그는 모든 AWS 인증을 보유하고 있다. 글로벌 Generative AI on AWS 밋업의 공동 창립자이기도 하며, 전 세계 AI 및 머신러닝 밋업과 콘퍼런스에서 정기적으로 강연한다. 이전에는 Databricks와 Netflix에서 엔지니어로 일하며, 확장성 있는 빅데이터 및 머신러닝 제품과 솔루션을 개발했다. 또한 『AWS 기반 데이터 과학』(한빛미디어, 2023)의 공동 저자이기도 하다.
목차
▣ 01장: 생성형 AI 활용 사례, 기본 사항 및 프로젝트 생명 주기활용 사례 및 작업파운데이션 모델 및 모델 허브생성형 AI 프로젝트의 생명 주기AWS에서의 생성형 AIAWS에서 생성형 AI를 사용하는 이유AWS에서 생성형 AI 애플리케이션 구축하기요약▣ 02장: 프롬프트 엔지니어링과 콘텍스트 내 학습프롬프트와 컴플리션토큰프롬프트 엔지니어링프롬프트 구조___인스트럭션___콘텍스트퓨샷 추론으로 콘텍스트 내 학습___제로샷 추론___원샷 추론___퓨샷 추론___콘텍스트 내 학습이 잘못된 사례___콘텍스트 내 학습 모범 사례프롬프트 엔지니어링 모범 사례추론 구성 매개변수요약▣ 03장: 대형 언어 파운데이션 모델대형 언어 파운데이션 모델토크나이저임베딩 벡터트랜스포머 아키텍처___입력과 콘텍스트 윈도___임베딩 레이어___인코더___셀프 어텐션___디코더___소프트맥스 출력트랜스포머 기반 파운데이션 모델 유형사전 학습 데이터 세트스케일링 법칙컴퓨팅 최적화 모델요약▣ 04장: 메모리와 연산 최적화메모리 문제데이터 유형 및 수치 정밀도양자화___fp16___bfloat16___fp8___int8셀프 어텐션 레이어 최적화___플래시 어텐션___그룹 쿼리 어텐션분산 컴퓨팅___분산 데이터 병렬 처리___완전 샤드 데이터 병렬 처리___DDP와 FSDP의 성능 비교AWS 분산 컴퓨팅___아마존 세이지메이커로 완전 샤드 데이터 병렬 처리___AWS 뉴런 SDK 및 AWS 트레이니엄요약▣ 05장: 미세 조정 및 평가인스트럭션 기반 미세 조정___Llama 2-Chat___Falcon-Chat___FLAN-T5인스트럭션 데이터 세트___다중작업 인스트럭션 데이터 세트___FLAN: 다중작업 인스트럭션 데이터 세트 예제___프롬프트 템플릿___사용자 정의 데이터 세트를 인스트럭션 데이터 세트로 변환하기인스트럭션 기반 미세 조정___아마존 세이지메이커 스튜디오___아마존 세이지메이커 점프스타트___허깅 페이스용 아마존 세이지메이커 Estimator평가___평가 지표___벤치마크 및 데이터 세트요약▣ 06장: 효율적인 매개변수 미세 조정(PEFT)완전 미세 조정과 PEFT 비교LoRA와 QLoRA___LoRA 기본 원리___순위___목표 모듈과 레이어___LoRA 적용___LoRA 어댑터와 원본 모델 병합___LoRA 어댑터 테넌트별 유지___완전 미세 조정과 LoRA 성능 비교___QLoRA프롬프트 튜닝과 소프트 프롬프트요약▣ 07장: 인간 피드백을 통한 강화 학습으로 미세 조정인간 가치 정렬(Human Alignment): 유용성, 정직성, 무해성강화 학습 개요맞춤형 보상 모델 학습하기___휴먼인더루프를 활용한 학습 데이터 수집___레이블러를 위한 지침 예시___인간이 단 주석을 수집하기 위한 아마존 세이지메이커 그라운드 트루스 활용하기___보상 모델을 학습하기 위한 순위 데이터 준비___보상 모델 학습하기기존 보상 모델: 메타의 유해성 판독기인간 피드백을 통한 강화 학습으로 미세 조정___RLHF에서 보상 모델 활용___근접 정책 최적화 강화 학습 알고리즘___PPO로 RLHF 미세 조정 수행___보상 해킹 완화___RLHF에서 효율적인 매개변수 미세 조정(PEFT) 활용RLHF로 미세 조정 모델 평가___정성적 평가___정량적 평가___평가 모델 가져오기___평가 지표 집계 함수 정의___RLHF 적용 전과 후 평가 지표 비교요약▣ 08장: 모델 배포 최적화모델 추론 최적화___가지치기___GPTQ 사후 학습 양자화___증류대규모 모델 추론 컨테이너AWS 인퍼런시아: 추론 전용 하드웨어모델 업데이트와 배포 전략___A/B 테스트___섀도 배포지표와 모니터링오토스케일링___오토스케일링 정책___오토스케일링 정책 정의요약▣ 09장: RAG와 에이전트를 활용한 맥락 인식 추론 애플리케이션대규모 언어 모델의 한계___환각___지식 단절RAG___외부 지식 소스___RAG 워크플로___문서 로딩___청킹___문서 검색과 순위 재정렬___프롬프트 증강RAG 오케스트레이션과 구현___문서 로딩과 청킹___벡터 임베딩 저장소와 검색___검색 체인___최대 한계 관련성(MMR)을 활용한 순위 재정렬에이전트___ReAct 프레임워크___프로그램 지원 언어 프레임워크생성형 AI 애플리케이션FMOps: 생성형 AI 프로젝트의 생명 주기 운영___실험 단계 고려 사항___개발 단계 고려 사항___운영 배포 단계 고려 사항요약▣ 10장: 멀티모달 파운데이션 모델활용 사례멀티모달 프롬프트 엔지니어링 활용 예시이미지 생성과 품질 향상___이미지 생성___이미지 편집 및 품질 향상인페인팅, 아웃페인팅, 뎁스 투 이미지___인페인팅___아웃페인팅___뎁스 투 이미지이미지 캡셔닝과 시각적 질의응답___이미지 캡셔닝___콘텐츠 조정___시각적 질의응답모델 평가___텍스트-이미지 생성형 작업___이미지-텍스트 생성형 작업___비언어적 추론확산 아키텍처 기본 사항___순방향 확산___역방향 확산___U-Net스테이블 디퓨전 2 아키텍처___텍스트 인코더___U-Net과 확산 과정___텍스트 컨디셔닝___교차 어텐션___스케줄러___이미지 디코더스테이블 디퓨전 XL 아키텍처___U-Net과 교차 어텐션___정제기___컨디셔닝요약▣ 11장: 스테이블 디퓨전을 통한 생성 제어와 미세 조정ControlNet미세 조정___드림부스___드림부스와 PEFT-LoRA___Textual Inversion인간 피드백을 통한 강화 학습으로 인간 가치 정렬요약▣ 12장: 아마존 베드록 - 생성형 AI 관리형 서비스베드록 파운데이션 모델___아마존 타이탄 파운데이션 모델___Stability AI의 스테이블 디퓨전 파운데이션 모델베드록 추론 API대규모 언어 모델___SQL 코드 생성___텍스트 요약___임베딩미세 조정에이전트멀티모달 모델___텍스트로 이미지 생성___이미지로 이미지 생성데이터 프라이버시와 네트워크 보안거버넌스와 모니터링요약