상세정보
미리보기
데싸노트의 실전에서 통하는 머신러닝
- 저자
- 권시현 저
- 출판사
- 골든래빗
- 출판일
- 2022-07-08
- 등록일
- 2022-08-24
- 파일포맷
- PDF
- 파일크기
- 4MB
- 공급사
- YES24
- 지원기기
-
PC
PHONE
TABLET
웹뷰어
프로그램 수동설치
뷰어프로그램 설치 안내
책소개
★ 실전은 피처 엔지니어링이다★ 뉴욕의 데이터 사이언티스트가 알려주는★ 머신러닝 문제풀이 해법을 익혀라이 책은 실무와 캐글 챌린지에도 통하는 10가지 각 알고리즘을 엄선해 머신러닝을 알려준다. 콜롬비아 대학교 대학원생 튜터로, 패스트캠퍼스 데이터분석 강사와 스터디 리더로 활동한 저자는 데이터 분석을 바탕으로 한 코딩에 집중할 때 학습 능률이 더 오르는 것을 발견했다. 그래서 각 알고리즘을 ‘기초 지식 → 데이터 분석 → 전처리 → 모델링 평가 → 알고리즘 깊이 이해하기’ 순서로 격파해나간다. 무엇보다 더 나은 성과를 얻는 핵심 기술인 데이터를 분석하고 처리하는 피처 엔지니어링에 공을 들였다. 이 책을 읽고 나면 독자 스스로가 데이터에 알맞은 문제풀이 해법을 고안할 수 있게 될 것다.* 이 책은 객체지향 개념이 있는 프로그래밍 언어를 적어도 하나를 익힌 분을 대상으로 합니다. 파이썬은 1장에서 알려주므로 몰라도 됩니다.
저자소개
삼성전자에 마케팅 직군으로 입사하여 앱스토어 결제 데이터를 운영 및 관리했다. 데이터에 관심이 생겨 미국으로 유학을 떠나 지금은 모바일 서비스 업체 IDT에서 데이터 사이언티스트로 일한다. 문과 출신이 미국 현지 데이터 사이언티스트가 되기까지 파이썬과 머신러닝을 배우며 많은 시행착오를 겪었다. 겪었던 시행착오를 덜고, 머신러닝에 대한 재미를 전달하고자 유튜버로 활동하고 책을 집필한다.
현) IDT Corporation (미국 모바일 서비스 업체) 데이터 사이언티스트
전) 콜롬비아 대학교, Machine Learning Tutor, 대학원생 대상
전) 콜롬비아 대학교, Big Data Immersion Program Teaching Assistant
전) 콜롬비아 대학교, M.S. in Applied Analytics
전) 삼성전자 무선사업부, 스마트폰 데이터 분석가
전) 삼성전자 무선사업부, 모바일앱 스토어 데이터 관리 및 운영
강의 경력 : 패스트캠퍼스 [파이썬을 활용한 이커머스 데이터 분석 입문]
유튜브 [데싸노트] 채널을 운영 중이다.
목차
00장 실습 환경 안내(코랩)1단계 : 배경지식 익히기01장 한눈에 살펴보는 머신러닝__1.1 인공지능, 머신러닝, 딥러닝__1.2 머신러닝 기법 : 지도 학습, 비지도 학습, 강화 학습__1.3 머신러닝 프로세스__1.4 TOP 10 알고리즘의 성능 비교__1.5 머신러닝 핵심 라이브러리__1.6 데이터 시각화 그래프 종류__1.7 피처 엔지니어링 기법__1.8 변수란 무엇인가?학습 마무리02장 파이썬 기초 익히기__2.1 프로그래밍 기본 : 산술 연산, 변수, 출력__2.2 자료형과 자료구조__2.3 반복문 : for문, while문__2.4 조건문 : if문__2.5 파이썬 내장 함수__2.6 나만의 함수 만들기 : def학습 마무리03장 유용한 라이브러리 : 판다스와 넘파이__3.1 판다스__3.2 넘파이학습 마무리2단계 : 답을 알려줘야 학습하는 머신러닝 지도학습 알고리즘04장 선형 회귀 : 보험료 예측하기__4.1 문제 정의 : 한눈에 보는 예측 목표__4.2 라이브러리 및 데이터 불러오기__4.3 데이터 확인하기__4.4 전처리 : 학습셋과 시험셋 나누기__4.5 모델링__4.6 모델을 활용해 예측하기__4.7 예측 모델 평가하기__4.8 이해하기 : 선형 회귀학습 마무리연습 문제05장 로지스틱 회귀 : 타이타닉 생존자 예측하기__5.1 문제 정의 : 한눈에 보는 예측 목표__5.2 라이브러리 및 데이터 불러오기__5.3 데이터 확인하기__5.4 전처리 : 범주형 변수 변환하기(더미 변수와 원-핫 인코딩)__5.5 모델링 및 예측하기__5.6 예측 모델 평가하기__5.7 이해하기 : 피처 엔지니어링__5.8 이해하기 : 로지스틱 회귀학습 마무리연습 문제06장 K-최근접 이웃(KNN) : 와인 등급 예측하기__6.1 문제 정의 : 한눈에 보는 예측 목표__6.2 라이브러리 및 데이터 불러오기__6.3 데이터 확인하기__6.4 목푯값에서 고윳값 확인하기__6.5 전처리 : 결측치 처리하기__6.6 스케일링__6.7 모델링 및 예측/평가하기__6.8 하이퍼파라미터 튜닝하기__6.9 이해하기 : K-최근접 이웃학습 마무리연습 문제07장 나이브 베이즈 : 스팸 여부 판단하기__7.1 문제 정의 : 한눈에 보는 예측 목표__7.2 라이브러리 및 데이터 불러오기 & 데이터 확인__7.3 전처리 : 특수 기호 제거하기__7.4 전처리 : 불용어 제거하기__7.5 전처리 : 목표 컬럼 형태 변경하기__7.6 전처리 : 카운트 기반으로 벡터화하기__7.7 모델링 및 예측/평가하기__7.8 이해하기 : 나이브 베이즈 모델학습 마무리연습 문제08장 결정 트리 : 연봉 예측하기__8.1 문제 정의 : 한눈에 보는 예측 목표__8.2 라이브러리 및 데이터 불러오기, 데이터 확인하기__8.3 전처리 : 범주형 데이터__8.4 전처리 : 결측치 처리 및 더미 변수 변환__8.5 모델링 및 평가하기__8.6 이해하기 : 결정 트리__8.7 오버피팅 문제__8.8 매개변수 튜닝__8.9 트리 그래프학습 마무리연습 문제09장 랜덤 포레스트 : 중고차 가격 예측하기__9.1 문제 정의 : 한눈에 보는 예측 목표__9.2 라이브러리 및 데이터 불러오기, 데이터 확인하기__9.3 전처리 : 텍스트 데이터__9.4 전처리 : 결측치 처리와 더미 변수 변환__9.5 모델링 및 평가하기__9.6 이해하기 : K-폴드 교차검증__9.7 이해하기 : 랜덤 포레스트__9.8 하이퍼파라미터 튜닝학습 마무리연습 문제10장 XGBoost : 커플 성사 여부 예측하기__10.1 문제 정의 : 한눈에 보는 예측 목표__10.2 라이브러리 및 데이터 불러오기, 데이터 확인하기__10.3 전처리 : 결측치 처리__10.4 전처리 : 피처 엔지니어링__10.5 모델링 및 평가__10.6 이해하기 : 경사하강법__10.7 하이퍼파라미터 튜닝 : 그리드 서치__10.8 중요 변수 확인__10.9 이해하기 : XGBoost학습 마무리연습 문제11장 LightGBM : 이상거래 예측하기__11.1 문제 정의 : 한눈에 보는 예측 목표__11.2 라이브러리 및 데이터 불러오기, 데이터 확인하기__11.3 전처리 : 데이터 클리닝__11.4 전처리 : 피처 엔지니어링__11.5 모델링 및 평가하기__11.6 하이퍼파라미터 튜닝 : 랜덤 그리드 서치__11.7 LightGBM의 train( ) 함수 사용하기__11.8 이해하기 : LightGBM학습 마무리연습 문제3단계 : 답을 스스로 찾는 비지도학습 알고리즘12장 K-평균 군집화 : 비슷한 속성끼리 분류하기__12.1 문제 정의 : 한눈에 보는 예측 목표__12.2 K-평균 군집화 맛보기 : 인위적으로 만든 데이터셋__12.3 데이터 불러오기 및 데이터 확인하기 : 고객 데이터셋__12.4 전처리 : 피처 엔지니어링__12.5 고객 데이터 모델링 및 실루엣 계수__12.6 최종 예측 모델 및 결과 해석__12.7 이해하기 : K-평균 군집화학습 마무리연습 문제13장 주성분 분석(PCA) : 차원 축소 응용하기__13.1 차원을 축소해서 그래프 그리기 : 고객 데이터셋__13.2 속도와 예측력을 향상시키기 : 익명 데이터셋__13.3 이해하기 : 주성분 분석학습 마무리연습 문제