캐글 가이드
전 세계 데이터 과학자와 경쟁하면서 실력을 키우는 플랫폼 캐글!
캐글에서 활동하고 싶은 데이터 과학자를 위한 ‘얇지만 내공 있는 책’
캐글은 전 세계 데이터 과학자가 모여 자신의 실력을 겨루고 상금과 명성을 얻는 경진 대회 플랫폼으로 알려져 있다. 그런데 캐글은 단순히 경진 대회만 열리는 공간이 아닙니다. 데이터 과학을 공부하는 공간, 다양한 기술과 지식을 공유하는 공간, 회사에 필요한 인재를 찾는 공간 등 경진 대회 이외에도 유용한 서비스가 많다. 캐글을 데이터 과학자의 ‘포털 사이트’라고 소개하는 사람이 있는 이유이기도 하다.
『캐글 가이드』는 캐글을 처음 접하는 사람이 캐글에서 무엇을 해야 하는지를 압축해서 알려주는 가이드이다. 경진 대회에 참가하는 요령과 주요 사례 소개는 기본이고, 자칫 놓치기 쉬운 유용한 캐글 서비스를 알려준다. 또한 여러 데이터 과학자와 소통하는 방법과 캐글 고수가 되는 노하우도 소개한다. 이 책을 읽은 후에는 캐글이라는 플랫폼에서 효율적으로 활동하는 방법을 자연스럽게 익힐 것이다.
IT 스타트업에서 모바일 앱을 개발했으며 현재는 이에라에 시큐리티에서 에지 인공지능을 개발 중이다. IT 개발자는 장소와 상관없이 자유롭게 일하면서 무에서 가치가 있는 결과물을 만드는 사람이라는 신념이 있다. 이 신념 아래 새로운 사회와 시대에 도움이 되는 프로그램을 만들려고 늘 고민하는 삶을 사는 중이다.
1장 캐글 소개
01 캐글이란 무엇인가
캐글이란
캐글링하기
02 캐글 활용 사례
데이터 분석 인프라로 활용하기
회사 연수에 활용하기
캐글러에게 질문하기
03 다양한 경진 대회
학습용 경진 대회
정기 경진 대회
특수한 데이터를 다루는 경진 대회
특수한 규칙을 따르는 경진 대회
2장 캐글 시작하기
04 캐글 첫걸음
캐글 계정 만들기
캐글의 교육 과정 경험하기
05 캐글 컨트리뷰터 되기
캐글의 사용자 프로필 페이지
캐글러 등급
컨트리뷰터
캐글러의 교류
경진 대회 참가하기
컨트리뷰터가 되었는지 확인하기
3장 노트북 자유자재로 다루기
06 노트북
SaaS 기반 머신러닝 개발 환경
07 노트북 사용하기
스크립트 타입으로 사용하기
노트북 타입으로 사용하기
08 노트북 능숙하게 다루기
노트북 설정하기
데이터 세트 사용하기
외부 코드 사용하기
4장 캐글의 경진 대회
09 경진 대회와 노트북
경진 대회에서 노트북의 역할
경진 대회의 진행 흐름에 따른 노트북 분류
10 다양한 경진 대회
다양한 경진 대회 소개
공개 노트북 중심으로 경진 대회 살펴보기
실제 경진 대회의 진행 흐름
경진 대회 노트북의 발전 흐름
11 경진 대회의 세부 사항
경진 대회의 세부 사항이 중요한 이유
경진 대회의 별도 규칙
경진 대회 종료 후
5장 캐글 마스터 지향하기
12 경진 대회 규칙 이해하기
경진 대회 규칙 확인하기
노트북 전용 경진 대회
노트북 전용 경진 대회 사례
노트북 전용 경진 대회의 특별 규칙
13 데이터를 더 잘 이해하기
데이터를 잘 이해해야 하는 이유
Santander Value Prediction Challenge 사례 살펴보기
14 최신 기술 살펴보기
종료한 경진 대회에서 기술 흐름 살펴보기
머신러닝 모델의 튜닝 방법 살펴보기
15 캐글 제대로 활용하기
공개 데이터 세트 활용하기
데이터 세트에서 사용하는 파일 알아보기
캐글 API
캐글 API로 머신러닝 실행하기
부록 캐글에서 자주 사용하는 머신러닝 라이브러리와 프레임워크
16 LightGBM 사용하기
LightGBM
LightGBM 예제 코드
LightGBM 파라미터
17 fast.ai 사용하기
fast.ai
fast.ai를 사용한 이미지 인식 예제 코드
예제 코드 살펴보기
torchVision 사용하기
모델을 테스트하고 경진 대회에 제출할 결과 저장하기