Kaggleとは
Kaggle(カグル)とは、企業とデータサイエンティストをつなぐ為のプラットフォームです。
実際に40万人以上のデータサイエンティストが集まり、自分のデータ解析のスキルを試す為に使っています。その形式は非常にシンプルです。まず、企業が自分たちの課題を提示します。それに対して、データサイエンティストたちが競い合い、より高い精度のモデルを競います。精度の高いモデルを作成することに成功したデータサイエンティストたちは賞金を得ることが出来ます。世界規模で見るとAmazon, Facebook, Walmartなどの企業が実際にコンペを実施していますが、日本でも徐々にその認知度は高まっています。本章では、そのKaggleを使う手順について学びます。
Kaggleアカウントの作成手順
Kaggleのアカウント作成はこちらから新規登録が出来ます。
Kaggleの使い方
登録を済ませたらログインして、参加したいcompetitionからデータセットを入手し、competitionに参加しましょう。ログインした後の画面からcompetitionを選択して好きなcompetitionを進めましょう。
Competition(コンペ)に参加する
Competition一覧はこのように表示されます。
competitionのそれぞれの項目で分かること
competitionには様々な項目がありますが、それぞれの意味を大まかに理解しておきましょう。
下の画面は「Titanic: Machine Learning from Disaster」の画面です。
このページでは、コンペの概要と、データの概要及びデータのダウンロード、他のKaggle参加者が共有したソースコードやコンペに関する議論、ルールなどを確認できます。
はじめてKaggleにチャレンジするには何から始めれば良いのか
はじめてKaggleに取り組まれる場合は、表形式のコンペかつ既に終了したコンペから取り組むのが良いでしょう。
オススメは、Kaggle Titanic号コンペとHouse priceコンペです。
【Kaggle】タイタニック号乗客データから生存者予測モデルを作ろう!
まずは上記のコンペからチャレンジしてみてください。
次に上記のコンペでサブミッションまで進めることが出来れば、それぞれのコンペの順位を上げてましょう。
オススメのKaggle書籍3冊
Titanic号コンペと住宅価格コンペで順位をある程度まであげれたら、以下の3冊の書籍を読んでみてください。
①実践Data Scienceシリーズ PythonではじめるKaggleスタートブック (KS情報科学専門書)
②Kaggle Grandmasterに学ぶ 機械学習 実践アプローチ
3冊読んだら次に何すればよい?
上記3冊を読み終えたら、是非実際のコンペにチャレンジしてみましょう。
表形式のコンペ以外にも、画像やテキストデータのコンペにチャレンジするのもありです。
その際に参考になるのがこちらの本です。
また下記の記事も参考になります。
Kaggleに登録したら次にやること ~ これだけやれば十分闘える!Titanicの先へ行く入門 10 Kernel ~
おわりに
最後まで記事をお読み頂きありがとうございました。
この記事ではKaggleに登録する方法とKaggle入門する上でオススメの書籍などを紹介させて頂きました。
この記事が少しでも参考になりましたら幸いです。
機械学習を効率的に学ぶには
機械学習を独学で学ぶのは大変ですよね…。
そのように感じられた方は、まずはオンラインプログラムを利用するのが良いです。
AI Academy Bootcampでは6ヶ月データサイエンティストや機械学習エンジニアに質問し放題かつ、体系的に学べる動画コンテンツや440種類以上のテキストコンテンツで学べて35,000(税込)で受講出来ます。
是非サービスを活用し、効率よく、統計学や機械学習を身につけてみてください。
[…] 未経験から、AIエンジニアを目指す場合は、AI関連の資格取得や、Kaggleなどのデータ分析コンペで上位入賞を目指したり、ポートフォリオとなる何らかのサービス開発を行うと転職時に非常に有利に立てます。 […]