Kaggleとは?Kaggleに登録しよう(アカウント作成)

Kaggleとは

Kaggle(カグル)とは、企業とデータサイエンティストをつなぐ為のプラットフォームです。

実際に40万人以上のデータサイエンティストが集まり、自分のデータ解析のスキルを試す為に使っています。その形式は非常にシンプルです。まず、企業が自分たちの課題を提示します。それに対して、データサイエンティストたちが競い合い、より高い精度のモデルを競います。精度の高いモデルを作成することに成功したデータサイエンティストたちは賞金を得ることが出来ます。世界規模で見るとAmazon, Facebook, Walmartなどの企業が実際にコンペを実施していますが、日本でも徐々にその認知度は高まっています。本章では、そのKaggleを使う手順について学びます。

Kaggleアカウントの作成手順

Kaggleのアカウント作成はこちらから新規登録が出来ます。

Kaggleの使い方

登録を済ませたらログインして、参加したいcompetitionからデータセットを入手し、competitionに参加しましょう。ログインした後の画面からcompetitionを選択して好きなcompetitionを進めましょう。

Competition(コンペ)に参加する

Competition一覧はこのように表示されます。

competitionのそれぞれの項目で分かること

competitionには様々な項目がありますが、それぞれの意味を大まかに理解しておきましょう。

下の画面は「Titanic: Machine Learning from Disaster」の画面です。

このページでは、コンペの概要と、データの概要及びデータのダウンロード、他のKaggle参加者が共有したソースコードやコンペに関する議論、ルールなどを確認できます。

はじめてKaggleにチャレンジするには何から始めれば良いのか

はじめてKaggleに取り組まれる場合は、表形式のコンペかつ既に終了したコンペから取り組むのが良いでしょう。

オススメは、Kaggle Titanic号コンペとHouse priceコンペです。

【Kaggle】タイタニック号乗客データから生存者予測モデルを作ろう!

【Kaggle】住宅価格予測

まずは上記のコンペからチャレンジしてみてください。

次に上記のコンペでサブミッションまで進めることが出来れば、それぞれのコンペの順位を上げてましょう。

オススメのKaggle書籍3冊

Titanic号コンペと住宅価格コンペで順位をある程度まであげれたら、以下の3冊の書籍を読んでみてください。

実践Data Scienceシリーズ PythonではじめるKaggleスタートブック (KS情報科学専門書)

Kaggle Grandmasterに学ぶ 機械学習 実践アプローチ

Kaggleで勝つデータ分析の技術

3冊読んだら次に何すればよい?

上記3冊を読み終えたら、是非実際のコンペにチャレンジしてみましょう。

表形式のコンペ以外にも、画像やテキストデータのコンペにチャレンジするのもありです。

その際に参考になるのがこちらの本です。

Kaggleコンペティション チャレンジブック

また下記の記事も参考になります。

Kaggleに登録したら次にやること ~ これだけやれば十分闘える!Titanicの先へ行く入門 10 Kernel ~

おわりに

最後まで記事をお読み頂きありがとうございました。

この記事ではKaggleに登録する方法とKaggle入門する上でオススメの書籍などを紹介させて頂きました。

この記事が少しでも参考になりましたら幸いです。

機械学習を効率的に学ぶには

機械学習を独学で学ぶのは大変ですよね…。

そのように感じられた方は、まずはオンラインプログラムを利用するのが良いです。

AI Academy Bootcampでは6ヶ月データサイエンティストや機械学習エンジニアに質問し放題かつ、体系的に学べる動画コンテンツや440種類以上のテキストコンテンツで学べて35,000(税込)で受講出来ます。

是非サービスを活用し、効率よく、統計学や機械学習を身につけてみてください。

1 COMMENT

現在コメントは受け付けておりません。