【初心者向け】独学でデータサイエンティストになるには? 勉強時間や0からのロードマップについて解説!

はじめに

前回の記事ではデータサイエンティストとはどのような職業か、どのようなスキルが求められるのかなどを解説いたしました。

データサイエンティストとは、分析したデータに基づいて、企業の経営課題を解決するための戦略立案や、意思決定者をサポートするビジネススキルとデータ分析スキルを兼ね備えた人材であると説明しました。

また、データサイエンティストには「ビジネススキル」と「データサイエンススキル」と「データエンジニアリングスキル」の3つが求められることも説明しました。

この記事では、独学でデータサイエンティストになるの勉強方法や、勉強時間、0からのロードマップについて解説いたします。

6ヶ月間 データサイエンティストに質問し放題の環境で学びたい方へ

独学ではなく、データサイエンティストから直接質問できる環境で、学びたい方は、6ヶ月35,000円のオンラインプログラム(動画プラン)の受講をご検討ください。他にも未経験から6ヶ月かけてデータサイエンティストを目指すためのAI人材プランもございます。詳細はこちら

データサイエンティストになるために知っていてほしいこと

この節では、まずはじめに、データサイエンティストを目指す上で知っておいてほしいことをお伝えいたします。

それは、アルバイトやインターンなどで、仕事を経験してしまうのが最も最短かつ効率的であるということす。

※データサイエンティストを目指す上で、この記事を読んでいる読者様によって伝える内容は異なってしまうのが正直なところですので、想定読者を「プログラミング初学者かつ未経験の方」とさせて頂きます。

既に読者の方で、大学の授業でコンピュータサイエンスや統計、機械学習などを専門に学ばれている学生であれば、繰り返しになりますが、アルバイトやインターンなどで、仕事を経験してしまうのが最も効率的です。求人サイトやインターン募集している企業を探し、面接を受けてみましょう。並行して、足りないスキルを学ぶのが良いです。ただし、体系的にデータサイエンティストに必要なスキルを身に付けたいなどであれば、本記事の内容は多少お役に立てるかもしれません。

一方で、この記事の対象読者としている「初学者かつ未経験の方」がデータサイエンティストを目指す上でどのような勉強で進めれば良いのか解説いたします。

先に身も蓋もないことを言ってしまってモチベーションが下がってしまう方もいらっしゃるかもしれませんが、データサイエンティストを未経験から目指すとなると非常にハードルが高いです。簡単にデータサイエンティストになることは難しいため、その点理解頂けると幸いです。

前回の記事でも説明させていただきましが、データサイエンティストに求められるスキルが高度なため、1、2月程度で身につくものではないです。半年から少なくとも一年で分析業務に携われるのであればそれはすごいことであり、人によっては数年かかってしまうこともあります。

そのため、いかに効率よく必要なスキルを順に身につけていくかがポイントになります。

プログラミング初学者の場合、主にPythonをある程度自由に使いこなせる必要がありますし、数学や統計学の知識も求められます。学生時代に数学に苦手意識を持たれていた場合、必要に応じて中学数学からやり直す必要も出てきます。

この記事では1年間を目安に以下のロードマップでデータサイエンティストに必要な「データサイエンススキル」と「データエンジニアリングスキル」の2つに焦点を絞った勉強方法を解説していきます。

データサイエンティスト(アソシエート)になるために必要な勉強時間

データサイエンティスト協会では、データサイエンティストのスキルレベル表を公開しています。

スキルレベルには、以下のレベルに分けられます。

アシスタント★、アソシエート★★、フル★★★、シニア★★★★

アシスタントデータサイエンティストは見習いレベルであり、シニアデータサイエンティストは業界を代表するレベルになります。

この中でも、特にアシスタントの次のレベルである、アソシエート(独り立ちレベル)になるために必要な勉強時間をお伝えします。

結論から言ってしまうと、あくまでも目安程度に考えていただきたいのですが、300〜600時間は必要になります。

1日に3時間程度の学習を6ヶ月ほど続けることで、約600時間の勉強時間を達成できます。

データサイエンティストに必要なスキルは「データサイエンティスト スキルチェックリスト ver.3」を参考にしてみてください。

https://www.datascientist.or.jp/common/docs/skillcheck_ver3.00.pdf

データサイエンティストになるための学習ロードマップ

続いて、データサイエンティストになるための学習ロードマップを提示します。以下は、データサイエンティストに必要な3つのスキル領域のうち、「データサイエンススキル」と「データエンジニアリングスキル」を組み合わせて、以下の5種類に分けたものです。

①プログラミングスキル
– Python
– numpy、pandas、matplotlib、scikit-learn、PyTorch 等

②数学
– 微分、線形代数、ベクトル、行列など

③統計の知識
– 平均値、標準偏差、分散、確率分布、推定、検定など

④機械学習の基礎知識

  • 教師あり学習と教師なし学習
  • 単回帰、重回帰分析、最小二乗法
  • パーセプトロン、ロジスティック回帰
  • 決定木、ランダムフォレスト、サポートベクトルマシン、K-means、etc..
  • PyTorchやKerasなどの深層学習フレームワークの知識
  • 前処理、特徴量設計、学習と評価
  • scikit-learnを用いた教師あり・なしの手法や、scikit-learnで学習済みモデルを作るまでの流れなど。
    1.データの収集とデータの前処理欠損値の補完や外れ値の削除)
    2.特徴量の設計(特徴量の選択)
    3.モデル開発(モデルの選択と学習)
    4.モデル評価・・・交差検証、混合行列など
  • 深層学習(ディープラーニング)の実装スキル及び知識

⑤SQLを使ってデータベースを操作する知識
– select、insert、update、delete、where、like、limit、sum、avg、max、group by、having、order by、テーブル結合、ビュー、サブクエリ、caseなどなど

5つもあり、意外と多いなと思われたかもしれませんが、これはあくまでも土台となる一部にすぎません。
データサイエンティストになるためには、これらのスキルは必須です。さらにこれらに加え、「ビジネススキル」も求められます。ですが、まずは「データサイエンススキル」と「データエンジニアリングスキル」の2つを土台をしっかり身に付けるようにしましょう。

これらのスキルを身につけるための勉強方法や、スキルを身に付けた後は何をしたら良いのか、どうしたら良いのかを順に解説していきます。

データサイエンティストになるための勉強方法

以下に独学で、データサイエンティストになるための勉強方法をお伝えします。大きく以下の2ステップになります。

①3〜6ヶ月ほどの学習期間を設けて、上記の①〜⑤のスキルを身につける

3〜6ヶ月(1日3時間換算で、約300時間〜約600時間)で、「データサイエンススキル」と「データエンジニアリングスキル」の2つのスキルを身につけます。

必要に応じて、以下の資格試験の取得もおすすめです。

ITパスポート試験

G検定

DS検定

統計検定できれば、2級

統計検定2級は独学での取得は少々難易度が高いですが、上記の3つの資格は、独学で取得を目指せるレベルの資格でありかつ、機械学習やデータサイエンスの基本的な知識の習得に非常に役立つ試験となっています。

G検定やDS検定対策講座

関連:データサイエンス|G検定対策講座(日本ディープラーニング協会)

関連:データサイエンス|DS検定対策講座

ここまでで、最低限データサイエンティストに必要な基礎スキルを身につけることができます。では、これらのスキルを身に付けた後は何をしたら良いのか、どうしたら良いのか説明していきます。

②実際のプロジェクトやKaggleなどの分析コンペなどで経験を積む

結論から言ってしまうと、①のスキルを習得した後は、実際に使えるスキルに昇華させる必要があります。そのおすすめの方法として、Kaggleなどのデータ分析コンペの参加や、インターンやアルバイトなどで実際のデータ分析プロジェクトに参画し、経験を積むことです。

その他には、データ分析のダッシュボードページや分析スライドなどを作成し、ポートフォリオを作成しておくこともおすすめです。

まとめ

本記事では、独学でデータサイエンティストになるの勉強方法や、勉強時間、0からのロードマップについて解説いたしました。本記事で説明したことを簡単にまとめると、以下の2STEPで進めることでした。

1)3~6ヶ月ほどの学習期間を設けて、本記事で解説している⑤のスキルを効率よく身につける

2)実際のプロジェクトやKaggleなどの分析コンペなどで経験を積む

本記事が少しでも参考になりましたら幸いです。

おまけ:効率よくデータサイエンティストに必要なスキルを身につけるには

おまけとして、効率よくデータサイエンティストに必要なスキルを身につける方法をお伝えいたします。

本記事で紹介した内容を参考にしたり、書籍やWebサイトなどを見て、黙々と勉強することでもデータサイエンティストに必要なスキルを身につけることが可能です。ですが、相当な時間がかかりますし、わからないことがあった場合に質問できなかったり、一人だとモチベーションが保てないことが往往にしてあります。

そのため、データサイエンティストを目指すには、データサイエンティストから直接質問できる環境で、アドバイスや学習進捗リマインドがもらえる挫折しない環境で学ぶのが非常にオススメです。

AI Academy Bootcampでは6ヶ月データサイエンティストや機械学習エンジニアの講師に質問し放題かつ、マンツーマンのレッスンで直接講師より疑問を解消できます。さらには、オリジナルのポートフォリオの作成やKaggleのコンペを通じた、独学ではなかなか身につけることができない実践的な内容まで学べます。

ぜひ、AI Academy Bootcampをご検討してみてください!

AIエンジニア(機械学習エンジニア)を目指されている方は以下の記事もご参考ください。

関連:【保存版・初心者向け】独学でAIエンジニアになりたい人向けのオススメの勉強方法

1 COMMENT

現在コメントは受け付けておりません。