統計学というのはどのような学問なのでしょうか。この記事では統計学に関してわかりやすく初学者の方が読んでもわかるよう解説致します。
統計学は、ある1つのデータ群に対し、データの性質を調べたり、未来のデータを推測するための学問です。
つまり、統計学とはデータを解析して、データがどのようなものであるかを説明するための手法と言えます。
統計学と機械学習の違い
端的に言い表すと統計学と機械学習は、データを扱う目的が説明であるか、予測であるかで大きく大別されます。
データサイエンティストや機械学習エンジニアといった職種では、統計学によってデータがどのような物であるかが解析出来ることと、それらのデータから将来的に何が起こるかを予測する能力が求められます。
ここまで統計学と機械学習の相違について話してきましたが、二つの手法は完全に独立したものではありません。
統計学と機械学習は関連しています。機械学習の分野では、より多くの技術が生み出されていて、統計学とは関連のない技術も一部ありますが、現在使われている機械学習の多くは統計学と深くかかわりがあります。
例えば、機械学習の分野ではデータが得られたらまず、データの前処理を行いますが、ここで行うことの殆どの作業は統計学でも使われています。また 、実際にフィッシャーの線形判別などのモデルはもともと統計学で得られた手法です。ここでは、多くの企業で実践的に使われている記述統計学について説明をします。
統計学の分類
統計学は大きく分けて以下のような3つの分類が出来ます。
・記述統計学:手持ちのデータを集計する方法を学ぶ学問
・推測統計学:手持ちのデータを分析して、まだ手に入れていないデータについて議論する方法を学ぶ学問
・ベイズ統計学:ベイズの定理を基礎とした統計学を学ぶ学問
統計学において最も重要視されている部分は「推測統計学」ですが、ビジネスの現場では記述統計学が大いに役立ちます。
他の二つについてですが、推測統計学は名前の通り、手持ちでないデータの推測をすることが求められます。
「検定」や「推定」などが主なテーマになっており、品質管理や信頼性工学など様々な分野で応用されています。
ベイズ統計学は数学的な知識や、トリッキーなテクニックを必要とする応用分野ですので、勉強をするにはそれなりのコストを覚悟してください。
また、上記した推測統計学やベイズ統計学には、記述統計の知識は必要不可欠なものになります。
基本統計量に関してPythonと合わせて学びたい方は下記のテキストをご確認してみてください。
統計学や機械学習を効率的に学ぶには
統計学や機械学習を独学で学ぶのは大変です。そのため、まずはオンラインプログラムを利用するのが良いです。
AI Academy Bootcampでは6ヶ月データサイエンティストや機械学習エンジニアに質問し放題かつ、体系的に学べる動画コンテンツや440種類以上のテキストコンテンツで学べて35,000(税込)で受講出来ます。
是非サービスを活用し、効率よく、統計学や機械学習を身につけてみてください。