【統計用語】多重共線性とは

多重共線性

重回帰分析では、ついたくさんの説明変数を利用しがちですが、説明変数を増やしすぎると決定係数(R2)が高くなってしまいます。

多重共線性(マルチコリニアリティ:略してマルチコ)とは、説明変数の中に、相関係数が高い組み合わせが存在することです。

つまり、モデル内の一部の説明変数が他の説明変数と相関している場合に起こる状態を多重共線性と呼びます

多重共線性の対策として、例えば、AとBという説明変数の相関係数が極めて高い場合、両方を説明変数として使わずに、相関係数の高いどちらかの変数を除外して分析する方法や、VIF(Variance Inflation Factor)と呼ばれる変数間の多重共線性を検出するための指標を用います。

統計学を学ぶには

統計分析コースでは、データサイエンティストから直接Pythonを用いて、統計を実務で活用できることを目的として統計分析が学べます。

また、AI Academy Bootcampの「オンデマンド動画+チャットサポートプラン」は6ヶ月、機械学習エンジニアやデータサイエンティストからチャットにて、受講期間中、Pythonや統計学、機械学習など質問し放題です。

6ヶ月間質問し放題で、受講料も35,000円(税込)とお手軽にご受講頂けます。
(1日の受講費用換算で、194円でご受講頂けます。)

是非、いつでも質問し放題の環境で効率の良いAI学習を始めてみてください。

AI Academy Bootcamp