【データ分析プロセス】CRISP-DMとは?

AI・データサイエンス、
機械学習の実践力を高めたい方へ

  • プログラミングを0から学びたい
  • データサイエンティスト、データ
    アナリストを目指したい
  • AIエンジニア、大規模言語モデル(LLM)エンジニアを目指したい

AI人材コースを無料体験してみませんか?

  • 無料で120以上の教材を学び放題!
  • Pythonやデータ分析、機械学習など
    AI人材に必須のスキルを無料体験できる!
  • データ分析、AI開発の一連の流れを体験、実務につながる基礎スキルを習得!

1分で簡単!無料!

無料体験して特典を受け取る

CRISP-DMとは

CRISP-DM(CRoss-Industry Standard Process for Data Mining)とは、データ分析プロジェクトのためのデータ分析プロセスモデルです。CRISP-DMに沿ってデータ分析を行うことで、効率よくデータ分析を行うことが出来ます。

CRISP-DMでは以下のようなプロセスでデータ解析が行われます。

プロセスに矢印が引かれ、円形のプロセスマップからもわかる通り、データ解析の分野では必要に応じて、処理を戻りやり直したり、繰り返すことが求められます。

CRISP-DMの6つのプロセス

CRISP-DMには、次の6つのプロセスがあります。

❶ビジネス課題の理解

❷データの理解

❸データの準備

❹モデル作成

❺評価

❻展開・共有

ビジネス課題の理解

まず始めにビジネス課題を理解するところから始まります。(Business Understainding)

データの理解

ビジネス課題の理解の次は、データの理解のフェーズです。

データの理解のフェーズでは、分析のもととなるデータについて理解します。

データを理解するためには、ただ手を動かせば良いわけでなく、担当者との密なコミュニケーションが必要になります。さらに、可視化を行うことでデータ理解につながります。

データの準備

データの理解ができたら、モデルを作成する前段階としてデータを準備・前処理します。

データ前処理は、全体の8割を占めると一般的に言われます。

どのように特徴量を作成するかによって、次のフェーズのモデルの精度を左右します。

さらには、ビジネス理解のフェーズに定めた分析目標を達成できるかどうかにもつながるため、作業には十分に時間を割く必要があります。

モデル作成

データの準備・前処理を終えることで、はじめてモデルの作成が行えます。

このフェーズでモデル(データに潜むルールやパターンの集まり)を作成します。

評価

モデル作成フェーズで得られた結果から、分析の目標とビジネス目的を達成できるか評価します。

次の『展開・共有』フェーズで実際にモデルを運用し、効果を確認することも必要です。

評価の結果、ビジネス目的を達成できなければ、ビジネス理解のフェーズに戻り、再度分析の目標と成功の判定基準を設定します。

展開・共有

ビジネス目的を達成できるモデルを得られたら、既存の業務フローへ展開、共有し既存システムに組み込みます。

このフェーズでは組み込んで終わりではなく、効果をモニタリングしフィードバックを行い、さらなる改善を繰り返します。

モデルは一度作って終わりではなく、継続的に価値を出し続けるために、最新の状態に保つ必要があります。

分析の価値が下がらないよう、モデルは日々更新します。

(更新頻度はビジネスの目的によって異なります。)

おわりに

この記事では、データ分析プロセス CRISP-DMに関して解説しました。

CRISP-DMの6つのプロセスを理解し、データ分析を行う際には参考にしてみてください。

❶ビジネス課題の理解

❷データの理解

❸データの準備

❹モデル作成

❺評価

❻展開・共有

データ分析を効率よく学ぶには?

データ分析を効率よく学ぶには、普段から分析業務をしている現役のデータサイエンティストに質問できる環境で学ぶことです。
質問し放題かつ、体系的に学べる動画コンテンツでデータ分析技術を学びたい方は、オンラインで好きな時間に勉強できるAI Academy Bootcampがオススメです。受講料も業界最安値の35,000円(6ヶ月間質問し放題+オリジナルの動画コンテンツ、テキストコンテンツの利用可能)なので、是非ご活用ください。



  • 30時間以上の動画講座が見放題!
  • 追加購入不要!
    これだけで学習できるカリキュラム
  • (質問制度や添削プラン等)
    充実したサポート体制!

1分で簡単!無料!

AI人材コースを見る



無料体験して特典を受け取る