フリープラン
登録

フリープラン
登録マイページ

pandas get_dummies() drop_first=Trueとは何か

2024年7月25日

SHARE

LINE友だち登録 ▶ Pythonコース ▶ 受講割引クーポン無料動画

Pandasのget_dummies()を用いると、カテゴリカルデータ（質的データ）に対して、ダミー変数化できます。

この記事では、get_dummies()のオプションの1つであるdrop_first=Trueとは何かを解説します。

get_dummies() drop_first=Trueとは何か

結論から先に説明しますと、引数drop_firstをTrueにすることで、最初のカテゴリーが除外されたn-1個のダミー変数を変換することができます。（生成されるカラムを1つ削除した上で、ダミー変数を作成します。）

最初のカテゴリーを除外したい場合にはdrop_first=Trueにすると良いでしょう。また、drop_first=Trueにすることで、多重共線性を防ぐことに繋がったりします。

目次

get_dummies() drop_first=Trueとは何か
- サンプルプログラム
Pythonを効率よく学ぶには？

AI・データサイエンス、
機械学習の実践力を高めたい方へ

プログラミングを0から学びたい
データサイエンティスト、データ
アナリストを目指したい
AIエンジニア、大規模言語モデル(LLM)エンジニアを目指したい

AI人材コースを無料体験してみませんか？

無料で120以上の教材を学び放題！
Pythonやデータ分析、機械学習など
AI人材に必須のスキルを無料体験できる！
データ分析、AI開発の一連の流れを体験、実務につながる基礎スキルを習得！

1分で簡単！無料！

無料体験して特典を受け取る

サンプルプログラム

import pandas as pd

df = pd.DataFrame({'A': ['a', 'b'], 'B': ['a', 'b']})
print(df)

出力結果

   A  B
0  a  a
1  b  b

drop_firstを用いない場合

print(pd.get_dummies(df))

出力結果

   A_a  A_b  B_a  B_b
0    1    0    1    0
1    0    1    0    1

drop_firstを用いた場合（drop_first=Trueにした場合）

print(pd.get_dummies(df, drop_first=True))

出力結果

   A_b  B_b
0    0    0
1    1    1

このように、drop_first=Trueとしたことで、Aカラム、Bカラム内にあるaとbという値から、最初のaの値（最初のカテゴリー）を除外した上で、bの値だけでダミー変数を変換していることが確認できます。

Pythonを効率よく学ぶには？

Pythonを効率よく学ぶには、普段からPythonを利用している現役のデータサイエンティストや機械学習エンジニアに質問できる環境で学ぶことです。
質問し放題かつ、体系的に学べる動画コンテンツでデータ分析技術を学びたい方は、オンラインで好きな時間に勉強できるAI Academy Bootcampがオススメです。受講料も業界最安値の35,000円（６ヶ月間質問し放題＋オリジナルの動画コンテンツ、テキストコンテンツの利用可能）なので、是非ご活用ください。

30時間以上の動画講座が見放題！
追加購入不要！
これだけで学習できるカリキュラム
（質問制度や添削プラン等）
充実したサポート体制！

1分で簡単！無料！

AI人材コースを見る

無料体験して特典を受け取る

前の記事

【Python】現在時刻を表示するには？ datetime モ…

次の記事

【Python】Djangoとは？DjangoでWeb開発の基…

フリープラン登録 AIを学習するデータサイエンスを
学習する