【自然言語処理】GiNZAとは

GiNZAとは

GiNZAとは、Pythonで使えるオープンソースの日本語のNLP(自然言語処理)ライブラリです。

spaCyと呼ばれる自然言語処理用Pythonライブラリ(MIT ライセンス)が存在し、spaCyは英語などに対応していましたが、GiNZAはspaCyの日本語対応版のようなオープンソース日本語NLPライブラリということになります。

形態素解析や係り受け解析をはじめとした解析が可能です。

GiNZAのインストール

GiNZAをインストールするには、pipコマンドを用いて以下のようにします。

pip install ginza
pip install -U ginza ja-ginza

spaCyからGiNZAを読み込む

spaCyからGiNZAのモデルを読み込み使うことが出来ます。

その上で、名詞句のみを抽出したい場合には、Doc.noun_chunksを利用します。

以下のようなコードで実施できます。

import spacy

nlp = spacy.load('ja_ginza')
doc = nlp('AI Academyでpythonを勉強中')
for noun in doc.noun_chunks:
    print(noun)

出力結果

AI Academy
pythonを勉強中

自然言語処理を学ぶには

自然言語処理を学ぶに限らず、機械学習技術を学ぶ上でおすすめなのは、機械学習エンジニアからいつでも質問できる環境で学ぶことが大切です。

AI Academy Bootcampなら、6ヶ月35,000円にてチャットで質問し放題の環境で、機械学習やデータ分析が学べるサービスを提供しております。
数十名在籍しているデータサイエンティストや機械学習エンジニアに質問し放題の環境でデータ分析、統計、機械学習、SQL等が学べます。AI人材に必要なスキルを効率よく体系的に身に付けたい方は是非ご検討ください。

1 COMMENT

現在コメントは受け付けておりません。