目次
GiNZAとは
GiNZAとは、Pythonで使えるオープンソースの日本語のNLP(自然言語処理)ライブラリです。
spaCyと呼ばれる自然言語処理用Pythonライブラリ(MIT ライセンス)が存在し、spaCyは英語などに対応していましたが、GiNZAはspaCyの日本語対応版のようなオープンソース日本語NLPライブラリということになります。
形態素解析や係り受け解析をはじめとした解析が可能です。
GiNZAのインストール
GiNZAをインストールするには、pip
コマンドを用いて以下のようにします。
pip install ginza
pip install -U ginza ja-ginza
spaCyからGiNZAを読み込む
spaCyからGiNZAのモデルを読み込み使うことが出来ます。
その上で、名詞句のみを抽出したい場合には、Doc.noun_chunksを利用します。
以下のようなコードで実施できます。
import spacy
nlp = spacy.load('ja_ginza')
doc = nlp('AI Academyでpythonを勉強中')
for noun in doc.noun_chunks:
print(noun)
出力結果
AI Academy
pythonを勉強中
自然言語処理を学ぶには
自然言語処理を学ぶに限らず、機械学習技術を学ぶ上でおすすめなのは、機械学習エンジニアからいつでも質問できる環境で学ぶことが大切です。
AI Academy Bootcampなら、6ヶ月35,000円にてチャットで質問し放題の環境で、機械学習やデータ分析が学べるサービスを提供しております。
数十名在籍しているデータサイエンティストや機械学習エンジニアに質問し放題の環境でデータ分析、統計、機械学習、SQL等が学べます。AI人材に必要なスキルを効率よく体系的に身に付けたい方は是非ご検討ください。
[…] Pythonで係り受け解析を行う場合、「GiNZA」などの係り受け解析エンジンを用いることで実現可能です。 […]