【自然言語処理】N-gramとは

N-gramとは

N-gramとは任意の文字数で文章を分割する手法のことです。

任意の文字数は連続するn個の単語や文字のまとまりを表し、N-gramではnが1の場合、uni-gram(ユニグラム)と呼び、2の場合をbi-gram(バイグラム)、3の場合をtri-gram(トライグラム)と呼びます。

uni-gram(N=1):1文字単位で文字を切り出す

bi-gram(N=2):

tri-gram(N=3):3文字単位で文字を切り出す

自然言語処理を学ぶには

自然言語処理を学ぶに限らず、機械学習技術を学ぶ上でおすすめなのは、機械学習エンジニアからいつでも質問できる環境で学ぶことが大切です。

AI Academy Bootcampなら、6ヶ月35,000円にてチャットで質問し放題の環境で、機械学習やデータ分析が学べるサービスを提供しております。
数十名在籍しているデータサイエンティストや機械学習エンジニアに質問し放題の環境でデータ分析、統計、機械学習、SQL等が学べます。AI人材に必要なスキルを効率よく体系的に身に付けたい方は是非ご検討ください。