形態素解析とは一般的に使われる言葉。
つまり自然言語のテキストデータを、形態素と呼ばれる言語が意味を持つ最小単位に分割し、単語の品詞等の情報などのリストである辞書にもとづき、分割した形態素の品詞等を判別する技術のことである。
日本語は他の言語よりも形態素解析が難しいとされている。日本の形態素解析エンジンはMeCabやChaSenなどがよく利用されている。
形態素解析とは一般的に使われる言葉。
つまり自然言語のテキストデータを、形態素と呼ばれる言語が意味を持つ最小単位に分割し、単語の品詞等の情報などのリストである辞書にもとづき、分割した形態素の品詞等を判別する技術のことである。
日本語は他の言語よりも形態素解析が難しいとされている。日本の形態素解析エンジンはMeCabやChaSenなどがよく利用されている。