MeCab

Linux

MeCab システム辞書への単語追加(mecab-ipadic-neologd)

MeCab辞書には、以前の記事でご紹介した「ユーザ辞書」と「システム辞書」の2種類があります。ユーザ辞書への単語の追加は、手軽な反面、解析速度が落ちるといったデメリットもあります。そこで今回は、MeCabの「システム辞書」に単語を追加する方法をご紹介します。また、最近話題の新語辞書mecab-ipadic-neologdもシステム辞書に追加してみました。
Linux

MeCab ユーザ辞書への単語追加

MeCabを使って、文章を単語に分割した時に、複数の単語が含まれる複合語などが、思ったように分割できない事があります。例えば「焼肉定食」は「焼肉」と「定食」の2つの単語に分割されてしまいます。MeCabには「最小単位の単語に分割する」という基本ルールがあるので、この分割は正しいのですが、実際に文章を解析する時は、1つの単語として扱いたくなります。そこで今回は、MeCabの辞書に単語を追加して、思っ...
プログラム

MeCab と php-mecab のインストールメモ(CentOS7.1)

MeCabは、日本語の文章を解析して、単語に分割してくれるソフトウェアです。WEBサービスを作るにあたってMeCabをPHPから使う必要があったので、今回はphp-mecabもインストールしました。MeCab(めーきゃぶ)の名称は、開発者さんの好物「めかぶ」にちなんで付けられたそうです。ふと、めかぶをつまみに一杯やりたくなりました。(^^)