ワークスと国語研 日本語の機械処理向上に向け共同研究開始

ワークスアプリケーションズ(東京都港区、月刊事業構想2017年7月号参照)のAI研究機関であるワークス徳島人工知能NLP研究所は、大学共同利用機関法人 人間文化研究機構 国立国語研究所(国語研)と、AIに欠かせない自然言語処理の重要な情報の1つである「単語ベクトル」において、共同研究協定を締結した。2018年12月25日に発表した。

共同研究では、国語研が保持する100億語規模の日本語データベース「国語研日本語ウェブコーパス(NWJC)」と、ワークス徳島人工知能NLP研究所が開発した新たな形態素解析器「Sudachi」を使って、より実用的な「単語ベクトル」を構築する。単語ベクトルは、単語の特徴を数値化したもの。これによりコンピュータが単語の類似性や関連性を捉えることが可能となり、高精度な検索や翻訳、テキストマイニングや自動会話が実現する。両者は、今回の研究成果をオープンソースソフトウェアとして無償公開する計画だ。

Teikei_shakehands.jpg