NTT 独自の大規模言語モデル「tsuzumi」を用いた商用サービスを3月に開始へ

日本電信電話(NTT)は、世界トップレベルの日本語処理性能を持つ大規模言語モデル「tsuzumi」を活用した商用サービスを2024年3月に開始する。2023年11月1日に発表した。

tsuzumiは、大規模言語モデル(LLM)の普及にともない課題になっている電力やコスト増などの解決を目指したもので、パラメータのサイズが小さく(軽量)、学習に要するエネルギーも少なくて済む。tsuzumiの提供開始に向け、2023年10月から京都大学医学部附属病院や東京海上日動火災保険などのパートナーとトライアルを開始している。

「tsuzumi」は日本語と英語に対応しており、特に日本語処理性能についてはNTTが長年の研究で蓄積した知見を活かして高い性能を備えている。英語についても、世界トップクラスと同程度の性能を実現しているという。NTTはまずは業界ごとに固有のデータを柔軟・セキュアに学習することが可能となる点を生かして、それぞれの業界に特化した領域で運用を開始する。全ての知識を集約した1つの巨大なLLMではなく、専門性や個性をもった小さなLLMの集合知が多様なAI群と連携して、現実の社会課題を解決する世界を目指していく。

このような大量のLLMの連携基盤には安全かつ低遅延環境が必要になるが、NTTではtsuzumiの学習のために IOWN APN(All Photonics Network)を利用した環境を構築ずみ。これにより遠隔のデータセンタ間でGPUとストレージを接続し、効率のよいLLM学習環境が実現できた。商用サービス提供後も、チューニング機能の充実やマルチモーダルの実装を順次展開し
ていく。サイバーセキュリティ分野への応用や、自律的に連携し議論するAI群の開発も進める計画だ。

AI

■事業構想大学院大学出版部 編集/ライター経験者を募集■
事業構想大学院大学出版部では、編集/ライター経験者を募集しています。応募に関する詳細はこちら