2018.03.26

難解な津軽弁をAIが認識!? 「自然言語処理」の可能性

「音声」「テキスト」の分野でも進むAIによる効率化

AI技術はさまざまな業界で活用が進んでいます。近頃、話題となったのが弘前大学と東北電力の取り組み。方言の中でも特に難解といわれる津軽弁を聞き取り、テキスト化することに成功したという。この研究が世の中にどういう影響をもたらすか。技術提供をした株式会社エーアイスクエアの荻野明仁さんにお話を伺いました。

コールセンターの支援に「自然言語処理」技術が活躍

突然ですが、次の津軽弁の文章は、どういう意味かわかりますか?

このきみくいへ、がっぱめはんで

突然ですが、次の津軽弁の文章は、どういう意味かわかりますか?

このトウモロコシ食べてみなさい、とってもおいしいですから

津軽弁の難解さをご理解いただけたかと思いますが、なぜこの方言をAIによって文字に起こすという取り組みがはじまったのでしょうか。

今回のプロジェクトのテクノロジー部分を担当したのは、東京にある株式会社エーアイスクエア。同社は人工知能(AI)を活用したITサービスの提供や、コンサルティングをされている企業。特に「自然言語処理」の分野を得意としています。

株式会社エーアイスクエア 取締役 荻野明仁さん

「自然言語処理とは、私たちが日常的に使っている言葉(自然言語)をコンピュータに処理させるという技術になります。昔から研究されている分野ではあるのですが2010年代以降にディープラーニングの技術が発達しまして、この分野にも大きな影響を与えました。これは本格的な事業になるだろうということで、2015年に会社を立ち上げました」

自然言語処理、と言っても具体的な活用シーンはなかなかイメージしにくいかもしれません。

「例えば、コールセンターのオペレーター支援などに活用されています。電話口のお客様の会話を聞き取って、最適な回答例をオペレーターに提案したり、また、通話内容をテキスト化して、従来は人の手でまとめていたレポート作成を自動化したり。テキスト化したデータを元に、お客様の潜在的なニーズや不満を分析して、サービスや商品の改善に生かすなど、マーケティング的な視点で活用する、ということもやっています」

最近では、カスタマーサポートに「チャットボット」を導入する事例も増えてきています。しかし、まだまだ電話での対応を望まれる高齢者の方は多く、AIによるオペレーション支援は、しばらく活躍しそうです。

方言による医療者と患者の言語ギャップをAIにより解消

今回の津軽弁に関するプロジェクトがはじまったのも、コールセンターでの応対の効率化というニーズが発端でした。

「東北電力さんが、高齢者の方、特に地方に住んでいる方から電話が来た時に、方言が強くなかなか会話が成り立たないということがあったようです。一方で、弘前大学さんの方では、津軽弁を話される高齢者さんがいらっしゃった時に、県外から来た若いお医者さんが方言に対応できないと。なんとかできないかという話が持ち上がって、それでは両者で研究をしようとなったのが、そもそものきっかけでした」

実際に、AIで会話を読み取らせるのに、どのようなことをやっているのでしょうか。

「既存の音声認識エンジンに言葉を学習させて、チューニングをするということをやっています。今回、AIに学習させた津軽弁の数は、実は少なくて300フレーズぐらい。しかし、これぐらいの数でも、かなり高い精度で聞き読み取ることができるようになります」

「例えば、『引っ越しが決まったはんで※』というフレーズですが、学習前は『半で』と間違えていたのが、学習後に『はんで』と正しく認識することができています」

※はんで……津軽弁。「だから」という意味の接続助詞。

ゆくゆくは、音声認識した津軽弁を標準語に自動翻訳するところまで視野に入れたいと語る荻野さん。しかし、まだまだ課題も多いと言います。

「実験用に特殊な環境で録音したデータを使用しているので、実際の日常会話では、まだ今回の報道のような高い精度で聞き取ることは難しいでしょうね。ソフトウェアだけでなく、マイクなどハードウェアの進化も必要です」

音声からテキストへ、さらにテキストの自動要約へ

音声を高精度でテキスト化することに成功した今回の取り組み。しかし、AIによる自然言語処理でできることは、それだけではありません。さらにこの技術を活用することで、テキストを自動で要約することも可能となります。 現在エーアイスクエアさんの方では、徳島県が実証実験を行っている「知事の記者会見の要約」に技術協力をしています。

徳島発!「AI要約サービス」。左が50%の文章、右が25%の文章。1秒足らずの処理時間で文章を要約してくれる

「知事が話していることを、音声認識を使ってテキスト化しています。100%の精度ではないので、県の職員の方が多少手直しするんですが。従来2〜3日かかっていた(文字起こしの)作業が数時間で終わるようになりました。ただ、実際に書き出して見ると、長いんですよね。実は、画面上のバーを調整してパーセンテージを指定すると、その割合に合わせて文章を要約してくれます」

この文章の自動要約にもAIが一役買っています。

「文章の自然言語処理をするために、それぞれの単語をベクトル化して、ベクトル空間に配置し、単語同士の意味の関係性を統計処理によって明らかにします。従来は人の手で辞書を使ってやっていた作業ですが、膨大な日本語文章のデータをAIに学習させることで、より精度を高めることができました」

こういった文章の要約には、一定のルールに沿って淡々と書かれている新聞記事や、レポートなどの文章が向いているそうです。

「調査会社とか、シンクタンクの方から、論文やアナリストレポートを、このシステムで要約したいという声は多いですね。日々、膨大な資料に目を通す中で、いったん文章を要約して概要を認識した上で、今日はこのあたりを中心に読もうなど、優先順位をつけることができます」

AIによる自然言語処理がもたらす可能性

AIによって機械が正確に文章を読み取ることができるようになれば、さまざまな利活用の可能性が広がります。

「店頭での活用の可能性としては、例えば金融商品などの販売の時に、コンプライアンス的にお客様に伝えなければいけないことを販売員が伝えられているか、音声をテキスト化して分析することでチェックできます。また、考えられるのは電子書籍のプロモーション。電子書籍は立ち読みすることができませんよね。しかし、読者にどんな内容かを伝えなければいけない。そこで、本の内容の要約をAIにしてもらうのです。小説などの主観的・叙情的なテキストは難しいのですが、ビジネス書などの内容でしたら、今の技術なら要約することが可能かと思います」

現在は既存のテキストの内容を要約しているだけですが、例えば歴代の文豪たちの文章をAIに学習させることで、より効果的に伝わる文章のリライトを実現できるようになり、プレスリリースや広告コピーなどの添削、さらには目的に応じてゼロから自動で文章を作成するといったことも可能になるかもしれません。
AIによる自然言語処理のプロモーション活用への可能性に、今後とも期待したいところです。

Written by:
BAE編集部