2019.03.15

デジタルクローン技術の現在地と可能性【AI最前線 前編】

人間を超えた「対話エンジン(AI)」が活躍する時代の到来

2045年、人工知能は人間の脳を超えるシンギュラリティ(技術的特異点)に到達するといわれています。

では、その現在地とは、どのようなものなのでしょうか?

人工知能学会の元会長であり、日本の人工知能研究の第一人者である松原 仁氏をはじめ、日本のAI研究におけるトップランナーたちが集い、「P.A.I.(パーソナル人工知能)」を生み出す研究を行っている株式会社オルツ 取締役 CFO/エバンジェリスト 中野誠二さんに「近年、人工知能への注目が高まっている背景、デジタルクローンの現在地、活用事例」について聞きました。【前編】

目次

コンピューターとネットワークの発達によって迎えた「第3次人工知能ブーム」

――「全人類ひとり1デジタルクローン」を目指し、パーソナル人工知能(Personal Artificial Intelligence:P.A.I.)の研究を行うオルツ社。まずは昨今、なぜAIがここまで注目を浴びているのか。その背景について教えてください。

「人工知能(AI)」と呼ばれる分野の研究が始まったのは、1956年のことです。以来、研究は続けられていますが、現在は「第3次人工知能ブーム」と呼ばれています。

しかしそれは、近年、人工知能の研究において何か大きな発見があったからではありません。実は1980年代頃から、「AIでできること」というのは理論的には変わっていないんです。ですが当時は、それを実現する技術がなかったのです。
コンピュータパワーもそのひとつです。数十年前のコンピュータというのは、現在多くの方が利用しているiPhoneより処理能力が低いものでした。またネットワークの速度も、現在に比べ、非常に遅いものでした。

だから理論としてはあるけれど、「できない」という時代が長く続き、人工知能はブームになるものの、技術的な問題から冬の時代を迎える、ということを繰り返してきました。

株式会社オルツ 代表取締役 米倉千貴さんのデジタルクローン

――周辺技術が発達したことで、再度ブームが訪れた人工知能(AI)。具体的に、「何ができる」ようになったのでしょうか?

「ディープラーニング(深層学習)」ですね。これは、近年の人工知能史において、最大の変革と呼べるでしょう。

人間がひとつずつデータを機械に教え込む「機械学習」ではなく、AI自らがデータを解析し、自動で学習していく「ニューラルネットワーク」という理論自体は昔から存在していました。しかし、たとえば1ヵ月分の株価のデータを学習し、翌日の予測を出そうとしても、当時は“1週間”かかっていました。当然、それでは時間がかかり過ぎてしまい、使い物になりません。

しかしコンピュータパワーとインターネットの発達により、非常にスピーディーにAIは物事を学習し、予測を立てることができるようになりました。

その技術を、製品やビジネスと組み合わせることで新たな可能性を切り開こうとしているのが、現在の「第3次人工知能ブーム」なのです。

収集ではなく、平均との差分によって導き出す「個性」

――オルツ社が研究を進める最先端のAIテクノロジー「P.A.I.(パーソナル人工知能)」について教えてください。

P.A.Iとは、私たち自身の意志をデジタル化し、それをクラウド上に配置して、あらゆるデジタル作業をそのクローンさせることを目的としたAIです。

これまでのAIは、さまざまな人の膨大なデータ(ノウハウ)を解析し、最適な回答を導き出してきました。しかしパーソナル人工知能は、いち個人の過去の行動や思考傾向などの「パーソナルな情報」のみを収集し、学習します。

将来的には、その人の話し方や好み、行動パターンなどのすべてを知る“分身”が完成するわけです。私たちは、特別なことをする必要はありません。ただ、いつものように日常生活を送るだけで、あとはAIが自動で情報を収集し、成長していく時代が実現されます。

――P.A.I(パーソナル人口知能)においても、深層学習が利用されているのですね。

はい。ですが、すべてではありません。私たちが目指しているのは「全人類ひとり1デジタルクローン」です。これは亡くなった方も含めて考えていますから、何十億、将来的には何百億という数になる予定です。

そのためには対話や思考、記憶など、さまざまな分野のデータが膨大に必要です。しかしそれらを集めることは現実的ではありません。そこで私たちは、「少ない個人データから、“その人らしさ”」を再現することでデジタルクローンを生み出すという発想にたどり着きました。

――少量の個人データを、何と掛け合わせることで、“その人らしさ”を抽出することができるのでしょうか?

「平均データ」です。声や表情のデータを集めていくと、たとえば「日本人男性の平均的な声(または表情)」というものが見えてきます。

そのデータと個人データを比較すると、“特徴(個性)”がわかるわけです。あとは細かいチューニングを施すことで、個人を再現することができるんです。

現在は音声と表情については、少量のデータでほぼ再現できる段階にあります。ゆくゆくは対話や思考、記憶まで同じデジタルクローンを完成させたいと考えています。

P.A.Iの仕組み
P.A.I(パーソナル人工知能)の仕組み

――デジタルクローン(P.A.I.)が完成したとき、現在のAIと決定的に違うのはどんな点になるのでしょうか?

現在、レコメンドエンジンとしてのAI利用や、将来的に自分の秘書(アシスタント)のような役割を果たすAI像が語られることがありますが、デジタルクローンはそれらと一線を画す存在になります。

なぜなら、「決断をするAI」だからです。

これまでのAIは、レコメンドまでを想定していましたが、私たちは「意思決定までをAIに任せる研究」をしています。人間は、1日に4万回の意思決定(選択)をしていると言われています。さらにそのうち、8割は同じことの繰り返しとも言われています。ならばその大部分を占める“繰り返し”をAIに任せてしまえば、私たち人間のパフォーマンスは大幅に向上することになります。たとえば、平日と休日で着る服のパターンをAIが学習すれば、デジタルクローンに日々の洋服を用意してもらう、ということも可能です。

同様に、ビジネスにおいても、スケジュール調整などの重要度の低い意思決定はすべてデジタルクローンに任せ、本人はより重要度の高い仕事をこなすことで、業務効率は大きく向上すると考えています。

決断までも代行するデジタルクローンP.A.I
P.A.I.を利用すれば、重要度の低い意思決定は、すべてAIが代行してくれる

――では、デジタルクローン(P.A.I.)が進化を遂げると、人間の作業は減少することになるのでしょうか?

減ると同時に増えると考えています。よく、「今後AIに仕事を奪われる」という話を耳にしますが、私は少し違うと思います。オートメーションの時代が訪れたことで、人力車はタクシーに代わりましたが、同時に運転手という職業が生まれていますよね。同様に、AIが普及しても、人間の存在は何かしらの形で、知的レベルの高いフェーズで求められると考えています。

ですからAIが人間の代替となるというのは、話が飛躍し過ぎている気がします。むしろ私たちの生活をさまざまな形でサポートしてくれる、心強いパートナーになってくれるはずです。

雑談もできる「対話AI」がデジタルクローンをさらに進化させる

オルツ社のチャットボットのイメージ
オルツ社の質問回答エンジンのイメージ

――デジタルクローン生成のための重要なファクターのひとつである「対話エンジン」において、オルツ社は現在、世界最高クラスの技術を有しています。そのテクノロジーを現時点では、どのように活用しているのでしょうか?

デジタルクローンにおいて、対話は絶対に欠かせない機能です。私たちが開発した、人間のように自然な対話ができる「alt対話エンジン」は、質問の意図を自動的に分析し、最適な回答を実現するものです。

「alt対話エンジン」には、AIMLルールベースや知識ベース、オリジナルの回答を自ら考え作り出すことができるRNNなどの複数のモジュールが備わっており、それぞれのモジュールが出す複数の回答の中から、ランキングエンジンと意図認識エンジンが連携して、最適な回答を選び出すことが出来る仕組みになっています。
チャットボットとは異なり、事前に登録していない質問に対しても、「対話エンジン」そのものが自ら考え、文章を作り出して発話出来ることが最大の特徴です。つまり雑談にも対応できるようになるのです。

現在、カスタマーセンターでは、この「対話エンジン」の中の“知識ベース”だけを切り出し、事前に登録されたQAから最適な回答をする「質問回答エンジン(知識ベースの対話エンジン)」が活用され、大きな成果を挙げています。

ある会社では、一件あたりの対応時間が短縮しただけでなく、成約率まで人間が対応を行うより「質問回答エンジン」のみの対応の方が上回ったという事例もあります。これは人工知能に、ベテラン社員の回答例だけを学習させたことが功を奏したものと推測しています。

また、音声対応の質問回答エンジンのニーズも高く、すでにオルツでは「音声対応の質問回答エンジン」も生み出しています。そこでよく話題に上るのが「雑談にも対応できるか」です。

コールセンターに電話してくるユーザの中には、いきなり本題ではなく、雑談のような内容から始める方もいます。その時に、「質問回答エンジン」がその会話を無視してしまっては、高品質な応対とは言えません。ですが雑談というのは、会話の脈絡を理解する必要があるため、非常に高い技術を要します。オルツでは、「alt対話エンジン」を使うことによって、雑談と業務的なQ&Aの両方に対応することができるのではないかと考えています。

なお、会話はすべてテキストでも記録されるため、ビッグデータ化していくことが可能です。テキスト化された会話を分析することによって、その精度や利便性は、今後さらに向上していくでしょう。
このように、対話エンジンはニーズに合わせ、進化し続けています。企業の利用もこれからますます拡大していく流れにあると私たちは考えています。

オルツ社のチャットボットを利用した企業の導入後の成果
オルツ社の質問回答エンジンを利用した企業の導入後の成果

――オルツ社は、「音声合成」の分野においても「世界初の技術」をお持ちだと聞きました。その技術でできることを教えてください。

これまでの「ボイスクローン」(音声合成技術)は、意味のない(文章として成立していない)言葉を大量に読み上げ、それをスタジオで録音し、長期間かけてモデリングする必要がありました。

ですが私たちは数十人の平均声と、再現したい人の音声さえあれば、たとえばこうしてインタビューしている間に録音している音声を利用して、「ボイスクローン」を作成することが可能です。これが「世界初」の“ボイス・トゥ・ボイス”という技術になります。

さらに最短10分で声を再現でき、その後チューニングを重ねれば、その人らしい音声が完成します。つまり、これまでと比べて非常に手軽なわけです。となれば、費用も時間も労力も大幅に下がりますよね。

なおこの技術も、オルツが目指す「全人類ひとり1デジタルクローン」の実現のために研究開発を進めているものです。現在、少量データかつ、短時間・低コストで音声合成を作ることができるようになったことで、目標に向け、さらに一歩近づいたと感じています。

ぜひ、AIの進化が切り開く未来を多くの方に楽しみにしてもらいたいですね。

株式会社オルツ 取締役 CFO/エバンジェリスト 中野誠二さん
 

周辺技術が発達したことで到来した「第3次人工知能ブーム」は、早いスピードで進化し続け、私たちの生活を大きく変えていくでしょう。特に次世代移動通信「5G」の普及により活用の幅は更に広がると考えられます。

その人らしさを表現できる音声合成技術、対話エンジン技術は、AR/VRなど既存のテクノロジーとの組み合わせで、エンタメからサービスまで様々なプロモーションに活用することができるでしょう。
これまでコスト面での懸念があった問題も解消されはじめるなど、ますますAIの利用は広がりを見せそうです。

Written by:
BAE編集部