2021.07.27

AIのトレンドは、画像から「言語」へ──進化したディープラーニング

見えた、「シンギュラリティ」の実現性

AI(人工知能)が人の知能を超える「シンギュラリティ(技術的特異点)」。現在それは、2045年頃に訪れるといわれています。しかし、デジタルクローン(パーソナル人工知能:P.A.I.)の研究開発で注目されるスタートアップ、株式会社オルツ 副社長 米倉豪志さんは「その日はもっと早く訪れる」と予測します。

その理由を、AIの現在地、最新の活用法を交えて聞きました。

目次

AI活用の未来を開いた、ディープラーニングの進化

——オルツ社は「全人類1人1デジタルクローン」を掲げ、P.A.I.(パーソナル人工知能)の研究開発を進めています。昨今、AIを取り巻く環境に、大きな変化が起こっているそうですね。

はい。“これまで”と“これから”では、AIの進化するスピードは、まるで異なるものになるでしょう。

現在も続く「第3次人口知能ブーム」は、2010年代から始まりました。当時は、「2045年にAIが人の知能を超える(シンギュラリティが訪れる)」と聞いても、失笑する人の方が多かった印象です。それもそのはず。当時のAIにできることは限られており、とても人の知能を超えるような性能ではなかったのですから。

しかし、いまは違います。技術の進展により、ディープラーニング(深層学習)の精度が飛躍的に向上したからです。

ディープラーニングは、AIが自動でデータを抽出・分析し、学習する手法を指します。データが増えれば増えるほど、賢くなっていく仕組みは、人間の脳に近いですし、実際の仕組みも、人間の脳神経回路をモデルとしたアルゴリズムが採用されています。これを「ニューラルネットワーク」と言いますが、パラメーター数と呼ばれる媒介変数が2019年時点で15億個だったものが、2020年には1,750億個と急増。たった1年で、AIの性能が格段によくなったわけです。現在はさらに向上しており、今後より一層の成長が予想されています。

「ニューラルネットワーク」が進化したということは、AIの知能が進化した、ということです。これはそのまま、シンギュラリティに大きく近づいたことを意味します。そして、それによってディープラーニングの精度が飛躍的に向上したということは、「AI活用の未来が大きく開けた」と言えるのです。

——AIの進化を支えるディープラーニングが進化したことで、海外の状況はどうでしょうか。

きっとこれから、驚くほど便利なツールがたくさん登場するはずです。グローバルでいえば、アメリカや中国のAI開発にかける研究費は莫大であり、その期待値は非常に高まっています。ちなみにアメリカは、2021年の予算案において、今後2年間でAIの研究開発資金を約20億ドル(約2,200億円)、これまでの倍を投資することを発表しています。

それだけAIが生み出すビジネスポテンシャルは高く、多額の投資をしても、回収できると見ているわけです。この先、次のGoogleやFacebookが、AI関連企業から誕生する可能性も、十分にあり得るでしょう。

同様に、現在アメリカに次ぐAI大国である中国も、AIを含めた研究開発費を毎年7%超増額し、2025年には2020年の1.5倍にまで増やすと発表しています。このことからも、新たな時代の到来、マーケットの幕開けに、世界中が期待し、注力していることがおわかりいただけると思います。

トレンドは「画像」から「言語」へ

——世界が期待するAI活用の分野ですが、その現在地とは、BAEが取材した2019年頃と比べて、どのような点が特に進化しているのでしょうか。

これまでは画像認識などの「コンピュータービジョン」分野の精度が高く、さまざまな周辺サービスが生み出されてきました。身近なところだと、「顔認証」技術にもAIが活用されていますし、また自動運転技術などにも利用されています。

そのなかで近年、ディープラーニングが急激に進化したことで、「言語」(自然言語処理技術)分野の精度が向上し、注目を集めています。なぜなら、コミュニケーションの精度を定量化(数値化)することは容易ではなかったからです。もっと言えば、本来コミュニケーションは定性的なものであり、数値化できるものではありませんよね。

一方で「対話の破綻率の改善」、Aの話をしているのに、Bの話をしてしまうなど、明らかな間違いを正すことは、これまでも実現できていました。同様に、「橋」と「箸」などの同音異義語の区別も学習によって改善可能です。しかしこれはパターンの学習であり、最大難易度の「雑談」ができるまでの道のりは果てしなく遠いものと思われていました。

ですがここに来て、「翻訳」や「雑談などの対話」を含む、ディープラーニングによる自然言語処理の精度が飛躍的に向上したのです。


——AIを活用した「翻訳」の進化とは、「同時翻訳」の精度やスピードが向上した、ということでしょうか。

はい。これはもう、目覚ましいレベルの発展と言えるでしょう。体感値ではありますが、入力が正確ならば翻訳精度は95%を超えていると思います。

その翻訳精度とオルツの超高速演算基盤を用いて、オルツの「AI通訳」では、英語や中国語など、他言語に対応しており、タイムラグたった3秒での同時翻訳(通訳)を実現しています。

オルツ社の「AI通訳」は、タイムラグ3秒で同時翻訳を可能とするクラウドサービス

たとえば、日本語で自分が話した内容を、3秒後に英語で届けてくれる。相手が英語で話せば、3秒後に日本語で届く。しかも、翻訳精度は90%以上。この速度と精度であれば、人間の通訳を介すことなく、対話が可能であり、十分実用レベルと言えるでしょう。


現時点でも、日常会話レベルであれば、ほぼ問題なく通訳されますが、今後さらに品質が向上していけば、より高度な専門分野の対話にも対応できるようになると考えています。

「音声認識」から「対話」(双方向)へ

——続いて「雑談」の進化についても教えてください。これはAIとの「会話」が実現する、いうことでしょうか。

そうですね。これまでは、「あらかじめ設定されたフローに基づいてのみ対応できる」というのがAIとの会話における一般的な認識でした。

しかしAIの自然言語処理技術が向上したことで、より自然な会話(雑談)ができるようになってきました。その技術を応用して誕生したのが、高度な対話エンジンを搭載した「CloneTuber(クローンチューバー)」です。

オルツ社が開発した、クローンチューバー「CT-003」

クローンチューバー「CT-003」には、元となっている人間はいません。正確には、デジタルクローン(デジタルコピー)ではなく、オルツの創作アバターといった方が適切かもしれません。

クローンチューバーは、リアルタイムにコミュニケーションできるコミュニケーターです。動画、音声生成、思考処理、対話エンジン、それらを動かす超高速演算基盤エメスなど、さまざまなテクノロジーを結集したアバターは、店舗の接客業務での活用などを目的に開発されました。そのため、リアルな見た目、表情を構築することで、“人間らしさ”を持つことを重視しています。

まるで本物の人間のように、さまざまな表情を見せる「CT-003」

「思わず話しかけたくなる」見た目を持ち、実際に会話をすることができる。高度な対話エンジンの存在です。チャットボットもあらかじめ準備されたQAデータベースを元に「聞かれたことに答える」ことはできますが、クローンチューバーは、人間のコミュニケーションと価値観自体を学習した対話エンジンを搭載することで「どう思うか?」などの曖昧な質問に対しても回答できる仕様になっています。

加えて、クローンチューバーは「AI通訳」を搭載していますから、多言語にも対応可能です。今後、また海外を行き来できるようになれば、外国人観光客の対応などにおいても効果を発揮するでしょう。なお、この技術を応用すれば、映画の吹き替えの口元を翻訳言語に合わせる、といったことも可能です。

さらに彼女を平面ではなく、立体として存在させることもできます。たとえば、受付に座らせることだって、できるわけです。

——二次元の存在であるクローンチューバーを、どうやって現実空間に登場させるのでしょうか。

これまでオルツでは、実空間の人間をデジタル上に再現すること(デジタルクローン)を研究の中心として据えてきました。しかし視点を変えて考えたときに、デジタル上の存在を実空間上に再現することもまた、同じく価値が高いことを発見し、開発を進めたのが「HOLONOID(ホロノイド)」です。

クローンチューバーほか、さまざまな物体をリアルに投影することを可能にする「ホロノイド」

これは空中に立体映像を映し出す「ホログラム」技術同様、実空間上に、デジタルクローンはもちろん、クローンチューバーの投影を可能とする技術です。さらには、遠隔にいる、実際の人間の投影も可能です。また、投影された物体(クローンチューバー)は、実空間上を動くこともできますし、会話もできます。

ここまで紹介した「AI通訳」「クローンチューバー」「ホロノイド」の技術はすべて、デジタルクローン開発の過程で誕生したものであり、そのすべてはデジタルクローンへとつながっています。

こうした技術の進化を受け、オルツは今年3月、基本的なコミュニケーション機能を統合した、研究開発の第一マイルストーン「デジタルクローン バージョン1」を発表するに至ったのです。

未来においても、主役は人。AIはそれをサポートする存在

——ディープラーニングの進化によって、大きく発展を遂げるAI。2045年と目される「シンギュラリティ」について、今後早まる可能性もあるのでしょうか。

半年前のAIでさえ、現在の性能とはまるで違うほど、AIが進化するスピードは非常に早まっています。そう考えると、2045年に人工知能が人を超えるという予測は、ほぼ間違いなく達成されるのではないでしょうか。

そのとき、AIは人にとって、大いなる豊かさを与えてくれる存在になるでしょう。一方で、完璧な存在であるAIを「脅威」と感じる人もいるかもしれません。しかしそれは、AIの進化によって、全知全能の「神」が生まれると考えるからです。

もし、人が神を生み出そうとすれば、それは倫理的な観点から、多くの人の共感を得ることは難しいでしょう。人よりも偉いAIを誰が求めるかということです。そうならないために、AIにも多様性が求められる時代が訪れると私は考えています。

たとえばソニーの犬型ロボットの「aibo(アイボ)」は最初、人間の言うことを聞きません。徐々になついてくる。だからこそ愛着が湧き、共感が生まれます。つまり、タスクを高度にこなすAIのニーズもあれば、一方で、生命を感じさせるAIのニーズも確実にあるわけです。

同様に、オルツのデジタルクローンは、誰かのコピーですから、完璧ではありません。しかしそこには「人間らしさ(その人らしさ)」がある。いつになっても人の重要性は失われず、AIは良きパートナーであり得る。その未来において、デジタルクローンをはじめ、AIはきっと、多くの人々の生活を便利で幸福なものへと変えてくれるはずです。私はそう信じています。

株式会社オルツ 副社長 米倉豪志さん

近年、ディープラーニングの精度が向上したことで、AIの進化はさらに加速しています。最近では、マーケティングにおいても、効果検証や分析などの分野で、AIが活用され始めています。日進月歩で進化するAIの“いま”を捉え、「どのように活用するか」という視点が、これからのビジネス、そしてマーケティングにおいて、重要になっていきそうです。

Written by:
BAE編集部