
キーワード04「AI」:IoTに必須の「人工知能」●特集「IoTの現在」

ソフトバンクが発売している「感情認識パーソナルロボット」。クラウドと連携することで、さまざまな「感情」を持って動作する。家庭での利用を前提とした「一般販売モデル」と、法人向けにビジネスシーンでの利用を前提とした「法人向けモデル」がある
Pepperの人工知能
IoTにおいて、人工知能は切っても切り離せない。各種センサーから取得した多くの情報をクラウドに吸い上げた時、どうやってそれを「より適切な形で」人やモノにフィードバックするのか?ということが課題になるからだ。ここに人工知能が活用されている。

家庭向けヒューマノイド型ロボットとして発売されている「Pepper」は、感情認識エンジンを備えていることが大きな特徴だ。カメラで捉えた人の表情を読んだり、声のトーンから感情を認識するというものだ。人間の感情は多様であり、そう簡単に認識できるのだろうか?と考えるかもしれないが、数多くのデータをクラウドで処理することで、それらを実現している。つまり、一つのPepperがクラウドに上げる情報量は多くはないとしても、Pepperを使う人が多ければ、それだけの多種多様な感情データがクラウド上で共有されることになり、それを人工知能が大量のサンプルデータとして学習することで、より精度の高いアウトプットを行えるようになるのだ。このように学習を繰り返すことで、

Pepper自身も感情を持っているように動作する。人の行動、周囲や自らの状況に応じて、Pepperの感情が変化するのだ。この「感情」は、胸のディスプレイに表示させることが可能で、視覚的に伝えるだけでなく、そのパターンをグラフとして表示することもできる。
また、会話ができることもPepperの特徴だが、その会話はワンパターンではない。話しかければ話しかけるだけ内容も変わっていくのだ。単純な会話だけでなく、ニュースを読み上げたり、クイズを出したり、ゲームで盛り上げたりと、さまざまなことができるようになっているのも楽しい。これらの機能をつかさどる人工知能は、日々学習し、その人に合わせた反応を返すようになる。
このような機能を活用することで、Pepperは、接客ロボットとしてすでに実用的にも利用されつつある。ある程度決まった状況での対応いうのは機械にとって得意とするところであり、回数を重ねることで学習し、場合に応じた接客が可能になる。まさに、人工知能がフルが活躍しやすい状況なのだ。
「家族目線」における人工知能の役割

オムロンから発売されている、人工知能による顔認識エンジンを搭載したインターネットカメラ。認識技術としては、「顔検出」「顔認証」「性別推定」「年齢推定」「表情推定」「顔向き推定」「視線推定」「目つむり推定」「手検出」「人体検出」「ペット検出」の11種類の認識が可能だ
別の例も紹介しよう。オムロン(株)から発売されている「家族目線」は、カメラをはじめとする、さまざまなセンサーが搭載されている製品だ。たとえば、赤ちゃんを撮影していて、泣いた場合にだけお母さんの手元のスマートフォンに知らせるというようなことができる。これを実現しているのは、本体に内蔵された人工知能だ。
先述のPepperの例とは違って、すべての情報をクラウド上で処理するのではない。本体の人工知能である程度の処理を済ませてからクラウドに必要な情報だけを上げていく。画像データによる顔認証、性別や年齢、表情などの情報を本体上で検出・判別できる。ちなみに、ここには同社が開発した画像センシング技術「OKAO Vision」が使われている。さまざまな位置や角度でも顔を検出し、表情や動きまでも認識するという技術だ。

このように端末の機器でもデータを解析するという考え方は、米SISCO社が「フォグ(霧)コンピューティング」として提唱している。つまり、「クラウド」(雲)のように遠隔地で集中的に処理するのではなく、霧のようにユーザーに近い場所で、柔軟に素早く処理しようという考え方だ。デバイスの高機能化により、こうした方式は増えていくことが予想される。それにより、ノイズの少ないデータがクラウドに集約されることになり、より高度で緻密な解析が可能になる。
今後は、ネットワークに接続される機器が増えることは間違いなく、このようにIoTとクラウドを使い分けることも重要になってくる。そして、そこにも新たな価値を提供できる可能性が生まれるはずだ。
言語解析を目的とした人工知能
人工知能は言語解析にも使われている。その例としてはAppleのSiri(シリ)やMicrosoftのCortana (コルタナ)、Googleの音声認識など、多数の実装がある。

Amazonから発表されたインテリジェントなスピーカー(日本未発売)。人からの指示を音声認識で受け取り、実行する。家の中のさまざまな機器とも連携し、家庭内のコントローラーともいえる動きを実現している。音声認識のレベルは、静かなところでは非常に高く、聞き取れなかった場合もエラーとそっけなく言うのではなく、センテンスで返答するので、自然なやり取りが可能だ
Amazonが2015年に発表した「Amazon Echo」(以下、Echo)は、人工知能を搭載したスピーカーだ。Echoには、Amazonの音声サービス「Alexa」が組み込まれており、認識された音声をさらに解析し、発話者のニーズにあった内容を返すようになっている。Echoは、すべてを音声でコントロールする必要があり、音声認識にも言語解析にも人工知能が活用されている。それだけにとどまらず、Echoを家庭内のIoTデバイスのハブにするを目指しているようで、さまざまなIoT機器との接続も可能になっている。

NTTドコモの「自然対話プラットフォーム」が活用されているため、かなり高精度の音声認識ができる。ニュースやレシピ、飲食店情報などを教えてくれるのだが、そのやり取りは事前に用意された数千のシナリオ沿って会話する
音声認識を利用したIoTは、日本のおもちゃにもある。(株)タカラトミーの「OHaNAS(オハナス)」だ。NTTドコモの「しゃべってコンシェル」の自然言語解析機能を応用した「自然対話プラットフォーム」を使っており、スマートフォンと接続してクラウドで音声認識や返事の生成を行う。OHaNASのハードウェア自体はスピーカーやBluetoothモジュールなど、非常にシンプルで、実際の解析はクラウドで行うという方式は、家庭内のIoTとしてさまざまな「モノ」に応用できそうだ。
IoTが人工知能を加速させる
センサーが取得したデータに基づいて何かを実行するというタイプのアルゴリズムは昔からあったが、「赤い色があったら右に曲がる」といった単純なものだった。
現在のIoTなどで使われる人工知能は、「機械学習」や「ディープラーニング」という言葉に代表されるように、「人工知能が自分で考えて答えを見い出す」ということが大きく違っている。つまり、センサーが取得した情報について「考え」て、よりよい接点になろうとするというのが、イマドキのIoTだ。この「考える」という部分に人工知能が必須なのだ。
現在、世界中のお金と研究者がこの分野に集められ、人工知能の進化にしのぎを削っている。人工知能の発展には、大量の学習データが必要であるため、IBMやGoogle、 Amazonといった大手企業は自社の人工知能を一般に開放し、利用者を増やそうとしている。
音声や画像を入力として人の要求を解釈し、適切なフィードバックを返すという賢い人工知能が、我々の生活の中に自然な心地よさを実現してくれる日は近い。

- 小泉耕二
- IoT専門Webサイト「IoTNEWS」代表。(株)アールジーン代表取締役。IoTのインスピレーションをかき立て、仲間作りを促進するため、日夜さまざまなテーマで取材をしている。 https://iotnews.jp/