ロボデックスでの技術セミナー「ロボコミュニケーション元年? ロボットは AI の夢を見るか?」での内容を一部再編成してここに残しておきます

ヒューマノイドロボット NAO

このビデオに出てくるロボット、 NAO、歴史は古く、2008年に国際的に行なわれているロボットのサッカーコンテスト、ロボカップの標準プラットフォームとして登場したのが第一号、その後改良を重ね、現在販売されているものは第5世代になります。
NAO の顔、どこか Pepper に似ていませんか? NAO はフランスはアルデバランという会社で開発されたロボットです。
Pepper はソフトバンクロボティクスとアルデバランによって開発されたロボットということで NAO は Pepper の兄貴分にあたります。
その後アルデバランはソフトバンクロボティクスに吸収され、現在 NAO も含めアルデバランが開発したロボットはソフトバンクロボティクスのロボットとして販売されています。

NAO の機能

NAO は25の関節を持ち、Linux OS上に独自の制御OS を搭載した自律型のロボットです。 2008年に最初のバージョンがリリース、その後バージョンアップを重ね、音声認識、会話機能は第4世代で標準機能として搭載されます。
NAO の標準の音声認識機能はキーワードベースの音声認識で、あらかじめ定義しておいた言葉のどれを聞いたかということを判別する音声認識です。
例えば、「はい」、と「いいえ」を音声認識エンジンに登録することで「はい」と聞いたか、「いいえ」と聞いたかを判別することができるようになります。
音声認識は、プログラムから発動させることにより開始されまして、音声認識中は、NAO の目が青い色がぐるぐる回るような表現をします。
NAO とコミュニケーションをとるとき、これらの信号を見て人側で NAO に話しかけるタイミングを見計らう必要があります。

クラウド音声認識の利用による新たなロボットと人との会話の可能性

このビデオでの音声認識、実は標準機能以外の方法で音声認識を実現しています。
標準の音声認識機能は NAO 本体の中で音声を聞き取る組み込み型の音声認識です。これに対してここでは、NAO のマイク音声をライブでクラウドサーバーにストリーミングし、クラウドの音声認識エンジンを使って音声認識をさせています。

音声は常時バッファリング、音声認識のタイミングを NAO 側が見計っており、音声認識をする段になると、そこから一定時間遡ったところから音声認識を行っています。これにより人側は話しかけるタイミングを見計らう必要は無くなりました。話している最中目が青くなりますが、これは NAO が音声認識のタイミングを見計ったことを示しています。

ロボットとの会話によるコミュニケーション、まだまだ先だと思っていました、数ヶ月前までは。しかしクラウドの音声認識エンジンと NAO をつなげてみて私の意識は大きく変わりました。音声認識分野において技術の進歩は加速度的です。コンピュターの性能が上がり、機械学習などの周辺の技術が進歩したことで、音声認識の精度は日々上がってきています。 従来 NAO は音声認識を苦手としていました。小さい頭の中にはマイクを搭載されていて、そのマイクの周辺には CPU があり、CPU を冷やすための冷却ファンがありという状況、このためマイクには常にノイズが混入しています。 NAO に正しく音声を認識させるのは結構なコツが必要でした。

Amazon Echo、Google Home と音声アシストデバイスが今、北米ではトレンドです。 音声によるマンマシンインターフェースは間もなくタッチインターフェースの次のメジャーインターフェースとしてその幅を利かせてくるのは間違いないという印象があります。  実用が始まることでビジネスの循環が生まれ、この循環が音声認識のさらなる性能向上をもたらす。音声認識はいよいよ本格的な成長の段階に入ってきたのではと私は思っています。

我々としてはこの音声認識の進化をいち早くロボットに取り入れそこにロボットの新たな価値と可能性を見つけていきたいと考えています。

このデモでは返答文をクラウド側で引き出してきて NAO に発話させています。 音声認識した言葉は Google Cloud Natural Language API を使い単語に分解しています。
Google Cloud Natural Language API は言葉を単語に分解するだけでなく、各単語を地域名などの幾つかの分類に自動的に振り分けてくれるます。 そこで単語と、単語ごとの分類を記録、この中に地域名が含まれているかどうか、天気というキーワードが入っているか、今日や明日といったキーワードが入っているかをチェックし、これらのキーワードが入っている時、天気予報サービスから天気予報を取得、返答文を作成。またこれら情報のいずれかが欠けている場合はその部分については前回の内容を引き継ぐこととしています。  さらにどの情報も含まれていない場合は、QA ベースの会話エンジンに流し、一問一答形式で受け答えをしています。
天気予報部分の処理は独自実装で、QA ベースの会話には現状 IBM Watson を活用しています。 この辺りは現在試行錯誤の段階であり、今後、さらにいろいろな手法を試したいと思っています。

マンマシンインターフェースとしての音声会話、すぐに起こりそうな今後の可能性

北米では Amazon エコーの会話機能をつかさどる Alexa が 3rd party にその開発プラットフォームを解放したことで急速にその能力を向上させているようです。

Alexa が日本に来るのはまだ少し時間がかかるようですが、その動きには大変興味があります。 Alexa の開発プラットフォームを見るとルールベースの会話の定義であり、今回の天気予報の会話の仕組みを実現しているものと大きな違いがあるわけではないようです。

これは今の段階における現実的な手法だと思っています。今の段階において実用レベルで実現可能性な会話機能というのは言ったことを着実に行ってくれる召使との会話のようなもので、それに加えて、まずは人が機械との会話の仕方を覚える必要があるのかもしれません。調べ物をして欲しい時は 「◯×を調べて」という、質問をしたい時は「◯×はなんですか?」と聞くとか。

Amazon Echo、Google Home と音声アシスタンスデバイスの活躍の場は間違いなく今後増えていくとして、同じようなことを腕がついて動いたりするロボットでやる意味はあるのか?  確かに家庭向けを考えると、現時点ではコスト面を考えると早すぎるとは思います。

しかし家庭ではないシーンで音声会話をインターフェースとしたロボットは今後どんどん増えていくべきと思っています。それは会話によるコミュニケーションは今後間違いなくソーシャルロボットに求められる機能の一つであり、ロボットゆえの進化の領域があると考えられるからです。

将来的には何故それをロボットでやる必要があるのではなく、それロボットができるのにわざわざ他のデバイスを用意する必要あるのという時代が来ると私は信じていて、現在その途中の過程にいるのだと私たちは信じています。

スマートロボティクスについて

スマートロボティクスは去年2016年の4月に始まったばかりの非常に新しい会社です。社名に「ロボティクス」とあるように我々はロボットをやる会社として創業しました。
ロボット技術で世界を少しでも便利に、良くしていきたいという思いのもと集まったメンバーからなり、私を含め何名かは NAO のメーカ、アルデバランの出身であり、海外の製品のローカライズ、国内展開は我々が得意とすることの一つです。
アルデバラン出身者以外の者たちも様々な形で過去にもロボットに携わり、その情熱をもとにスマートロボティクスの事業立ち上げに携わってきました。

私は技術部に属していますが、技術部はなかなか面白い面々の集まりです。

ロボットに思いを馳せながら CAD 設計を仕事としてやってきていたもの、小学生の頃発明家の家に入り浸り電気工学と機械工学の基礎を学び大学ではロボカップで世界大会に出た者、趣味でロボットを作り続け、専用のモーション作成ソフトまで作ってしまう者、皆ロボットをやりたいという思いでスマートロボティクスに集まりました。

我々のビジネスの柱は大きく2つありまして、一つは既成のロボットの販売とそれらのロボットで動くソフトウェアの開発、そしてもうひとつはロボットを始めとするオリジナルハードウェアの設計と製造です。

まず一つめの既成ロボットの販売とそれに向けたソフトウェア開発ですが、我々は NAO と Pepper の販売代理店であり、これらのロボット向けのソフトウェアーを開発し、そこに付加価値を加えることで新たな利用価値をお客様に提供、代理店の一歩先を目指しています。

私個人でいうと過去10年ほど技術サポートとして多くのお客様を支えてきた経験があり、技術面でお客様をサポートさせていただくことが私の何よりも得意とするところでございました。現職においては例えばソリューション開発のような形で様々なニーズを持つお客様と一緒にロボットの活用方法を模索していくことができればと考えています。

我々がもう一つの柱として掲げているのがロボットを含む様々なオリジナルハードウェアの開発と設計です。

我々の作るロボットとは全く新しい何かを作るというより、既成の色々なものを組み合わせてそれをロボットという仕上がりにしていくようなものかもしれません。

我々は様々なメーカー様と協力の関係を持ちながら進歩をしていく必要があり、様々な形での取り組みを現在模索しています。様々なロボットを生み出し、流通し、その魅力を常に下支えする。ロボットのことならとりあえずスマロボに相談しようとなれればと思っています。

仕事は辛いけど趣味には何時間も費やすことできます。スマートロボティクスの技術部は自分にとって楽しいこと居心地のいいことをやりきってそれで世の中に貢献し、それが仕事になるように今、一所懸命頑張っています。

私たちは私たちと思いを同じくする同志を探しています。我々と一緒に仕事しませんか? 関われる形はそれぞれの会社、個人あると思います。

どのような形であれ、ロボットで世界を良くしていきたい。そういった志がある方。私たちはあなたと一緒に仕事ができることを望んでいます。


スマートロボティクスで Pepper のアプリコンテスト 「Pepper App Challenge 2017」 に応募したアプリ「スマートロボ受付」が決勝戦に進むことになりました!

http://www.softbank.jp/robot/special/app-challenge-2017/

NAO の代理店である JTP 日本サード・パーティ株式会社、株式会社アウトソーシングテクノロジー社との連合チームで臨みます!  NAO、Pepper 愛を最大限ここに注ぎ込んでみたいと思います!

スマートロボティクスがこれまで積み上げてきた会話やリモートコントロールの機能を Pepper アプリとして組み込んが意欲的な作品です。詳細は決勝戦の会場で!

アプリコンテストの決勝進出以外にも、去年仕掛けてきた開発案件をついに受注できたり、勉強会、ハッカソンなどの技術サポートの要望をいただいたり、今年に入って大忙し!  やりたいことをとことんやりきって、それが仕事につながっていく。 ここにはいい流れが起こっています!


概要

NAOの転倒防止アダプターの紹介

はじめに

こんにちは。ハードエンジニアのGoe3です。

皆さんは、NAOの展示等を行う際に「転ぶのが心配だなー」と思った事は無いでしょうか?

スマロボでも、NAOアプリの開発を行っているたく爺より「NAOのモーション作成時に、転倒しないような物が欲しい」という要望を受けてました。

そこで、PCモニターアームと繋げれば良いかな?と思い、(一時期ドキュメント作成で溜まっていたフラストレーション発散に)試作してみました。

ついでに、2017/01/18-20に開催されスマートロボティクスも出店するロボデックス(ダイレクトマーケティング)に展示するNAO用マイクマウントも、昨日(1/16)要望があり突貫工事で製作しましたので、併せてご紹介致します。

CADデータ

NAO転倒防止アダプター

naomountback

マイクマウント

mimimimi3

取り付けイメージ

IMG_20170117_111627IMG_20170117_111621IMG_20170117_111645

写真撮影時は電源未投入ですが、起立可能です。
利用シーンとしては、NAOのモーション作成や、展示会などでの安定運用(転倒防止)に使用できるのでは無いかと思います。

マイクマウントは、見えている方のマイクはダミーで、耳の中に、NAOの音声を拾う為のマイクを仕込んでいます。
マイクをスピーカー等に接続する事で、展示会でのデモをより効果的に行えるかと思います。

まとめ

スマロボでは、NAOの転倒防止について、様々なアプローチを行っております。次回はソフトウェア的なアプローチについて、弊社技術メンバーより紹介出来るかと思います。ご期待下さい!!

おまけ

空も飛べるよ!!
IMG_20170117_111407