SSブログ

今日から始まる面白いサービスです^^;

今日から始まるこんなサービス‥ご存知ですか?^^;

音声認識サービス‥

記事は‥

********************

NTTドコモは2012年2月27日、同社のスマートフォン向けの新サービス「しゃべってコンシェル」を3月1日から開始すると発表した。スマートフォンに向かって話しかけるだけで、Wikipediaや乗り換え案内情報などの検索、通話やメールの作成、アラームや音楽プレーヤーの操作ができるというサービス。「明日の天気を調べて」「東京駅までの終電の時間は」などといった風に、自然な言葉で話しかければ、サービス側で意図を理解して最適と思われる結果を返してくれる。アンドロイドOS 2.2以上の主要なドコモ端末に対応し、アプリ本体やサービスは無料で提供。ただし、話した内容はすべてドコモのサーバー側で処理するため、利用に伴って通常のパケット通信料が発生する。同様の機能はアップルが「Siri」という名称でiPhone 4S向けに提供している。Siriは現在のところ英語、ドイツ語、フランス語のみの対応だが、2012年内の早い時期には日本語にも対応する見込み。今回のドコモのサービスはSiriの上陸に備えた対抗策とも取れるが、アップルとドコモの思惑は、実は微妙に異なっている。会見の内容、そして実際にテスト段階のサービスを使ってみた感触から、ドコモの狙いを探った。

メール本文の入力も可能。しかし…

 利用はいたって簡単。「しゃべってコンシェル」のアプリを起動し、マイクのアイコンが付いたボタンをタップして話しかけるだけだ。 まずはシンプルな操作で試してみた。「朝8時にアラームをセットして」「カメラを起動」といった簡単な内容はあっさり認識。さらに、「メールする」と話しかけると「宛先を教えてください」と返された。実際の操作の流れに沿い、使い方のわからないユーザーをガイドできるようにもなっている。しかも、メールの作成は宛先の設定にとどまらず、本文まで音声で入力可能。一度に長く話しかけるとエラーになるが、文章ごとに区切っての入力なら、かなりの長文でも問題ない。スマートフォンの操作がわからない人、極端に忙しいのでしゃべるだけで済ませたい人など、多様なユーザー層にアプローチできそうだ。

 乗り換え案内もチェック。「渋谷から横浜までの乗り換えを教えて」でも、「渋谷から横浜、乗り換え」でも問題なく認識され、自動的に乗り換え案内のウェブ検索結果が表示された。意味のあると思われる言葉を抽出し、最適と思われるタスクを呼び出しているようだ。設定画面であらかじめ自宅の最寄り駅を設定しておけば、「自宅に帰る」と話しかけるだけで、GPSで認識した現在位置をもとに自宅までのルートを表示してくれる。

 さらに、「富士山の写真を調べて」と話しかけると、富士山をキーワードにした画像検索の結果を表示。ウェブ検索は画像のほか、ニュースやエリアガイド情報(レストラン、店、病院など)、Twitter上のつぶやきの検索にも対応している。

 発表会でのドコモによるデモでは、「今日の予定を教えて」と話しかけたところ、「しょうが焼きを調べて」と認識され、クックパッドのしょうが焼きのレシピが表示されるハプニングもあった(2回目は正しく認識された)。実はこのハプニングから、ドコモがこのサービスに込めた狙いが垣間見える。

Siriとは決定的に異なる開発コンセプト

 意外なことに、「しゃべってコンシェル」は単純なウェブ検索には対応していない。例えばiPhone 4SのSiriの場合、「Search the web for smartphones(スマートフォンについてウェブで調べて)」に対して、単純に「Smartphones」をキーワードにしたウェブ検索結果を表示するが、しゃべってコンシェルにはこれに当たる機能がないのだ。厳密に言うと、検索対象は「エリアガイド、レシピ情報、乗り換え案内、地図、天気、ニュース、つぶやき、画像コンテンツ、動画コンテンツ、音楽コンテンツ、アプリ、ゲームコンテンツ、本/コミック、教えて! goo、Wikipedia」に限られている。これらの情報源は、多くがドコモの公式サービスや公式コンテンツ。例えば画像検索やつぶやき検索なら、すでにドコモのスマートフォン向け「dメニュー」上で提供されているサービスと全く同じ検索結果が表示される(画像検索はgooのエンジンを利用、つぶやき検索はTwitterとの提携による独自の検索結果を利用)。ゲームや音楽コンテンツなども、公式コンテンツを中心とした結果が表示される。

 つまり、ドコモの狙いは「ドコモの豊富なサービス、コンテンツへの導線を作ること」(NTTドコモ・サービス&ソリューション開発部長の栄藤 稔氏)にある。ドコモにとって、増え続ける自社コンテンツへの導線をいかに分かりやすく整理するかは積年の課題。自社が主体となって開発し、しかも「実用段階に達した」(栄藤氏)と誰もが認めるレベルの自然言語処理の技術があれば、活用しない手はない。「ネットワークの向こう側にあるドコモの多様なコンテンツを、ユーザーのニーズに合わせて取り出せる点が、Siriとの最大の違い」(栄藤氏)なのだ。

 単純なウェブ検索ができない以外は、Siriと比べてアプリケーション連係の面では大きく見劣りする部分はない。メール作成に代表されるように、機能面ではむしろ優れている部分もある。「語彙は数十万語で、90%以上の認識率」(栄藤氏)という言葉通り、極端に騒がしい場所でなければ認識精度も十分だった。あとは、ウェブ上のデータに関して「ドコモのサービス、コンテンツへの導線である」というスタンスを取っている点を、ユーザーがどう受け止めるかだろう。例えば、レシピを探すとクックパッドのレシピしか表示されない。ゲームコンテンツなどはdメニューでの検索結果で表示される範囲でしか表示されない。Siriが日本に上陸する際は、Siriが利用している強力な検索エンジン「WolframAlpha」が日本語では使えないため、ウェブ検索に関しては単純なキーワード検索に限定される可能性が高いが、実はそれで十分なユーザーは多いだろう。

 音声認識をめぐる単純な対立構図ではない。国内のユーザー向けにコンテンツを蓄積し、サービスを磨いてきたドコモと、一つのサービスプラットフォームで世界市場を切り開いてきたアップルの戦いとも見て取れる。

********************

ちょっと考えただけでも 使い道は沢山ありますね^^;

帰ったら 早速導入して使ってみます^^/

コメントは後日ということで‥


nice!(1)  コメント(0) 
共通テーマ:blog

銀杏並木の路肩から・・

温泉観光都市愛媛県松山市在住の夜専門タクシ-ドライバ-の日記です(笑)☆ 色んな事のボヤキ満載?かも・・