Appleは次のiPhoneの音声認識を発表しました。 大したこと。 Androidは1年以上それを持っていました。 Appleは「キャッチアップ」をしているだけで、この機能はとにかく大したことではありません。 右?
間違い。 「大したこと」と書かれている文を除いて、その冒頭の段落のすべてが間違っています。 Siriは非常に大きな取引であり、最大の取引です。
実際、Siriは、これまでの10年間にモバイルで発生する最も重要なことです。
Siriの否定論者は2つの陣営に分類されます。1)大したことではないと言う人。 2)Androidは8月から使用されていると言う人。 否定論者の両方のクラスは間違っています。
Siriは非常に大きな取引です
私が詳述したように このCultofMacの投稿、Siriは、その系統を歴史上最大の人工知能プロジェクトであるペンタゴンのCALOプロジェクトに直接さかのぼります。 CALOは「学習して整理する認知アシスタント」の略で、このプロジェクトにはA.I.のさまざまな側面で300人を超える世界のトップ研究者が参加しました。
ペンタゴンプロジェクト全体は、現在AppleのiPhoneグループのエンジニアリングディレクターであるAdamCheyerが率いていました。
と話す MITテクノロジーレビュー、チェイヤー 言った CALOは、「対話と自然言語の理解、ビジョン、スピーチ、機械学習、 計画、推論、サービスの委任、およびそれらすべてを…人間のようなアシスタントに統合して、 やったこと」
彼は、Siriプロジェクトを消費者製品で同じことをしようとしていると説明しました。 実際、過去4年間、Cheyerと彼のチームは、 強力な携帯電話から実行でき、毎日何百万人ものユーザーが使用できるCALOテクノロジー 消費者。 過去1年半の間、彼らはSiriテクノロジーをiPhoneOSとアプリケーションセットに統合するために懸命に取り組んできました。
「音声認識」ではありません。 それは人工知能です。 そしてA.I. あなたの携帯電話で非常に大きな問題です。
SiriはAndroidの音声アクションとは異なります
Android Voice Actionsは優れたテクノロジーであり、多くのAndroidファンに広く使用されています。 しかし、実際にはSiriと同じクラスではありません。
Android Voice Actionsは、高品質の非常に堅牢で有能な音声認識エンジンを提供します の周りにあった同様の製品やサービスの広い範囲のスペクトルの終わり しばらく。
既存のすべての音声コマンドおよびディクテーション製品と同様に、比較的狭い範囲のコマンドを言う必要があります。そうしないと、理解できません。
一方、Siriは、一般の人々がこれまで使用してきたものとは異なります。 あなたは技術的または文字通り持っていることを言うことができます あなたが言っていることとは何の関係もありません、しかし、多くの場合、Siriは、通常の人間の発話を理解するように設計されたコンテキスト、歴史、および人工知能に基づいて、あなたが何を意味するのかを理解します。
たとえば、仮眠のアラームを設定したい場合は、「20分で起こして」と言ってください。 もし、あんたが 後でどの会議を予定しているか知りたい場合は、次のように言うことができます。 見る?"
これらの入力は、使用するアプリケーションも必要な情報も具体的に参照していません。 それでもSiriは理解しています。
人間として、私たちはそのようなコメントの理解を当然のことと考えています。 しかし、機械にそのようなトリッキーなフレーズを理解させることは、人工知能の聖杯です。
さらに人間らしいのは、Siriとの会話を開始すると、さらに不可解なリクエストを理解できるということです。 たとえば、「徒歩圏内に一流のイタリアンレストランはありますか?」と尋ねる場合があります。 Siriが「いいえ」と答えた場合は、次のことができます。 「メキシコ人はどうですか?」と言います。 Siriは、ウォーキング内のトップクラスのレストランについての会話のコンテキストで入力を解釈します 距離。
Android Voice Actionsは、人工知能ではなく音声コマンドソフトウェアであるため、このようなことはできません。
Siriは、Web検索結果を表示したり、アクションを実行したり、iPhone上のアプリケーションを制御したりすることがあります。
しかし、WolframとAlphaの統合のおかげで、Siriも質問に答えます。 「30マイルで何キロですか?」、「パリは何時ですか?」、「ピアノのオクターブは何ですか」、「空が青いのはなぜですか」などのランダムな質問をすることができます。 そしてSiriはあなたに答えを与えるでしょう。 Webページではありません。 あなたの質問への答え。
Siriの最大の優れた点は何ですか
しかし、歴史的および文化的な観点から見たSiriの最大の利点は、人工知能であるということではありません。 AppleがSiri経由でA.Iを作成するということです。 主流の日常の現実。
その理由は、AppleがiPhoneを使用するコアエクスペリエンスにSiriを焼き付けているからです。 また、Siriは、ほぼすべての人が魅力的に感じるような方法で、主流の日常的な使用のために設計されています。
主流化とは、人間の文化の周辺にあるものを取り入れ、それを膨大な数の人々の日常生活の一部にするプロセスを意味します。 現在、Google VoiceActionは文化の端にあります。 通りの平均的な個人はそれを聞いたことがありません。
Siriが主流になります。 iPhoneユーザーでなくても、ほぼすべての人がこれに慣れることができます。
エジソンは電球を発明しませんでした。 彼は製品の設計とマーケティングを通じてそれを主流化しました。
フォードは自動車を発明しませんでした。 彼はコスト削減とマーケティングを通じてそれを主流化しました。
私たちは主流派を覚えています。なぜなら、これらはすべての人のためにテクノロジーを日常的に使用する人々や企業だからです。 そして、現在のすべての電球と車をエジソンとフォードまでさかのぼることができます。
Google VoiceActionsは人工知能ではありません。 しかし、これは、ユーザーが音声を使用して、視覚的なインターフェイスを介して入力、タッチ、およびナビゲートする必要があることを行うための効果的な方法です。
ただし、Androidツールは音声コマンドを主流にしていません。 多くのパワーユーザーがそれを使用しています。 しかし、あなたのお母さんはSiriを使うでしょう。
後もう一つ
iPhone 4sは、Bluetooth 4.0をサポートする初めての電話かもしれません。これは、デバイスをウェイクアップできるという巧妙なトリックを実行する超低電力テクノロジーです。
このワイヤレス機能をSiriと組み合わせると、いくつかの興味深い用途があります。 たとえば、バッテリー寿命が非常に長い腕時計を想像してみてください。この腕時計は、しばらく触れない限り、またはSiriが着信情報で目を覚ますと、スリープ状態になります。 そしてもちろん、スマートフォンがスマートフォンやハンドバッグに入っているときに、時計に話しかけてSiriに話しかけることもできます。
また、話しているときにiPhoneをウェイクアップして、スタートレックを有効にする専用のデスクトップマイクを想像することもできます。 ボタンを押さずに話し、エンタープライズから応答を返すという経験、つまりiPhone、 A.I.
それでは、Siriが人類にとって何を意味するのかを明確にしましょう。 Siriは、人間と機械のインターフェース、大衆向けの真の人工知能における新時代の幕開けを表しています。
いいえ、完璧ではありません。 Appleはそれを「ベータ」と呼ぶという珍しい一歩を踏み出しました。 いいえ、それは超高度な種類のA.Iではありません。 あなたは空想科学小説で見ます。
しかし、それもまだ終わっていません。 iPhone4sのSiriはほんの始まりに過ぎません。 将来のバージョンはこれまで以上に洗練されたものになるでしょう。
グーグル、マイクロソフト、その他は独自のA.Iを発表します(この順序で、私は予測します)。
だから、ついにSiriと話す機会があったら、いいね。 Siriは非常に大きな問題であり、これまでにないものとは異なります。 これは、コンピューティングの新時代を表しています。 そしてそれは間違いなくみんなに話をさせるでしょう。