iOS 11 では、Apple の AI ベースのパーソナル アシスタント Siri の音声がより自然になり、Siri の音声を人間らしくするのに大いに役立ちます。 Siri は、より速く、よりスムーズなリズムで、引き伸ばされた音節とピッチの変化で話します。これは、iOS 10 の機械のようなサウンドとは明らかに異なります。
Wired
の Apple マーケティング担当副社長グレッグ・ジョズウィアック氏とともにアセロ氏が行った新しいインタビューによると、Siri シニア ディレクターの Alex Acero を含む Siri を支えるチームは、Siri の話し方の改善に何年も取り組んできたという。 Siri の音声認識機能は、Siri の初期段階ではサードパーティ企業によって提供されていましたが、Acero のチームは数年前に Siri の開発を引き継ぎ、それ以来パーソナル アシスタントにいくつかの改良が加えられました。
Siri は、ディープラーニングと AI テクノロジーを活用しており、音声認識機能が大幅に向上しています。
Wired
によると、Siri の生の音声認識機能は、Alexa や Cortana などのライバルと同等の、ユーザーの音声の 95% を正確に識別できるようになりました。
「それはまるでレースを走っているようなもので、誰かが私たちを引き止めていたのです」とアップルの製品マーケティング担当副社長、グレッグ・ジョズウィアックは語る。ジョズウィアック氏によれば、Apple は常に Siri に関する大きな計画を立てており、「電話で話しかけることができ、より簡単な方法でこれらのことを実行してくれるアシスタントのアイデア」だったが、その技術は十分ではなかったという。 「ゴミが入ったらゴミが出てくるんです」と彼は言う。
Joswiak 氏は、Apple の当初からの目標は、Siri を「すぐに完了できる」マシンにすることであったと述べています。 「私たちはこれを些細な追求として設計したわけではありません!」彼は
Wired
に語った。 Apple は、Siri が人々のより多くの作業を支援できる自動化された友人として機能することを望んでいます。
Siri のユニークな特性の 1 つは、複数の言語で動作する機能です。 Siri は、英語、フランス語、オランダ語、北京語、広東語、フィンランド語、ヘブライ語、マレー語、アラビア語、イタリア語、スペイン語などをサポートしており、方言のバリエーション (イギリスやオーストラリアの英語など) やアクセントも含まれています。 Siri チームは、ローカル音声の既存のデータベースと、ローカルの音声タレントおよびデバイス上のディクテーションを組み合わせ、コンテンツを文字起こしおよび分析して、特定の言語の個々の音声すべてとそれらの音声の発音方法をすべて見つけます。
Apple が音声ディクテーションを提供しているが Siri をサポートしていない地域では、将来の Siri サポートに備えてデータを収集しており、すでに Siri が利用できる地域では、ユーザーとデバイス間の音声対話 (匿名で収集) がアルゴリズムの改善と会社のニューラル ネットワークのトレーニングに使用されています。 。
特定の言語で Siri に適切な音声を作成できるかどうかは、適切な音声の才能にかかっています。Apple は何百人もの人々を対象とした「壮大な検索」を使用して、無理をせずに親切でフレンドリーで元気があり、楽しそうに聞こえる人を見つけます。適切な人物が見つかると、Apple は適切なサウンドを作成するために一度に数週間にわたって録音します。これまでのところ、Apple は Siri がサポートする 21 言語すべてに対してこのプロセスを繰り返しました。
Acero と彼の Siri チームは最終的に、Siri をロボットというよりも信頼できる人間のように聞こえるようにすることを目指しており、Siri がクエリに適切に答えられない場合でも、AI に愛着を持って「Siri を偉大にする」ことができます。 Apple はまた、Siri でできることとできないこと、そしてそもそも Siri が存在することを人々にもっと知ってもらいたいと考えています。そのため、
iOS 11
には、クロスデバイス同期やユーザーの興味や好みの理解を深めるなど、Siri 中心の機能が含まれています。 。
Siri が音声のさまざまな側面をどのように認識するか、また Apple が声優の人材をどのように選択するかについて詳しく説明した
Wired
の記事全文は、
このサイトで
読むことができます。