ユピテルが提案する、ライフスタイルを豊かにする情報コラム

音声認識でリアルタイム翻訳が可能に? 技術は言葉の壁をいつ超えるのか

2021.7.5

スマートフォンをはじめ、音声認識の技術はますます身近になっています。それと同時に自動翻訳機能は進化を続け、その精度が高まっています。かつては不自然な文章になることが少なくありませんでしたが、今では違和感のない形で翻訳されるようになってきました。

AIが言語を認識するための方法も進化しているので、いずれは世界中の人と、言語学習や通訳なしで会話ができる日が来るかもしれません。
そんなリアルタイム翻訳と音声認識技術の今を見ていきます。

機械とおしゃべり。身近になった音声認識

リアルタイム翻訳

スマートフォンやスマートスピーカーに話しかけると、知りたいことを検索できたり、家電を好きに操作できたり。いまや機械とおしゃべりをする感覚で、日々の用事をカンタンに済ませられようになりました。これを実現したのは音声認識の技術と、音声アシスタントと呼ばれるAIです。

AIは、人のしゃべる言葉をテキストデータにしたうえで、意味を理解します。学習方法は「ディープラーニング」といい、まさに人間の脳細胞が学習していく方法と同じ。しゃべる言葉と出力側の“答え”が正しくなるルートを見つけ出せるまで、人の声を何度も聞いて「あいうえお」を判別していき、その次に単語や文節を聞き分けていきます。これらが辞書として登録されていくことで、やがて言葉の意味を理解するようになります。

これらの音声認識ができれば、AIアシスタントだけでなく、たとえばあなたがしゃべった日本語を別の国の言葉に翻訳する、といったこともAIにとって難しくありません。

言葉の壁がなくなる世界到来! リアルタイム翻訳の凄さ

リアルタイム翻訳

音声認識技術の向上で進化したのが、リアルタイム翻訳です。いまや文字を打ち込まなくても、音声入力で好きな外国語に翻訳できるアプリがあります。スマートフォンに話しかけるだけで、即座に翻訳した文章が表示されるので、外国人同士がその場で会話することも可能になるでしょう。

またリアルタイムに翻訳した言語を、音声合成によって自ら発音してくれるので、画面を見ずとも会話が成立します。語学が苦手な方にとっては、まさに頼もしい通訳をポケットに入れて連れ歩くような感じですね。翻訳精度の高まりによって、海外旅行やビジネスシーンにおいても外国人とスムーズに意思の疎通ができるようになります。

ただ現時点ではまだ、AIの性能によって翻訳の精度が劣るものもあります。翻訳精度を向上させるためにはディープラーニングがより多く必要となりますが、現在この学習方法自体に革命が起きつつあります。

賢くなった人工知能。翻訳の仕方に革命が起きている?

リアルタイム翻訳

機械翻訳による文章が時として意味不明になるのは、ひとつの単語には実に多くの意味があるため。ひとつの単語が文章の中でどのような意味を持つのかは、文脈の中でその単語が担う役割によって決まりますよね。

たとえば「はし」と口に出して言ってもそれが「橋」なのか「箸」なのか、あるいは「端」なのかが単独ではわかりません。でも「はし」に加えてもうひとつ「あるいた」と口にすれば、そのふたつで「橋」か「端」のどちらかを「歩いた」と推測できるはずです。

機械翻訳の精度が向上したのは、このように単語が増えるごとにひとつの単語の意味を特定していく方法、「RNN(リカレントニューラルネットワーク)」という反復学習を使うようになったからです。「橋」と「箸」の違いを、まぐれではなくて正確に理解するので、利用する我々は「この機械は賢い!」と驚いてしまうのです。

この学習方法はさらに進化し、現在「Transformer(トランスフォーマー)」という仕組みが活躍し始めています。Transformerは単語一つひとつを他の単語との関連性で判断するのではなく、文章全体をいっぺんに分析します。

先ほどの例で言えば、文章全体を俯瞰して聴いたうえでまず最初に「歩いた」という動詞に注目します。これに関連する単語として「はし」を見つけ、「橋を歩く」と理解します。このように発音された単語の順番で意味を理解するのではなく、文章全体を見渡してスマートに意味を特定させていくのがTransformerの仕組みです。

このようにAIは学習のロジック自体を進化させています。今後機械の性能が増し、ビッグデータも蓄積されることでますます自然な形で文章を理解できるようになるでしょう。

音声認識技術で会話を楽しむ新しい暮らしのカタチ

音声認識技術の向上により、リアルタイム翻訳も可能となりつつあります。さらに人工知能が学習することで、将来的には機械との複雑な会話が楽しめるようになるかもしれません。

☆あわせて読みたい
対話型人工知能とは?音声アシスタントとは違う、対話型AIの可能性を読み解く

〜〜〜〜〜〜

ユピテルの「Juno(ユノ)」は、音声認識技術によって楽しい会話を楽しめ、生活に癒やしを与えてくれるネコ型のバーチャルペット。また見守りロボット「ユピ坊」も、最新のアップデートによって音声認識技術による会話が楽しめるようになりました。音声認識技術による機械との会話を楽しむことは身近になってきています。

(2021.9.16追記)また新発売のレーザー&レーダー探知機「Lei05」も音声認識に対応。美少女キャラクター「霧島レイ」がドライバーに向かって話しかけ、それへの返答によってキャラクターの好意度がアップするなど、車内でも楽しいおしゃべりができます。

Lei05

Lei05」ブランドサイトより

(2021.12.20追記)また同じく「霧島レイ」が登場するバーチャル×フィギュア「LVR-01」も新登場。やはり音声認識に対応して会話が楽しめるだけでなく、エアータッチセンサーの搭載により(非接触ながら)画面に浮かぶレイと指先で触れ合えるというプロダクト。音声認識の先をいく、最先端バーチャルコミュニケーションを体感してみてください。

LVR-01


【執筆】ユピスタ編集部
ユピスタ (Yupiteru Style) は、ユピテルが運営するテクノロジーやライフスタイルを扱う情報コラムサイトです。日々の暮らしをもっと面白く、もっと安心・安全に過ごすためのさまざまな情報を発信しています。