AIの進化により、音声入力や自動翻訳の精度がかなり向上しました。そんな中、マイクロソフトが先日リリースした「Group Transcribe」。会議に使える翻訳と文字起こしを同時に行なうAIアプリとして注目されているので、実際に使ってみましたので、レビューしたいと思います。

使い方は簡単。アプリインストール後、開始ボタンを押すだけ

現在はiOS向けしたありませんが、普通にAPP STOREからインストールします。

インストール後は、自分のニックネームを入れて、「開始」ボタンを押すだけ。すると、即座にセッションが開始されるので、iPhoneのマイクから拾う音声を自動文字起こししてくれます。

気になる文字起こしの精度は? 思ったよりもいい!

さて、それでは実際の自動文字起こしの精度はいかほどでしょうか? Microsoft Wordにも音声入力機能が実装されていますが、体感値としては、それよりも精度が高いように感じました(※実は同じエンジンだったということであればスミマセン)

↓こちらは、普通のスピードで、ひとり語りした時の文字起こし結果です。100%精度で文字起こしをしてくれています。

次に、実際の会話でのやりとりを文字起こしさせたのがこちらです。言葉が重なったり、単語を識別仕切れなかった箇所は、不自然な日本語になってしまっています。実際に、間投詞(ええと、など)が入ったり、綺麗な文法で会話されていないので、文字起こしも難易度が高いはずで、精度としては60-70%といったところでしょう。

多言語でのリアルタイム翻訳文字起こしも可能

「Group Transcribe」の優れている点は、多言語間での同時翻訳文字起こしが可能なことです。違う言語同士で会話しても、手元のiPhoneで「Group Transcribe」を使えば、自分の発言内容が、相手言語に翻訳され相手に伝わり、相手の発言が自分の言語に翻訳されて文字起こしされた情報が手元のiPhoneで確認できます。

デモ動画になりますが、1:00のところから再生してみてください。中国語と英語のやりとりがなされていますが、かなりスムーズですね。

このアプリがあると、海外との電話MTGもプロ通訳なしでいけそうです。