Ubuntuを含むLinuxシステムで音声をテキストに変換する方法です。
Linuxシステムで利用できる音声認識ソフトウェア、特にネイティブ・デスクトップ・アプリケーションは多くありません。IBM Watsonやその他のAPIを使用して音声をテキストに変換する利用可能なアプリケーションはいくつかありますが、ユーザーフレンドリーではなく、適切な言語でのプログラミングやスクリプト作成など、複雑なユーザーインタラクションが必要です。
しかし、ChromeからGoogleドキュメントにアクセスすることで、独自のAI技術を使った高度な音声認識が利用できることを知るユーザーは多くありません。
この機能を使えば、高度なコンピュータの知識がなくても、誰でも音声をテキストに変換することができます。Googleドキュメントのこの機能の最も優れた点は、ChromeをサポートするUbuntu派生版やLinuxディストリビューションで使用できることです。
Ubuntuで有効にする方法を見てみましょう。
音声をテキストに変換する方法
前提条件として、お使いのシステムにChromeがインストールされており、Googleアカウントを持っている必要があります。Chromeがインストールされていない場合は、 こちらのリンクから Chromeをダウンロードしてインストールしてください。
また、Googleアカウントをお持ちでない方は、 こちらのリンクから 無料で作成できます。
ステップ 1
Chromeから https://..om Chromeから開き、空白のドキュメントを作成します。
ステップ 2
白紙の文書を読み込んだら、メニューから「ツール」→「音声入力」をクリックします。
ステップ 3
左側にマイクのアイコンがあります。マイクアイコンをクリックすると、Chromeが初めてブラウザからマイクにアクセスする許可を求めます。許可」をクリックします。
デフォルトでは、音声の検出言語としてシステム言語を使用し、テキストに変換します。これまでのところ、Googleドキュメントは60以上の言語をサポートし、認識し、テキストに変換します。
ステップ 4
許可」をクリックすると、マイクのアイコンがオレンジ色に変わり、音声を受信または認識できるようになります。言いたいことを何でも言ってみてください!音声がテキストに変換され、文書に書き込まれます。
完了です。これで、Google ChromeとGoogle Docsを使ってUbuntuで音声をテキストに変換することに成功しました。
トラブルシューティング
上記がお使いのブラウザで動作しない場合は、必ず以下をご覧ください。
- 設定ウィンドウが開きます。
- プライバシー > マイク」に進みます。
- をクリックし、有効になっていることを確認してください。
まとめ
しかし、最近ではAmazon Pollyのようなクラウドベースのソリューションもあります。しかし、それらは非常に高価です。また、役に立つ知識も必要です。
Google Chromeに内蔵されている音声認識は、使い方が簡単です。少し遅いですが、一般的なユーザーには十分です。
経由:





