パソコンやスマホでの文字の入力手段はキーボードが主流ですが、慣れた人でないと、なかなか高速に打ち込むのは難しいものです。また、慣れた人であっても、大量の文章を入力するのは、手が疲れたりするので、大変であることには変わりません。
「こんだけパソコンが発達したんだから、しゃべりかければそのまま文字になったり、聞き取った音声をそのまま翻訳してくれるアプリがあればいいのにな~」というのは、多くの人が一度は考えたことがあるでしょう。
確かに、その試みは以前から行われてきました。
でも、音声をテキストに変換するというのは、私が考えるよりもずっと難しいことだったんです。
まず、コンピュータには、人の声とその周りの雑音の区別をつけるのが困難です。パソコンのマイクから入ってくる音を解析して、人の声と周りの音に分解する必要があります。また、それができたとしても、人の声はそれを発する人によって様々で、言語によって、年齢によって、くせによって全く異なります。
私も、音声をそのままテキスト入力させたくて、「Dragon Speech」という音声認識のソフトウェアを使ったことがあるのですが、ソフトをインストールした後に最初に行ったのは、指定された文章を読むことでした。
たくさんの母音や子音、接続詞が含まれた文章を読んで、ソフトに覚えさせることで、私の発音のクセを「学習」させていたんだと思います。
で、それが終わって、いざ大量の文章を入力しようと読み上げてテキスト変換してみましたが、その精度はあまり良いものではありませんでした。パソコンでは所詮この程度か、、、とがっかりした記憶があります。
しかし!それから数年の間に、音声テキスト化の技術は飛躍的に進化していたようです。
今回、「Dragon Speech」を販売していたNuance Communications(ニュアンス コミュニケーションズ)のスマホ用のアプリ「Dragon Dictation」を試してみたところ、その精度がものすごく良くなっていて、十分実用に耐えるものになってたんです。
近年、Pythonやほかの言語による機械学習がブームになっていますが、音声の学習にもその技術が使われているのだと思われ、「Dragon Dictation」の利用の際には、私の声を学習させる必要すらなくなっていました。(世界中の人の音声データを効率よく学習できるようになった?ためかな。)
今回はその「Dragon Dictation」の使い方と実力をご紹介します。
「Dragon Dictation」のインストール
「Dragon Dictation」は、iPhone,iPadで提供されています。(2017/1現在は無料)

残念ながらAndroid版はありませんが、「Swype Keyboard」というアプリの音声入力機能が、同じ技術を使って作られています。無料ではありませんが、トライアル版もあり、使い勝手に満足したら、購入されても良いかもしれません。

「Dragon Dictation」の使い方
iPhone版のアプリをインストールしたら、はじめに音声認識させる言語を選択します。「設定」からいつでも変更できます。

つぎに、使用許諾への同意を行った後、以下の、連絡先に関する使用同意の承認があります。私は念のために、連絡先へのアクセスとデータのアップロードは「しない」にしました。

次は、マイク機能へのアクセス許可です。音声入力する必要があるので、これは「OK」を押して承認しないといけません。

では、早速音声認識を開始します。画面下の赤い「認識」ボタンで音声認識が開始され、終了ボタンも同様に画面下のボタンを押します。

今回、「私は、あまり1文が長くならないように、適宜読点をいれたり、適切な長さで改行を入れることで、視覚的にも文章のまとまりが分かりやすくすることを一番に考えています。」という文章を読み上げてみました。変換の結果が、以下の画像です。

「1文が」が「自分が」となっているところと、「適宜」が「敵機」になってるところ以外は、完璧にテキストになっていました。ほかにもいろいろな文章で試してみましたが、驚異の認識率でした。
精度に関してはもう、十分に実用に耐えられるようになっていて、これからもどんどん進化していくと思います。
1点、使い勝手が悪いのは、テキスト化された文章を、パソコン等に送るときです。SMSやTwitter、Facebookへの連携は簡単ですが、大量の文章をパソコンに送るには、コピーして、ほかのメモアプリなどに貼ってから、転送する必要があります。Onenoteなどのスマホ、PCを自動で連携するソフトを使うと、その手間も少し軽減できますが。。
このような認識技術は企業にとってはドル箱なので、それを無料で使わせてくれるのは、うれしいので、転送の手間は自分で工夫するしかないですね。