自然と人間を行動分析学で科学する

島宗 理@法政大学文学部心理学科【行動分析学, パフォーマンスマネジメント, インストラクショナルデザイン】

Macの音声入力システムを使って原稿を書いています。

Ht5449_dictation_icon_mul

 先週、テニスの試合で手首を痛めたこともあり、現在、Macの音声入力システムを使って原稿を書いています。

 変換の精度、スピードともに、以前に比べれば遥かに改善されています。

 以下、いくつか気がついたことを書きます。

  • 句読点や括弧なども、「まる」、「てん」、「かぎかっこ」と言えば入力できます。改行も「かいぎょう」でOK。
  • Appleのサイトによると、スペースは音声入力できないことになっていますが、「いちもじあける」と言えば、半角スペースが入力できます。
  • 何度か「ぜんかくでいちもじあける」と言ってみましたが、「全角 」となってしまいます。全角スペースは今のところ入力できないようです。
  • 音声認識に癖があるようで、たとえば「じはつされます」と言うと「1初sale」と認識されます。何度かイントネーションを変えて言い直してみても同じでした。「1初sale」という日本語はないので、意味解析はしていないということかもしれません。
  • スピーカーから離れて話したり、窓を開けていて通りの雑音が入ると、誤認識が増えるようです。同じ理由で、音声認識モードのまま、誤認識した単語をキーボードで修正しようとすると、キーボードを叩く音を変換しようとし、とんでもないことになります。
  • とんでもないことになったのを見て思わず笑ってしまうと、これまた変換しようとし、さらにとんでもないことになります(「パパパパパパはパパ」とか)。
  • 残念ながら、誤認識した文字列を、音声で修正することができません(「もとい」とかで直前の入力をキャンセルできればいいのですが)。
  • 間違って認識した単語のところに手動でカーソルを持っていくと、修正候補が出る場合もありますが、正しい単語が修正候補にない場合も多くあります。

Photo_3

Photo

Photo

 

  • ソフトウェアにもよるようです。私はJeditXをメインに使っているのですが、Wordでは変換修正候補がでないし、Apple純正の「メモ」や「テキストエディター」でも動作が異なるようでした。
  • Appleによると、使えば使えるほど音声認識の精度が上がるということですが、修正候補から正しい単語を選んでも、直後に同じ単語を話したときにすぐに反映されるわけではないようで、同じ間違いを繰り返します。
  • この原稿も音声入力していますが、上記の「反映される」は、最初「阪急される」に変換され、修正候補はなぜか「hank you」でした。
  • 全体的にはまだまだお茶目な音声認識と変換システムですが、それなりに使えるレベルにはなっていると思います。
  • クライアント独自の辞書も活用しているようです。私のところでは「好子出現による強化」はかなりの確率で正しく変換されています(それか「神子湿原による強化」のどちらかです)。
  • どうやら基本的にはクラウド形式で運用されているようなので(Mavericksからはネットに接続しなくても使えるプラグインが用意されたようです)、ユーザーが増えれば増えるほど精度が上がるはずです。皆さまもこのシステムの育成に、ぜひご協力下さい。

追記:

 音声入力で原稿書いてみると、普段原稿を書いているときには、いかにキーボード入力に思考が影響されているのかわかります。考えながら話をするというのが、とても難しいことに気がつきました。

 キーボードで原稿を書いているときには、頭で考えるよりも先に(or 頭で考えるのとは別に)手先が動き、頭では入力された文字列を読みながら考えているのではないかと思うほどです。つまり二つの行動系が協力、強調して書いている感じ。音声入力だと、考えるのと話すのが同一の行動系なので、言わば、二馬力が一馬力にパワーダウンしたように感じます。

 音声入力にただ慣れていないだけなのかもしれませんけども。

 このあたりの研究、ありそうかな?