iPhone 4Sでは音声から日本語を入力する機能が搭載されています。その変換精度がヤバいという話。
音声変換で、"桂歌丸さん"と"rhymesterの宇多丸さん"を混同しないことに驚いている。前後の言葉も含めての判断なの?
— Yusuke ******** (@niccolli) April 29, 2012
日本語はめんどうなもので、同じ読み仮名でも違う意味の言葉や、読み仮名も発音も全く同じなのに意味の違う言葉なんてものが存在します。上がその例。"うたまるさん"は当てられている漢字が違うだけで、発音は両者ともに同じ。これをSiriのシステムは完璧に使い分けるんですな。
もちろん"うたまるさん"だけでは、どっちかの判別は無理。ぼくの場合、1回目は"宇多丸さん"と変換されたので、おそらく変換履歴でも見ているのだろうと。だいたいの人は歌丸さんだと思います。
これに前後の尾ひれがつくと、変換の分岐が完璧になります。"らいむすたーのうたまるさん"のときに、後半が歌丸さんになることが(いまのところ)起きません。逆もまた然りで、"らくごかのうたまるさん"では想像通りの変換結果になります。単語じゃなく、文章(単語のつながり?)で判定していることがわかります。
どっちのうたまるさんも同じ発音なのにな。"宇多丸申し訳jr."では、確実に歌丸を選ばない。
— Yusuke ******** (@niccolli) April 30, 2012
もうひとつ。"うたまるもうしわけじゅにあ"なんて面倒な日本語も一発。後ろに"申し訳"がついているってことは、ここは歌丸ではなく宇多丸だなと判定していますね。
辞書サーバのチューニング加減ではあるのですが、サーバにはどんだけ収録してるのかとか、単語どうしの関連の重みづけ具合なんかとかが気になってしまうのです。"申し訳ないとフロム赤坂"のフロムがきちんとカタカナに変換される理由とかね。最後に定番のめんどうな日本語を。
"貴社の記者が汽車で帰社した"これは定番
— Yusuke ******** (@niccolli) April 30, 2012