2012年4月30日月曜日

iOSの音声変換の精度が高すぎてビビってたじろぐ

iPhone 4Sでは音声から日本語を入力する機能が搭載されています。その変換精度がヤバいという話。

日本語はめんどうなもので、同じ読み仮名でも違う意味の言葉や、読み仮名も発音も全く同じなのに意味の違う言葉なんてものが存在します。上がその例。"うたまるさん"は当てられている漢字が違うだけで、発音は両者ともに同じ。これをSiriのシステムは完璧に使い分けるんですな。

もちろん"うたまるさん"だけでは、どっちかの判別は無理。ぼくの場合、1回目は"宇多丸さん"と変換されたので、おそらく変換履歴でも見ているのだろうと。だいたいの人は歌丸さんだと思います。

これに前後の尾ひれがつくと、変換の分岐が完璧になります。"らいむすたーのうたまるさん"のときに、後半が歌丸さんになることが(いまのところ)起きません。逆もまた然りで、"らくごかのうたまるさん"では想像通りの変換結果になります。単語じゃなく、文章(単語のつながり?)で判定していることがわかります。

もうひとつ。"うたまるもうしわけじゅにあ"なんて面倒な日本語も一発。後ろに"申し訳"がついているってことは、ここは歌丸ではなく宇多丸だなと判定していますね。

辞書サーバのチューニング加減ではあるのですが、サーバにはどんだけ収録してるのかとか、単語どうしの関連の重みづけ具合なんかとかが気になってしまうのです。"申し訳ないとフロム赤坂"のフロムがきちんとカタカナに変換される理由とかね。最後に定番のめんどうな日本語を。