1. ちえラジ Chat ポッドキャスト版
  2. 音声認識本当に使ってる?
2023-01-19 03:53

音声認識本当に使ってる?

spotify apple_podcasts youtube

最近ブログやポッドキャストで音声認識の話を聞くけど、皆さん本当に使ってんの?って思った話をしました。 #音声認識 #ちえラジフリートーク


* 日本語入力システム「ATOK」 | ATOK Passport |【公式】ATOK.com https://atok.com/

--- Send in a voice message: https://podcasters.spotify.com/pod/show/takamichie/message
00:04
チェーラー実写と木曜日始まりました。今回はですね、フリートークということで、音声認識本当に使ってる?っていう話をしようと思います。
皆さん、音声認識って使ってますかね?最近のパソコン、スマートフォン、大抵の機種には音声認識っていう機能ついてますね。
しゃべった言葉をテキストに変換してくれる。例えば、それをそのままツイートにしてみるとか、ブログの作成に使ってみるとか、そういうようなことができます。
もちろんテキストなので、後で編集することもできますよっていうような仕組みです。ブログの下書きとか、そういうようなところに結構使ってて、まあまあ使えるかなっていうふうに思ってはいます。
ただ、これなんか、皆さん本当に音声認識使ってるの?っていうふうに思うところもあって、最近音声認識についての話は他のブログとかポッドキャストとかでもちょこちょこ聞いて、
なんかすごくいいんですよ、変換精度ものすごいんですよっていう話とか、編集の必要がないんですよとか、あとは場合によってはね、まあおかしな動作をすることはあるけれども、
使い手が合わせればなんとかなるみたいな話を聞いて、でも嘘これ使い手が合わせられるレベルじゃないでしょっていうふうに思うところは結構あるんですよね。
変なところに句読点が入ったり、語字が入り込んだり、あとは漢字のご変換とかがあったりっていうのはよくあります。
いくらなんでもこれは合わせられないでしょうっていうふうに自分としては結構思うんですよね。
Windows音声認識は自分は一番のところ一番よく使ってるのかな?まあこれは結構編集がしやすいというか、編集前提の動きをするんですよ。
方向キーを押すと勝手に音声認識がオフになるとか、そういうような挙動をしてくれるので編集がしやすい。
だから編集と合わせてまあまあ使えるっていうの認識なんですけれども、正直編集前提なんですよね。
やっぱり句読点がおかしくなったり、丸で終わるはずのところが点になったり、点で終わるはずのところが丸になったりね。
とか漢字を直す必要があったりとか、絶対に手直しが必要になってくるっていうのが最近の認識です。
で、これ以上音声認識が進化するのって何が必要なんだろうなっていうのも時々思ってて、
個人的にはやっぱり今の技術の延長線上にはないんじゃないかなっていうふうな感覚があります。
むしろ精度はもうそこそこにいいんですよね。
で、精度が上がる必要があるってわけじゃなくて、精度よりなんていうか気配りというか補正力というか、そういうものが必要なんじゃないかな。
例えば、安倍さんと安倍さんと安倍さんみんな漢字が違う。これを呼び分けるって前後の文脈ないと結構きついと思うんですよ。
あとは私と私とあたしみたいな、そういうのも多分言い分けってすごい難しいと思う。
本人はあたしって言ってるつもりなのに、言葉の癖とかもあって私に変換されちゃうとか、そういうものとかって山ほどある。
03:08
だからやっぱりそういうような補正をかけていく力がないと、もうどうしようもないんじゃないかな。
個人的にはなんかエイトックみたいな補正力のある日本語入力システムの持ってるところにやってほしいなって気はしますけどね。
辞書とかを見てうまくやってくれるし、文脈を見てここはこういうふうに変換すべきだなって変換してくれるし、結構いい精度出るだろうなぁと思うんですけどね。どうでしょうかね。
はい、ということで今日のお話はこれくらいにして終わりにしていきたいと思います。
明日は金曜日お休みラジオトークの方でライブはするかもしれません。
あさって土曜日、週替わりテーマ地域についてですね、お話ができればと思います。ではでは。
03:53

コメント

スクロール