00:13
にゃおのリテラシーを考えるラジオ、読書と編集の千葉直樹です。
このチャンネルでは、読書とIT時代の読み書きソロ版を中心に、様々な話をしています。
今回のタイトルは、
ピクセルで自動文字起こしをやってみてわかったこと
想像しているだけでは何もわかっていない、という話です。
最近、Googleのピクセルというスマホのアプリで、音声からの文字起こしをやってみました。
音声データから文字起こしをするサービスやアプリケーションは割と古くからあるのですが、
どれもお値段が高い割には出力がイマイチというものばかりでした。
文字起こしの代表的な用途としては、会議の議事録作成がありますが、
やってみると、人が作る議事録とは似てもにつかないケースが多かったのです。
議事録を作るというのは、単純に音声を文字にするだけではなくて、
背景や発言の文脈をきちんと理解して、
ふさわしい用語を選んで文章にするという高度な指摘作業なのです。
今の技術レベルはそれに遠く及びません。
とりあえず認識した音声をとにかく文字にする、という段階です。
実際には単純に音声を文字に変換するだけで、
例えば、当店や苦当店を売ったり、開業したりということだけでも、人が自分でやるというのが普通でした。
ということは、変換された文章らしきものは、区切りなくダラダラと続く文字列だということで、
とても読みにくく、読みやすく編集するだけでもひと苦労だったのです。
でも今回ピクセルの文字起こし機能を使ってみると、
当店苦当店だけでなく、ある程度段落分けのようなことまでしてくれます。
家族性は段違いです。
まだ単語の変換ミスは割とありますが、
ダラダラ書きを分かち書きにするのと比べれば、修正していくのは全然楽です。
いずれは修正を学習して、正確な変換ができるようになっていくでしょう。
今回やってみて感じたことは、
やっぱりものは実際に使ってみないとわからないということでした。
良いことばかりではありません。
文字起こしを効果的に使うには、
03:02
キーボードを打つために練習するのと同じか、それ以上の訓練が必要そうだということもわかりました。
カジュアルに話すことは文章を作ることとは全く違います。
文章を書くためには文章らしく話す訓練が必要なのです。
文字起こしをしてみると、いかに相手に伝わらない話をしているかが白日の下に晒されてしまいます。
もっとわかりやすく、リズミカルに、言いたいことを簡潔に話す練習が必要となるのでしょう。
僕はこのポッドキャストを一度書いた原稿を読む形で収録しています。
それでは本末転倒です。
話したことを文章にしても困らないように、日々話す練習をしていこうと思います。
読書と編集では、ITを特別なものではなく、常識的なリテラシーとして広める活動をしています。
詳しい内容については概要欄のリンクから、
または、読書と編集と検索して、
猫がトップページに出てくるホームページをご覧ください。
ではまた。