00:13
にゃおのリテラシーを考えるラジオ、読書と編集の千葉直樹です。
このチャンネルでは、読書とIT時代の読み書きソロ版を中心に、様々な話をしています。
今回のタイトルは、ピクセルの文字起こしで想像した未来
音声を機械が学習するということは、ということになります。
このポッドキャストは、50回目から、ノートに文字起こしを掲載しています。
どのように文字起こしをやっているかというと、収録をGoogleのスマホ、ピクセルでやっているのです。
と言ってもよくわかりませんよね。
ピクセルのレコーダーアプリを使って音声を録音すると、自動的に文字起こしもしてくれるのです。
ただ、今は変換ミスがちょこちょこあります。
人名などはキーボードで入力するのも難しいですから無理もありません。
ただ、キーボードの日本語変換は、語変換を選択し直すことで学習が進んで、ある程度正しい変換ができるようになります。
レコーダーアプリの文字起こしは、今のところはまだそのような修正による学習はサポートされていないようですが、
音声と変換文字列は連動しているようで、いずれは修正がフィードバックされるようになるでしょう。
さらには、和舎を識別してその人の話し方の癖まで学習するようになるかもしれません。
今は文字起こしにしか使われていませんが、 和舎の特徴を捉えることで、音声によるコンピューターの操作がしやすくなることでしょう。
もっと先を考えると、声紋や話し方の癖という特徴を使った認証や、
ある人の声紋と話し方の特徴を使って文章を読み上げるということもできそうな気がしています。
もっともっと先には、ある人がそれまでに書いたり語ったりしたものをベースに、その人が言いそうなことをアプリケーションが言うということもできるようになるかもしれません。
実際には音声だけではなく、その人の周りにある環境とか、互換が捉える情報も必要になるのでしょうけれど、
そこまで行くと自分のコピーを作ることもできてしまいそうです。 これは今はほとんど妄想の世界ですが、
スマホのようなデバイスを常に身につけて歩いたり、文章を入力したり、知りたいことを検索して、得られた情報を読んで学んだりしていると、
03:01
自分でも気がつかない自分の情報を貯めているというふうに考えても不思議ではありません。
それを気味が悪いと考えるか、人の進化だと捉えるかは意見が分かれそうですが、
難しい呪文を覚えなくてもプログラミングができるというふうになったと考えることもできます。
そして現在のプログラミングはまだ原始的だけれども、 実は自分のコピーを作るということでもあると考えるとちょっと面白いと思いませんか?
読書と編集では、ITを特別なものではなく、常識的なリテラシーとして広める活動をしています。
詳しい内容については概要欄のリンクから、または読書と編集と検索して猫がトップページに出てくるホームページをご覧ください。
今日もワクワクする日でありますように。 千葉直樹でした。
ではまた。