1. ちえラジ Chat ポッドキャスト版
  2. 第2回 テックLTポッドキャスト..
2025-09-15 05:00

第2回 テックLTポッドキャストカレンダー AI聞きまちがい集

2 Mentions 2 Comments
spotify apple_podcasts youtube

第2回 テックLTポッドキャストカレンダー のネタとして、AI聞きまちがい集というお話をしました。 #AI #声日記 #テックLTポッドキャストカレンダー

サマリー

第2回テックLTポッドキャストカレンダーでは、AIによる聞き間違いの実例が紹介され、様々な誤変換への対策が議論されています。また、文字起こし辞書の活用方法やAIを用いた作業のコツについても言及されています。

AIによる聞き間違い
ちえラジChat月曜日特別会始まりました。今回は第2回 テックLTポッドキャストカレンダー AI聞きまちがい集ということでね、AIが今まで自分のポッドキャストとかそういうのを文字起こしした時の聞き間違いとかね、そういうのもちょっと紹介したり、あとそれに対する対応の話とかをちょっとしようかなっていうふうに思っています。
このちえラジChatでよくあるのが本当にね、ちえラジChatという言葉自身が結構ね、聞き間違えられるんですよね。
チェイラッチチャットとかチェイローチャットとかジェイラッジチャットとかまだわかるんですけどね、あのいえいえラジチャットとかね、いえいえラジオチャットとかその「オ」どっから来たんだよっていう気はするんですけどね。
なんかそういうような誤変換が結構多くて、なんか自分で見ててもね、え、この間違い方あんの?って笑っちゃうぐらいの時もあるんですけども、やっぱりそういうような間違いが結構多かったりして、その度にね、このLISTENには文字起こし辞書っていうものがあるのでね、管理者だけ触れるんですが、こちらのものを使って結構修正はかけています。
あとは次は山手縁乃庭っていう文字ですかね。ヤマタエンノバとかヤマダエンダバとか。あとはね、山手縁座場とかいうようになったりしますし、山手が大和っていうようになっちゃうことも結構ありますね。なんかそういうふうないろんなこともあったりします。
あとはSBCast.のゲストさんでKEYAKI TERRACE YAHATAさんっていうのがね、先週金曜日に配信されましたが、KEYAKI TERRACE YAHATAさんの名前も結構間違えられたりしますかね。あとはそう、あとは普代村ですね。これもね、まあさすがに普代村なんていう村の名前をAIは知らないのか、二井村とか普段村とか二村とかそういうふうに訳されちゃったりすることもありますかね。
まあこれはね、LISTENの文字起こし辞書っていうのにね、まあ次2回以上出そうだなっていう時には毎回登録をしています。何しろ、自分結構昔のSBCast.の内容を引っ張り出してきて「この話がね…」とかいうようなことを言ったりしますからね。
まあ自分の配信でも、その配信の内容をまとめたAI文字起こしとかその辺の作業とかにも、あとは録音した内容を最近自分で録音した内容を全部NotebookLMに投げて、それの概要生成とかもしたりするんですが、それの中でもね結構文字起こしの辞書っていうのは活用しています。
一応コツとしては、なるべく長い単語を置き換え対象にするって感じですかね。例えば助詞まで入れるとかね。そうすると他の単語にヒットしてしまう可能性が減りますので、まあその方にした方が自然に変換できる可能性が若干高まるよっていうような感じで、自分はそんな感じでやっています。
結構この辺も工夫をしながらっていう感じになります。なので本当自分の文字起こし辞書っていうのはすごく多いですよ。言われればそのうち開示するなんてこともしてもいいのかななんて思っています。
まあとにかく最近このAIを使った文字起こしとかまとめとかそういうのはすごく頻繁に行ってて、先ほどちょろっと言った録音についても結構やってるんですよ。
自分の日々の活動、基本的になるべく自分が一人の時とか、移動しているだけの時とかそういう時の内容を全部録音して、その内容を全部NotebookLMに入れて文字起こし、まあ内部でされるんですけどもそれで文字起こししてもらって、それの概要を作るとかね。
今日この日何やったっけとかそれをタイムラインでフローチャートとして示してねとかそういうのことをやったりしてるんですがまあまあ良い結果が出てくるんですよ。誤字はひどい多いんですけどね。
なんですがまあ割と良い精度で分かっている人から見ればああそういうことやったなっていうふうに思い出せる程度の内容が出てきます。
なのでそういうようなものを使って、まあでもAIを使うだけとにかく使ってみた方がいいかなというふうに思うんです。これだけやらないとAIって何者ってよくわかんないので、なんかその辺もどんどん繰り返していければいいなというふうに思っています。
なんかねこちらの方もちょっと笑っちゃうもの多いんですけどね。自分の名前なぜか高さんって呼ばれることが多いんですよ。
多分みっていう言葉がよく聞こえないとか、別の発言に聞こえちゃうことが多いんですかね。そういうものが結構あるんでそういう誤変換とかもね、そのうちまたネタが溜まったらお話ができればいいかなっていうふうに思ったりしています。
今日のお話はこれでおしまい。ちえラジChatは毎週平日こんな感じで配信をいろいろと行っています。
ではでは
05:00

このエピソードに言及しているエピソード

コメント

LISTENの文字起こしは、カンペキを目指すとしんどいですよね~

文字起こしは完璧になり得ないからこそ置換機能は便利ですね。逆にほかの音声文字起こし機能の多くは完璧を目指しているぶん困るというか。 まあ贅沢を言うと正規表現置換なんかまで出来るともう少し柔軟に置換できるんですが(似たパターンを一括置換ではなく、後続する言葉などに依存したマッチ)

スクロール