1. 鶴岡慶子/花火・天気・ことば
  2. 【1332】2026/01/25 DX音声ガ..
2026-01-25 06:52

【1332】2026/01/25 DX音声ガイダンス、まさかのアナログ収録

spotify apple_podcasts youtube

2026/01/25

サマリー

クラウド電話サービスの進化が話題となっており、AIが電話応対の効率化を進めています。また、アナログな音声収録の経験から、電話の声に込められた特別な意味について語られています。

クラウド電話の進化
おはようございます。花火鑑賞士、気象予報士の鶴岡慶子です。
この配信では、花火や天気、言葉に関することなどをお話ししています。
最近電話をかけると、ご用件お話しくださいというガイダンスが流れて、後から折り返しが来るという仕組みに続けて出会いました。
これは留守電とちょっと違うみたいなんですね。こういうの流行っているのかなと思いました。
これは用件の内容によって、その内容をAIが判断して、本人につなげるかどうかを分岐するというクラウド電話というサービスです。
考えてみるとこの仕組みはとっても合理的なんです。
もともとのニーズは、電話対応をすることで、今やっている作業を止めたくない、遮られたくないということなんです。
例えば建設現場もそうかもしれませんし、絵を描いていたりとか、私ももしかしたら司会の仕事現場本番やっていた時って、電話対応できないんですね。
あとは社長さんの直通電話とかでしょうか。
共通しているのは、手が離せない時間がある程度長いということです。
電話に出ないと無視されたと思われてしまったりとか、機械損失につながることもあります。
そこで生まれたのが、一度声で受け止めるという発想です。
その内容によって仕分けが起こりますので、留守電とはちょっと違います。
コールセンターがやってきたみたいな感じです。
何の用件かだけ教えてもらって、必要な時だけつながるようにするんです。
そうじゃないものは弾かれちゃうということです。迷惑メールみたいに別のフォルダに入れられるみたいな感じです。
こういうニーズが高まって、はっきりこれが動き出したのは2020年頃だそうです。
スマホが完全に仕事道具になって、音声の文字起こし精度が実用レベルになって、そしてコロナ禍です。
電話番の人を置けなくなりましたし、在宅とか分散勤務が増えました。
そこで電話もリアルタイムで縛られない情報にしようという考えが一気に広がっていったんです。
アナログ収録の体験
ということで今のこの仕組みっていうのは、電話には出ないでも受け止めるというものなんです。
電話を一旦人から切り離したと言えるかもしれません。
その発展型としてクラウド電話では、要件を振り分けて担当者に転送したりとか、
人を返さなくてもできる予約とか注文とか返品とか、そういったものはもう自動で行っちゃうということですね。
その場合は電話の転送は必要ないです。
そういうふうにもうAIが賢くなったっていうことも、このサービスが成り立つようになった背景にあるなって思います。
さてそんなクラウドの時代に、私は先日ちょっぴりアナログな仕事をしました。
まさにある事務所の音声ガイダンスをしたんです。
これスタジオ撮りだと思って行ったら、電話機の受話器を持って、
さあシャープを押して録音して、そしてシャープを押して録音を終えてくださいと言われました。
久しぶりに固定電話の受話器を持ったんです。
もうこれって自分の留守電を入れる感覚ですよね。
普段私スマホは電話の時ってスピーカーホンにして、耳に当てずに会話することも多いので、受話器を持つっていうことが久しぶりだったんですね。
収録の時そのままどうぞ、あなたのタイミングでどうぞって言われたので、
いやこのエアコンの音入りますけど大丈夫でしょうかとか、音質も決して綺麗じゃないですよねとか、大丈夫って思ったんですが、
実際に聞いてみたら、全然そのエアコンの音が入ってるって感じじゃなかったんですね。
考えてみればそうですよね。環境音ってこともありますけれども、電話ってそもそも人の声を優先するものですからね。
他の音があまり聞こえないっていうのはそうだなって思いました。
でも本当この形で収録するとはってびっくりしたんです。
てっきり私は何かブースの中で録音するんだろうなって思って出かけていったんですね。
というのも以前そうだったからです。さらに言うならば最近はもう私自分のとこのスタジオで喋ってその音声データを送るっていうやり方でお仕事ってしてるので、
これはちょっとびっくりすることだったんです。
かつて留守番電話とかATMとか機械操作のガイダンスの音声って実は何回か担当したことがあるんですね。
ただにその会社では使っているはずなんですけど、ああいう音声ってリズム一定で割と無機質である必要があるんですけど、
でも人がやりますので無感情ではないんですね。
でも表情を出しすぎると人すぎるし、抑えすぎるとじゃあAIでいいじゃんってことになっちゃうので、
そのさじ加減がまあ難しさでもあるんですけど、一定のリズムででもほんのわずかに人の温度がある声を心がけて撮りました。
特に気をつけるのは1を押してください、3を押してくださいみたいな日常会話には入らないあの0コンマ何秒かの間です。
それを体で覚えていたのは今回すごく助けになりました。
最新のクラウドの仕組みを支えているのがこんなにアナログな声だったんだなーっていうのもなんだか面白かったです。
1を押してください、3を押してくださいというあの独特の間を入れながら、
全体の収録は40秒ぐらいの原稿だったんですけど、一気に録音して結果は一発okでした。
当たり前なんですけど、こういうガイダンスの声とか施設のアナウンスの声って、私がその施設だったり留守番電話を使っても私の声が流れるんですよね。
CMとかラジオから自分の声が聞こえてくるっていうことはよくあることなんですけど、でもあれはたくさんの人に向けて放たれた声ですね。
でもATMとか留守番電話の声って必ず1人に向かって届くんですよね。
その時間は受話器の向こうにいるその人だけに届くものなんです。
だからなんですかね、なんかマイクでの収録ではなく受話器を持ったっていうことも手伝って、ちょっと特別感がありました。
この配信はApple Podcasts他各種プラットフォームでお届けしています。
Listenではこの配信のテキスト版を公開しています。
合わせてご覧ください。
それではまた明日。
06:52

コメント

スクロール