2024-02-05 01:59

遅延いやだよ〜

オンライン会議システムが仕事に、そしてたまに生活にも浸透してきたと思います。
特にコロナ騒動の時には人と会えないことの代替システムとしてZoomをはじめとしてLINEやGoogleMeetやなにやらなにやら裾野がめちゃくちゃ広がってきました。
たかがテレビ電話と思ってた昔からあるサービス、実は結構賢いシステムとして再認識しなければなぁと思う日々です。

でも、こういうデジタルというかバーチャルなミーティングって、リアルで会って会話するのとくらべてとってもストレス溜まります。
主な原因は、画像や音声の品質のうち、相づちや掛け合いに影響する音声の遅延です。相手の返事が遅れて聞こえる経験、ありますよね?
システムを使って会話してる人には意外と認識されにくいんですが、自分が喋った声や姿が先方に伝わるまでに、リアルよりも時間は余計にかかってるんです。デジタル処理、インターネット経路などいろんな時間が余計にプラスされますから。

健常者とてこの遅延というものに対抗する手立てはありません。
だって遅く聞こえるものをもっと速く聞こえたと予測想像して認識するってのは無理なのでねぇ。
相手の正確やパターンが読み切れてれば話は別かもですが。

最近ラジオ番組の編集ちうコトに没頭したりしてるんですが、Macやインターネットを使った番組コンテンツ作成はほんとに身近になったと痛感します。
何千万何百万の機器や設備を備えなくても、プロ級の録音・編集・配信ができる時代です。
この「級」にもいろいろ有るけど、そこそこプロに聞こえるような音作りでも、Mac/PCを除き、数千数万円レベルの機器がいくつかあればできちゃうんですね。

級を一つ上げるごとに、金額にゼロが一つ付くってイメージでいいと思いますが、今求めているのは最終的にPodcastで聞いてもらうときに、「良い作品だね」と思ってもらうような作り方をすることになります。
リアルで発生する声を、デジタル化せずにそのままその場で聴いてもらうのを100点とするならば、減点方式で音は劣化して言ってしまいます。
でも、減点されたものをテキトーにうまく組み合わせて最終的に番組という作品に仕上げれば、全員ではないにしろ、良いと思ってもらうモノになるかもと思いつつ作る、というか創るのです。

絵とか作曲とかに似てますよこの分野。
決して完璧な100点は存在せず、真っ白なキャンバスによかれと思って自分が自分たちが色を塗りたくっていく。
良いという人もイマイチまたはクソというひとも必ず存在する、と。

こんなこと思いつつ、あぁ~宿命やぁ〜〜と感じるのは光速と音速ですね。
物理の世界ですから、人間がどうこう言っても無情に物理が答えてくれるだけです。
おいっ!と発声して、何だ!?と帰ってくるまでに、音波の伝達経路には遅延の仕組み・回路が有りまくりなのです。

それに輪をかけてデジタル機器のカタマリシステムであるオンライン会議システムなんぞ使ってしゃべった日には、正常な会話ができるわけありません。
正常な会話風な何かができてるだけで、用件は伝えられてもアートにするには程遠いという感覚です。まぁやっつけ仕事の類にアートが求められるケースはレアですからね。
だからこそ、仕事はオンライン、感情情緒を交わす飲み会などはリアルでってことになっていくんでしょうなぁ。

で、このオッサンは何をぐちゃぐちゃ言うてるんやということの解説風を以下に書いときます。

リアルな同室での二人の会話を想定し、2m離れた人との会話にまつわる遅延の計算をしてみます。
音速は空気1気圧15℃で秒速340m/sとして、
2(m)/340(m/s)=0.00588(s)=5.88(ms(ミリ秒))
かならず相手の声は、自分の耳の入口までに0.006秒ほど遅れて到達してるんです。

それを脳が認識して、意味を解析して、自分の知見や感情をプラス加工して言語化して声帯や喉やベロに司令を出して発生し音波化して2m先の相手に返事をする。
こんな経路や工程をへて会話のキャッチボールが行われてる、ということをまぁ普通は誰も認識しないですよね。
でもこれが現実でして、この壁は絶対に超えられないんです。

もっと速く会話のキャッチボールしたいなら、ヘリウム(+ちょっとの酸素)で満たされたところに住んで、人間の脳を今のシングルコアCPUからクワッドコアくらいにしないと、って感じでしょうかね。まぁ無理っす。
なので、リアル世界では長年にわたり人間が(たぶん)進化して、↓こういう事になったんだと思います。

脳は音がどのくらいの早さで進んで来るか正確に知っている
https://www.aist.go.jp/aist_j/press_release/pr2003/pr20030227/pr20030227.html

難しいこと書いてあるけど、文中の結論っぽい、
>>視聴覚情報を統合する時に、脳が音の時間遅れを観察距離に応じて補正していることを示している。
ってのを読んで、すごいと思う。
人間は音と光の伝わる速度を、脳で自動補正して認識してるってわけですなぁー。

でも、オンライン会議システムでは無理ね。

あと人間のCPUの反応時間のハナシですが、ホント遅いですよ。
同じ脊椎動物の猫と比べても、人間て反応遅いでしょ?
昆虫やカメレオン比較でも人間はめっちゃどんくさい。

いかん、芋づる式に止まらんのでこのへんで('◇')ゞ
---
stand.fmでは、この放送にいいね・コメント・レター送信ができます。
https://stand.fm/channels/62c0f5551459d9dde06c0f41
00:05
みなさん、おはようございま〜す。
オンライン会議システム、使ってますかね?
Zoomとか、Google Meet、Teamsなんかもそうですね。
こういうのって、インターネットの発達だとか、コンピューターの処理速度が速くなったとか、
まあ、いろんな要件が重なって実現しているものなんですけども、
どうもね、やっぱり遅延っていうのがありまして、
普通の会話とは程遠いような、このあいづち、あいの手を入れにくいとか、話に割って入るとかね、
なかなか難しいですよね。
これの原因っていうのはね、ほとんどが遅延が原因ですね。
遅れて伸びる遅延ですよ。
なんでこの遅延が起きるのか、これに気がついている人は多いと思うんですけども、
どうしてこれが起こるのか、宿命とも思える原因がいくつもあるんですよね。
例えば、同じリアルの部屋の中に2人、2mぐらい間隔を空けて座ってるとするじゃないですか。
そこで会話をすると、どれくらい遅延してるかっていうと、
空気中の音速が宿命で、だいたい6msなんでそうですね。
0.006秒。
で、それが耳を通って脳が認識して意味を解析して、
自分の知見とか感情をプラス加工して、言語化して、声帯や喉やベロに指令を出し、
そして音波化して2m先の相手に返事をするわけですね。
このキャッチボールが一番自然な会話なわけです。
ところがオンライン会議システム使うじゃないですか。
この6msに対して10倍100倍ぐらい遅れちゃうんです。
必ず間にデジタル処理が入るからですよね。
将来人類進化したら、この致命的な遅延もカバーできるようになっちゃうかもしれませんね。
って話でした。
パローでした。
では、また明日。
01:59

コメント

スクロール