00:00
5、4、3、2、これでいいよ。
これで、いつも通りのアバウトで会いましたと。
一旦、コール入れますか。
はい、どうぞ。
大人になれない男達のテキトータイム〜!
ということで、不穏な空気のまま幕開けをいたしました。
テキトータイム、第16回、議論が紛糾してまとまりません。
これ、いいコンテンツだね。
ということで、始まる前から大喧嘩になって、30分ぐらいずっと喧嘩しっぱなしだったので、これはコンテンツだということでポチッとしましたけど、
ポチッとしてからまた始まるのに、また10分ぐらいうんじゃくんじゃで、まとまらず始まりませんでしたけど始めましたよと。
荒手の喧嘩っていうの?これ。
これちょっと収集の兆し見えない、久しぶりのあれだよこれ。
面白い。
もうちょっとアビーブ顔アップして。
アップねこれちょっとできないんだよね。
カメラがさ、遠くで広角買っちゃったから。
だってすっごいアビーブ渋い顔してんだもん。
渋い顔。
拡大したいなと思って。
なんだっけあの、怒りながら笑うとか?
違う、表情が笑う、なんかあったじゃない?
あったよ、ブチギレながら笑えないよねみたいな。
ブチギレながら笑えないって。
さっきアビーブの笑いが苦笑いだもんね。
あ、そう?
いやだけどこの話題ね、ご存知の通り大好きな話題なんだよね。
やばいよこれ。
物理法則の話と、あと文化のすり合わせの話ね。
これ15分で終わるのかな?今日とかもうあれでしょ、基本10分から15分で終わらせる話じゃん。
そう、終わるかどうかわかんないけどね。
今、何の議論してるのかという話をちょっと皆さんにしようと思って。
お願いします。
端的にね、いつもこれはZoomを使って録音してるんですよと。
Zoomして話をビデオ通話で話しながら、録音はそれぞれお互いのパソコン環境で録音すると。
最高の音質で録りましょうっていう努力をするわけね。
そうね、だから会話をしたやつを後から別々の音声ファイルになってるやつをガッチャンコさせると。
そうそう、Zoomの録音品質っていうのに満足いかないからっていうのがきっかけね。
そうね、Zoomのやつでそのまま録っちゃうのが一番楽なんだけど、そんなものはうんこコンテンツ。
それでもいいんだけどね、音質がね。
音質うんこコンテンツ。
03:01
Zoom的に言わせちゃダメよ。便利に使ってんだから。
それじゃ飽きたらないということでマニアックコンテンツなんで。
なので何が大事かっていうと、いつもこの僕の適当タイムの前に何をやってるかっていうと、
今日の場合はそれを多分入れて放送することになると思いますが、冒頭の54321とかやってるわけですよ。
それ初めて入れようか。
入れよう入れよう。
面白い。
あれをやってるわけですよ。で、そこが喧嘩の火種になっておりますと。
何がっていうと、あそこであれ何のためにやってるかっていうとね、お互い別の場所で録音してるので、
後から合わせるときに基準点がないと合わせらんないんですよ。
耳で全部聞いて自然な会話になるようなところでとかってやってると、
アナログで全部やってるとすごい時間かかるので、何か基準点を作りましょうということで、
お互い画面越しに僕が手で543って言いながら、
アビューは画面越しにその指を見て543と。
そうね。
ただそれやっても、当然ズーム越しなんでネットを介していろんな機械を通してってやってるんで、タイムラグはあるんですよ。
閉じてしまうってことね。
だから僕側で見てるときに、僕は5、4って言ってから0.3秒ぐらいしてからアビューの4とか返ってくると。
だから往復で0.3秒とかそれぐらいのラグがあるよねって話ですよね。
150ミリ往復ね。300ミリセカンドぐらいって感じかね。体感でもね。
まあそのラグがあるのを見るのは当然いいとしてそれをとってるんですけど、そのラグがある前提で合わせる基準点を作ってるということです。
だいたいね。
だからそのラグありきで基準点なのよ。
そうそう。ラグがあって初めて会話が成り立ってるわけね。
この会話、今してる会話もラグを全部含んだ状態で、体が慣れを見せながらやってるって感じだよね。ある程度。
そうだよね。
リアルでやってるより絶対遅れてるもんね。
遅れてるね。どのみち早遅れでみんな聞くだろうからそんなに違和感ないんだろうけどさ。
それさ、編集の時に基準点合わせるのってさ、本来だったらずれてるじゃん。同じ時間軸だったら。これずれないようなここで合わせるってこと?
そう。目視でね。
目視でね。波形見てね。
波形見てとあと音ね。波形だけじゃなくて音なんだけども、波形必ず幅があるじゃない。幅があるわけ。
06:00
だから、幅が理論上ゼロのものをピチッと合わせるっていうのは可能だけども、幅があるもの同士をどこで合わせるかなってこういう風にやるわけよね。
画面をね、見ながらやってるけども。大体どこかなと。
カネリンの声はこんぐらいの幅で、俺の声はこんぐらいの幅あってね。狭かったらどこに合わせますかねっていうのは聞きながら感覚で合わせてるわけ。
だから本当は突然バーンってMAXに触れる破裂音とかがいいんだよね。このバーンとか。
うん。
って音は一気にパッて触れるから合わせやすいんだけど。
合わせやすいんだけども、それとって幅があるわけね。拡大していくといくらでも幅あるじゃない。
うん。だからその幅が狭ければ狭いほど合わせやすいということですね。
例えば太鼓叩くような破裂音ってね。このポンって叩くようなもんっていうのはかなり機械音だからピークが立ってるっていうかね。
合わせやすい部類だけども、それとって幅があるっていうね。
うん。
これがまず一つの条件っていうかね。
多少幅ができるのは当然。
それはまず一つのね。入り口の中の入り口ね。
うん。
声で走ってるから幅があるんで、結局声でやる限りでは絶対アバウトでやらなきゃならないっていうのが今の現状だよね。
うんうんうん。
どんぐらいずれるかっていうとね、だいたい50ミリセカンド、30から50ミリセカンドぐらい。
0.05ミリ秒。
0.05秒。
0.05秒。
とか0.03秒ね。
うん。
実際にこの2メーター離れた一つの部屋のね、物理的な部屋の中でリアルで会ってる時の遅延っていうのが0.006秒ぐらいなの。
うんうん。
0.006だから、それの5倍ぐらいは遅延してますよってことね。
10メーター離れたところの人と喋ってるっていうぐらいが、Zoomの一番いい環境っていうぐらいの体感を俺は持ってると。
うん。
それがまあ最初の入り口の話ね。
うん。
なんでまあそこを力技で目視で合わせるので。
そう。
だいたいいつもその幅分ぐらいはずれてもしょうがないっていうところは一個誤差としてあると。
そう。だから会話が若干ぎこちなくなるぐらいはまあ我慢しましょうみたいな宿命にあるっていうのが最初のまあ何、環境だよね。
うん。
うん。
でその基準点をどのぐらいのずれで作るのかっていうのをある程度一定化させないと毎回ものすごいずれるということになる。
そう。
だから今日はネットの環境が良かったので往復時間お互いの4っていうのが0.3秒ずれで記録されましたと。
うん。0.03秒ずれぐらいね。
0.3秒ずれ。
ああそうかごめんごめん。
だいたいそんなもんだよね。
300ミリ秒だね。300ミリ秒そんなもんだね。うん。
だからそれがなんか0点0点じゃないそれが1秒とかずれたら困るわけですよ。毎回1秒ずれならいいのよ。
09:09
全体をずらしてるからね。
毎回1秒ずれであればいいというかそのその後の会話も全部1秒ずれてるならいいのよ会話しにくいけどね。
うん。
ただその最初の54321で撮りたいずれっていうのは純粋にzoomの行って帰ってくる遅れを撮りたいわけじゃん。
うんそこら辺からね議論がちょっと変わってくんだけども行って帰ってくるタイムラグを吸収する話と
あと和社A和社Bのタイムライン。タイムラインって言うけどもその時間軸っていうのを合わせる。
どっちかが必ず早いとかどっちかが必ず遅いだったらいいけども揺らぎがあるのよその間に。
でそれでぎこちないところをローカルで直すなんていうこともたまにあるんだけども。
全体が全体例えば1時間とか15分とか10分とか撮ってその間がビチッと両方時間軸が合うっていうのがねかなり難しいんですよ。
要はそのあれ喋ってる間に最初は0.3の行って帰ってくるだったけど
zoomが勝手にそれ変えるんだよね。
10分ぐらいの時点だとなんか0.5秒なったりとかすることがあるってことね。
もっかいしたら0.2とか0.1になってる時もあるかもしれないと。
遅くなったり遅くなったりすると。
これは会議をやってる時にはこの揺らぎはあんまり感じられないっていうケースがほとんどなんだよね。
気づかない。
それは仕方ないことだね。
50ミリ秒ぐらいだとねもう全然気がつかないし。
その揺らぎがあるのはしょうがない。
どうしようもないことです。
これはコンピューターの状況とかあと参加してる人の回線状況だとかっていうのを見てんだよね。
たまになんか電波途切れっぽくなることもあるもんね。
それもあるよね。電波が途切れちゃったとしてもタイムの方を優先するとか。
あと了解度を優先するとか。
あと俺ら画面をオンにしてるじゃない。
音声のデータ量よりも画像のデータ量がすごく多いから。
画像をわらわらにして音声を保護するとか。
それでも破綻しちゃうような場合はタイムをずらして一生懸命計算して
ちょっと遅れてでもちゃんとしたデータ、了解度の高い音声を届けるとかね。
そういうことをむちゃくちゃリアルタイムでZoomちゃんはやってるんだよね。
どれを優先するかって選びたいよね。
だけどそこら辺をあんまり選ばせるとさ。
Zoomのクオリティーにもなるわけね。
Zoom使ったら絵は綺麗なんだけど音が途切れてやめたって言われちゃったらもともともないんで。
伸び縮みするということは認識してます。
それはしょうがないことです。
Zoomの伸び縮みとローカルで撮ってるものとはタイムラインは成功しないっていう宿命にある。
12:06
ずれたり。
通常はそんなに気がつかないレベルなわけ。
それは仕方ないことなので。
だから合わせ方適当でいいという話にはならないですよね。
まあね、そういうこと。
で、何か合わせ、今何で俺が何か問題提起をしてるかっていうと、
合わせるときにね、たぶん5,4,3,2,1っていうと、みんな自分の中での秒針というか、たぶん、
テンポ。
Weaveだとテンポあるから、テンポを取って自分の中で1秒で5,4,3,2,1っていうので、
そこをお互いずれると、フライングがあるのたまに。
だから本来合わせ方は、俺がいいと思ってるのは、
こっちが何かを示したときに、そっちで認識してそれを言うと。
5を見てから5って言う。4を見てから4って言えば、
そのZoomの遅延分でこう返ってくるじゃん。
だけど、たまに俺が3ってやると、
俺より先に3っていうことがあるのよ。
それは何でかっていうと、こっちの3を見てから3って言ってるんじゃなくて、
そっちでリズム取って3って言ってるから、そっちの方が早く聞こえてくることがある。
その要素もあるよね。
だからそれをやっちゃうと、タイミング合わせにならないよねっていうことを思ってて、
なので、だからこっちの指を見て、
往復でそっちで言うと、毎回それを繰り返すのが、
毎回一定のタイミング合わせの波形を取れるじゃんって。
まずそこで落とし穴があるのが、
画面を見て発声をすればいいのにっていうところに2つ落とし穴があってね。
画面と音声がZoomから合致してるものが届けられてるっていう、
完璧なものが届けられてるっていう1つの錯覚があるっていうね。
ここに誤差が少しあるよね、少しね。ほとんどだけどね。
あと、画面を見ながら発声をするっていう人間の仕組み。
目で見たものを声に発するというところのロジックに必ず遅延あるでしょ。
あるね。
それとあと自分が持ってるテンポ。
これは個人的に120のテンポで1、2ってやるけども、
これメトロノームの120からしてみればずれまくってるじゃない。
メトロノームをたきながら120、その半分の60でね。
5、4、3って言うんだったら私もね。
自分の体内時計。
大体これはマーチで120だから、1、2、3ぐらいで取ってるけども、
15:00
今俺が声発したものを実際計測してみたら120ぴったりなわけないじゃんっていう話。
この2つが内包されてる。
だからアナログの人間の誤差と、あとZoomの誤差。
画面と音声の誤差ね。
それからインターネットの遅延とか、CPUの遅延とかね。
そういうのが全部どこかでどんぐらいか分かんないけども、
積もり積もって行って帰ってっていうタイムラグにもつながってると。
そんなイメージを俺は持ってるね。
イメージっていうか、環境じゃないっていうことだよね。
オッケーオッケー。
それオッケーの上で、その全部の遅延だけを純粋に取りたいわけじゃん。
そうそう。
だから1秒っていう単位どうでもいいのよ。
遅延を取りたいんじゃなくて、タイミングを取りたいわけ。
同期したいわけ、ローカルファイルの。
ローカルファイルのタイムコードを入れたいわけ。
タイムコードね。
タイムコード聞いたことあるでしょ。
あるよ。
一つの部屋で撮るときに、それぞれの楽器だとか、そのタイムコードを入れといて、
そのタイムコードで絶対時間を合わせるっていうやり方だよね。
うんうん。
だから本来タイムコード取りゃいいけど取れるわけないんで、
今回のやり方してるわけだけど、
ほんとそのタイムコードを取りたいって意味で言えば、
時報をお互い鳴らすのが一番ベタだと思うのよ。
ただ時報もね、この話ちょっと後回しにして、ぜひ取り上げたい内容なんだけども、
今電話で聞く時報って全部不正確だからね。
自分が聞く時報ってのは不正確だから、遅延があるって話。
それはまた別にしとこ。
うん別にしとくわ。
そう今その後から編集で合わせるための基準点をお互い離れた場所で取るって話だけど、
自分の、それお互いのリズムでなんかリズムで1、2とか言ってても何の意味もないわけよ。
それ何の基準点にもならない。
だからリズムは意味ないの。
僕の理論。
別にリズムを取りたいわけじゃない。
基準点作るために、こっちがあって言った後に向こうがあって言うタイミングのずれ。
別にずれがあるのはいい別にそれは。
それ言って帰ってくるだけのずれじゃん。
それで記録すればそれでいいじゃん。
逆方向もあるよ。
俺があって言ってそっちに気が届く。
往復があるからどっちをどっちに合わせるかっていうのは遅延からでは観測できないわけよ。
だから毎回俺に合わせるっていうのでやってるじゃんそれは。
毎回違う人を基準にしてたら毎回ずれるじゃん。
それもねだから言ってこいだからどっちがどんだけ遅延してるかではなくて
どのタイミングに何を合わせるかのマーカーをローカルファイルに入れるっていう命題なわけよ。
だからこっちのあって言った瞬間にあって言うのを記録して
でそっちが認識した時点であって言うのを入れてるわけでしょ。
18:03
うん入れてるよ。
こっちがあって言ってそっちに届いたらあって入れますという記録の取り方をしたいわけじゃん。
それはもう遅延分をゆっくり合わせるっていうだけで終わりだよね。
終わりでしょ。だからそれをすれば実際にこうやって今僕らがこうやって会話してる時の遅延の分も
カバーできるはずでしょってことだよね。
カバーしやすいじゃん。全く一緒じゃないよ。
だからそこがね最初があったとしても間の揺らぎがあるわけよ。
じゃあそれを言い出したら基準点を取る意味がないじゃん。そういう言い方をし始めたら。
基準点を取る意味なくはないんだよね。
編集でじゃあどの会話のどこの部分って探すのよりもやっぱりカウントで5本立ってたほうが4本か5、4、3、2の4本が立ってたほうが見やすいじゃない。
それはそうだけど今回みたいになんかやたらとどっちかによってるっていうことが起きたじゃん。
起きた。
あれは厳密に毎回真ん中取れるわけはないってのは分かってんだけど、なんでそんなことが起きたかなっていうと
アビーブと僕のそのさっき言ったタイミングは逆にそっちが早い時があるっていうことがあるって言ったじゃん。
そのずれ方おかしいじゃんね。
だからどこに合わせるかの最初の目測だけの話なんだよね。編集者がどこに合わせるかだけ。
毎回かぶってくるのが毎回一定でかぶってくるならいいよ。この今日やっても明日やっても。
ありえないじゃん。あれは奇跡の1回っていうかもう偶然そうやってかぶるときがあると。偶然かぶるときがあると。
でそれあとこの放送会と明日の放送会とって毎回こう基準点がずれてるわけで、それ毎回耳で見て合わせなきゃいけなくなるじゃんね。
今んところは耳で合わせるしかないんだよね。
最終的にはそうでしょ。
最終的っていうかもうそれしかないのよ。他に何もマーカーがないからね、ローカルファイル。
なんでそのマーカーを作ってるわけじゃん一番最初に。
でそのマーカーが毎回一定ある程度一定の品質でマーカー取れてないとさあんまり意味ないじゃん。
だから例えば絶対正しいマーカーっていうとzoomの中で録音されているマーカーしかないんだよね。
でもそれに別録りのローカルファイルっていうのを合わせるってのは無理なんだよ。
どうだろうね、AIかなんかでむちゃくちゃ演算すればできるかもしれないけども。
1秒ごとにこのタイムをちょっとずつずらすとかね、そういう演算をしてくれればいいのかもしれないけども。
伸び縮みしてるからってことそれは。
21:01
そう微妙にね。
だからzoomの中で行われている会話っていうのがナチュラルであればっていう前提もあるよね。
基本zoomの中の会話ってぎこちないって俺は思ってるわけよ。
合図打ちが遅れてる。今も感じてるけどね。
でもそれはzoom慣れしてるからこんなもんだろうと。
リアルだったらもっと返事早くくるのになと思いつつ、体が覚えちゃってるって感じあるじゃない。
うん、あるね。
その部分を全部ローカルファイルに吸収させちゃってるわけよ。
だいたいこんなもんだろうっていうところで合わせて、それで聞いた感じぎこちなくないような、自然に聞こえるような感じだったらまあいいかなぐらいね。
完璧にいいなと思ったことは一回もないんで、だいたいzoomのタイミングだったらこんなもんかなと思いつつ、毎回編集してるわけだけども。
まあその編集で最終的にアナログに聞いて調整しなきゃいけないっていうところがあるのは、それはしょうがないし、それはいいんだけど、
基準点の作り方として時間軸で俯瞰したときに、僕があって入れた後に0.3秒遅れてそっちのローカルファイルにあって入ると。
だいたい0.3秒ね。で毎回その品質でやればいいじゃん。
じゃあそのマーカーっていうのをどうやって入れるかだよね。
逆転されてる時とかは困るじゃん、それ。編集する側としても。
毎回カネリンの方が0.3秒早い音声ファイルだって認識してんのに、それで合わせたら実は逆だったって言ったらそれでタイミングがおかしくなるでしょ。
だからどこにマーカーが絶対マーカーが入ってるかっていうのでね、最初だけで合わせるわけだよね。
そういうことでしょ。やってることそういうことでしょ、やりたいことも。
そうなんだけども揺らぎがあるからそうでもないよっていうのが現実だよね。
その後の編集ね。
それは別の話だと思う。それはしょうがないと思う。
どうやって完璧なマーカーを入れるかっていうのに興味があるってことでしょ。
毎回マーカーだからさ。
タイムコードね。
一定品質で入れないと事故ると思ってるわけ。今回事故ったと思ってるわけ、俺。
なんかタイミングがおかしかったからね。
200ミリ秒違ったんだよね。
多分それの原因で思い当たるのはたまにアビーブの方が早くいってくると。
なんかおかしいぞって感じてよくよく考えてみたら全体を15分ぐらいを200ミリを遅くしたら少し自然に聞こえたと。
だから今回の問題の発端はリスナーさん置いてきぼりだけど、
そうだよね。
仕上がってきた音を聞いた時になんか俺の反応がクッソ遅くてアビーブの反応超早いみたいな。
めちゃめちゃ頭の回転早いおじいちゃんだなみたいな感じになってて。
24:01
要は合わせる位置がねちょっと前後アビーブに寄りすぎていたからそういう風になってるんだけど、
なんでそうなったのかなって考えた時に最初の基準点で多分まずは合わせてるんだろうから、
その基準点を取る時にそういえばたまにアビーブが俺と被ってる時あったなと。
そこに合わせちゃうとそういうズレが生じるんだよなっていうことだよね。
だからこのアアでいいじゃんって言ってんの。
アア。
リズム取られるとダメなわけよ。
だからこの数字のカウントが良くないと思った。
別に秒数をカウントしてるわけじゃない。
犬、犬みたいな。
ベータ、ベータみたいな。そういうことだと思ってんの。
アホ、アホとかさ。
俺が言ったことを真似するみたいな。
そっちの方がまだいい気はする。
リズム取っちゃうならね。
どうしても5,4,3,2,1だとリズム取ってしまうから。
でも同じ合わせるべきところに同じ言葉を発せられないよね。
なんて言うか分かんないんだもんね。
だからそれも頭で認識してから。
被らせることが目的じゃないのよ。
その全ての遅延があった上で毎回同じぐらいになるでしょ。
意味わかる?
俺がアホって。
アホ。
アホはいつも言うから。
例えばその数字がランダムに言うとして、
7って言って。
7。
7っていうのがこのズームで遅延で効いて、
頭で認識して7って言ったで7って言うじゃん。
だから0.5秒ぐらい遅延するじゃん。
人間も遅延もあるからね。
そうそう。
毎回その遅延で記録できるじゃん。ざっくりね。
その一定品質が必要じゃんって思ってるわけよ。
そのざっくりどうやって一定品質にするかだよね。
リズム取るとさっきみたいに被ったりってだいぶずれちゃうじゃん。
この5,4,3,2,1だと。
同時に4とかって言ってるともう0.3秒のずれがあるから。
その同時に4もよく分かんないんだけどね。
5,4ぐらいまでいったら次の3はこんぐらいだろっていう。
音楽やってるような感じでね。
それがダメなのよ。
5で4の3ってなるよね。
それがダメなのよ。
だからマーカー1個でいいのよ。
今日のマーカー行きます。
うんこ。
うんこ。
それ1回でいいのよ。
品がないんだよ。
意味わかんない。
多分俺の編集で必要なマーカーってそういうことだと思うんだ。
5,4,3,2,1ってこれ生放送の時の9じゃん。
またそれ違うよねって思う。
ではこれ30分ぐらいになっちゃったんで。
次回に行きましょう。
次回お楽しみに。
15分放送とか行って。
白熱粉球会。
大変これ。
次回で。
リスナーさん置いてけぼり会終了いたしましょう。
27:00
リスナーさんそれまでに。
考えておいてください。
ちょっと2人何言ってんのと。
どこにこの議論の歯車が噛み合ってないのかと。
仲裁してください誰か。
仲裁。
はい。
本日のテキトータイムは以上で。
僕の声がビリビリし始めたので終了します。
はい。
お便りコーナーやめました。
めんどくさいので。
コメント。
スポーティファイのコメントにコメントしてください。
それをお便りとして認識したいと思います。
よろしくお願いします。
ビリビリ言ってるな。
聞こえます?皆さんビリビリ。
あーって。
こちらには聞こえないんだけどね。
エネルギー出しすぎるとマイクが壊れるっていう現象です。
人によるってことでしょうか。
人生相談の特命質問窓口は作りましょう。
あれですか、あのサービスですか。
マシュマロかなんかで。
マシュマロで作るんですか。
人生相談はこちらっていうリンクを概要欄に貼っておきますので。
特命で相談してください。
人生相談好きだね。
相談してほしいね。
なんか画面からニヤニヤが伝わってくるんだけど。
ということで、本日の放送は以上です。
パーソナリティはMr.テキトーカネリンと、
Mr.テキトーアヴィーヴでした。
バイバイ。
バイバイまたで。