00:01
みなさんこんにちは、TRY-CATCH FMです。このポッドキャストは、 IBMに新卒で同期入社したエンジニアの2人がテック、キャリア、ライフなどのカテゴリーについて緩く話していきます。
では、やっていきましょう。
よろしくお願いします。
最近ちょっと骨電動イヤホンが気になってまして、今使ってるイヤホンの性能がね、有線のやつを会議とかで使ってるんだけど、あんまり良くないからイヤホン買えたなってたまに仕事の人から言われることがあったのと、耳にずっとつけてるとちょっと疲れたり痛くなったりするんだよね。
だから耳に直接、耳の穴のところに入れないやつというので、ちょっと試してみたいなと思ってたんだけど、ビッグカメラに行ってちょっと色々試着をしてきたんですよ。
今ほとんど、一部ちょっとだけ本当にワイヤレスのボコとかいうところのやつがあるんだけど、左右つながってるタイプの頭の裏でくるっと回してつけるタイプのやつは、ほぼ多分ショックズ、ちょっと前の名前だとアフターショックズっていう頃がほぼ一興みたいになってて、
そこが知り合いに聞いた話だけど、そこが最初にエアロペックスっていうちょっと革新的な骨伝導イヤホンを出したらしくて、そこで一気に骨伝導イヤホンの評価が変わったらしいんだよね。
で、それの次世代モデルみたいな感じで、今オープンランだったかなっていうシリーズが出てるんだけど、それを結構いろいろモデルというかシリーズ名のモデルがあるから。
1万4千円くらいしてるけど。
そうだね、標準モデルがそのくらいで、エントリーモデルのオープンランムーヴってやつが1万円ちょっとくらい。
で、オープンプロっていうのが2万3、4千円くらいっていうラインナップに、さらにプロと同じくらいの値段でCOMっていうやつがある。
そうね、COMってやつあるな。
それはね、ビジネス向けなんですよ。
そうなんだ、なるほどね。
切り替えとかいろいろ機能が増えて、あれが付くんですよ。ヘッドセットみたいにマイクのところにちょっとだけ棒が付いてるんだよね。
みたいな感じで、運動スポーツ向けとか音質とかをより良くしたいみたいな感じで使い分けていく。
だから、その元になるオープンランとプロと、全部試してきた。
オープンランには無印のやつにはミニモ、ミリっていうちっちゃいのもある。
ミニモ含めて全部やってきたんだけど、たぶんコメカメあたりというか、耳の軟骨の一歩手前ぐらい。
一歩前側のところに当てるんだけど、そこをどれぐらい圧迫されても大丈夫かっていうので、
僕そういうのちょっと弱い人、すぐ頭痛くなっちゃったりとかする人だから、そういう人はちゃんと試着した方がいい。
03:06
スペックでは分からないって違いがある、だいぶ。
ムーブってやつは結構閉じる力が強い。
エントリーモデルのやつね。
だから、僕はちょっとこれはたぶん耐えられないなって思った。
でも、たぶん強い人だったら全然余裕だと思うんだけど。
普通の無印のやつは結構ソフトになる。
でも、これ慣れて何も気にならなくなるか、なんかじわじわと蓄積されてダメージが、
頭痛くなるか、かけだなって思うくらいの徹夜なラインだったので。
だから、普通の人は大丈夫だと思う。僕ちょっと弱い人だから。
で、プロはすげえタッチがソフト。
もう何だと思って見てみたけど、やっぱり接着面、肩と接するところもやっぱり作りがちょっと違う。
ちょっと薄く見えるし、無印と違うんだよね。
だから、やっぱり結構付けてみて差があるから、
いや、付着は大事だなって思ったって話だけど。
で、結構性能も高めだし、電池の持ちとか充電の速さとかもいいし、
なんか動いたら落ちるようなもんでもないし。
で、これ欲しいと思ってる理由のもう一つが、
僕自転車ちょいちょい乗るんだけど、
イヤホンする人もいるんだけどさ、
僕あんまり外音取り込みしてもちょっと周りの音聞こえない、聞き取れなかったら、
自己撃退して怖いかもと思って。
あれやるのかと思ったんだけど、
これだったら耳くさがないから外音は100%入ってくるんだよね、一応。
だから、ノイキャンやろうと思えば少し技術的にできてるらしいけど。
だから、一応ね、それでなんか聞きながらとかできるなーっていうと。
もちろんこれで通話しながらね、自転車走ればとかもできるからね。
たとえばさ、気になるんだけど、
ちょっと骨電動イヤホンしたことないから全然わかんないんだけど、
骨電動イヤホンでめっちゃうるさい曲をかけて、
で、耳からなんか音が入ってきても聞こえるってこと?
どうなるんですか?
あー、耳を塞がない状態で。
普通に、体感としては普通に音楽が近くで鳴ってるなーぐらいの感じだから、
周りの棚一つ隔てた別のお客さんの話し声とかは内容聞き取れるレベルに普通に聞こえてくるし。
さっきまでと別にそこの聞こえ方変わんねーなって感じ。
試してみたいな。なるほどねー。
アマゾンで見てると、結構のきなみセールっぽいのやってるんだよな。
なんか、1万6千円のやつが4千円とかになってたりするんだけど。
どう?なんだそれ。
僕のブランドだろ。
えっと、イヤシモっていうやつかな。
イヤシモ?
ERSSIMO。
06:00
イヤシモっていうやつが、
これさっきのオープンコムとかオープンプロとかのやつが、
どれにあたるのかわかんないけど。
え、でもそれあれだった?そのSHOCKSっていうとこだった?
いや、SHOCKSじゃないな。それはSHOCKSのモデルなのか。なるほどなるほど。
でも別にそこ以外が出してないわけじゃないと思う。
あの、家電量販店にあるのがほぼそれとかっていうレベル。
なんか、もう業界ではかなりそれになってるけど、
今どんどん新しいのも出してるだろうから。
なるほどね。
そういうのがあるのかもしれない。
僕まだね、その一番有名なやつしか試してないので。
っていうのと、なんかね、最近なんか軟骨電動イヤホンっていうのが出てきた。
あの、さっきあの耳の軟骨の前の部分にみたいなことを言ったけどさ、
あの軟骨のあたりとか、なんか外視のあたりとか、
なんかその辺に振動を与えることでなんかこう、内部に響かせるみたいな。
ステレオとかはより、骨電動イヤホンよりいいみたいな話とかがあるらしくて、
本当かどうかわかんないけどね。
始めてるから、もうちょっと整ったらそっちも買ってみようかな、みたいなところ。
なるほどね。
なんかあとさ、その概要を取り込むっていう意味では、
なんかソニーかな、ソニーが。
あ、リンクバッツかな。
そう、リンクバッツで、なんか穴あきイヤホンってやつあるよね。
うん。
あれもね、レビューとかは読んだ。
これと、そのSHOCKSのオープンランカーと、そのリンクバッツと、
あとなんかもう1個、ヘアーカフ的な耳の一番外側とちょっと挟んで、
耳には入れませんよ、みたいなイヤホンの3つを比較したサイトとかもあって、
なんかながら劇イヤホン最近はどれだみたいな感じでね。
はいはいはい。
なんかいろんな形が出てるんだけど、ちょっとね、耳を挟む感覚だったりとか、
そのリンクバッツは結構、やっぱ耳の穴にちゃんと挿し込む関係で、
割とイヤホンに近い。イヤホンしてるけど外の音めっちゃ聞こえんなみたいな感じらしいね。
僕が求めてる最初の言ってた、耳にはめるっていうのじゃないよがいいなって思ってたから、
僕は骨伝導に行ったけど、
外音取り込みっていう文脈だったら全然アリだと思うんですよ、そういうの。
なるほどね。
ソニーたちね。
将来的にさ、体に取り込むとかなんか出てきそうだな。
普通に手術とかしてさ、骨伝導いつでもできるようにみたいな。
五感は普通にやりそうだよね。目と耳は結構早めにやって、後々脳で全部やるとか。
そういうのがありそうだもんな。
そしたらテレパシーできるみたいな世界だよね、通話とか。
そうだよね。
もうなんか暇な会議中とかおしゃべりし放題。
ちょっと俺も興味あるから調べてみようかな。
そうだね、僕もちょっと今回試着した結果のもとに買ってみようと思うので。
ぜひぜひ、レビューとかも。
買ってみたらレビューをまたやります。
09:00
じゃあ本題の方いきましょう。
はい。
本題が、最近考えてることで、
このトライタッチFMの今のリスナーの流入元って基本的には
SpotifyとかApple Podcastsとかがメインなんですけど、
SEOからもGoogle検索からもどんどん検索に引っかかって
新しいリスナーが増えてくれたら嬉しいよねっていうのがあって、
書き起こしをやりたいなと思ってるんですけど、
既存の書き起こしツールいろいろあるじゃないですか。
あるね、めっちゃ面白かった。
各クラウド系のスピーチトゥーテキストAPIとかもあるし、
普通のスマホの書き起こしとかもあるし、
で、ちょっと今回最近流行ってるウィスパーっていう、
あれは何なんだろうね。
どこが出してるんだっけウィスパーって。
ウィスパー、ウィスパーどこって言うとどこなんだろう。
ちょっと見てみるか。
ウィスパーを試して、
それがかなり精度が良さそうだというので、
試してみたんですよね。
オープンAIとかあったっけな。
オープンAIがGitHubのところにあるから。
基本僕は何もしないですけど、
ちょっとこさくんがいろいろ試してくれたんで、
ちょっと今日それを聞きながらいろいろ、
どうだったかっていうのを話してもらいたいなと思っている回でございます。
なんか流れとしてはさっき言った通り、
いろいろあるよねから始まって、
じゃあちょっととりあえずクラウド系のAPI投げてみるとかやってみようぜってなって、
Googleとかやってみたんだけど、
ちょっと何分以内で区切らないといけないとかいう面倒くささとか、
そもそも無料でどこまでできるみたいな範囲を、
例えば16分の収録分があったとして、
それを毎回16回投げてみたいなのを週2回、
だから月僕ら8回くらいやってるもんね。
8本くらい出してるのを無料でできるのかっていうとだいぶ怪しいっていうのと、
割と政策余奪を握られるというかね、
向こうに依存しないんだよねっていう問題があるので、
今日最後に出すやつも依存しないかといったらするんだけどね。
ちょっと各クラウド系とか文字越しサービス調べたけど、
ちょっとどれも断念しましたっていうところで、
選択肢がPixel 3のやつ、
僕は3なので、6以降でやると違うかもしれないんだけど、
Pixelの文字越しとWhisperってさっき言ってたね、
新しい書き起こしモデルでやってみましたっていうので、
まずちょっとPixelの方からいくと、
12:02
精度は割と良いっぽいんだけど、
Pixel 6以降じゃないとちょっとモデルが一番いいやつが使えないので、
それをちょっと搭載してない、僕は古い機種だったからっていうのもあって、
ちょっと低い、なんか変な感じになる。
何て言ったらいいんだろうね。
今見るから、書き起こしした結果をちょっと出してくれてると思うので、
これは過去のTrycatch FMの回をやってくれてると。
最初の挨拶のところだね、なんか意味わかんないところ始まってるけど、
が、デッキ、キャリ、アライフなどの縦割りについて、
縦振りか、縦振りについて緩く話していきますと思っていきます。
はい、よろしくお願いします。
2回くらいしましょうみたいな時期が戻ってきたんだけど、
またちょっと戻ったというか、完全に、
僕はもうちょっと、
これは会社の許さんに言われると思うんだけど、
これ結構ヤバいな。
これやっぱ出せるレベルじゃないよね。
そうね、テック、キャリア、ライフのところがデッキ、キャリ、アライフ、
なんでアライフって言うの?みたいな。
もうちょっと割と怪しい。
これは一応収録して、
音楽とかもついてるやつ。
で、これが、
僕だってリモートでやってるから、
リアルタイムでこれできないんだよね。
なので、録音したやつをPCから流して、
それをスマホに入力してっていうので、
ちょっと精度が低いっていうのもあるんだけど、
まぁちょっと僕が個別でね、
いくつか挨拶の部分だけ喋ってみたりとかしたけど、
まぁちょっとやめたほうがいいんだなと。
ちょっとやめたほうがいいんだなと。
ちょっとやめたほうがいいんだなと。
ちょっとやめたほうがいいんだなと。
コツの部分だけ喋ってみたりとかしたけど、
まぁちょっとやめたほうがいいなっていう精度だった。
ちょっとこれのために喋ると、
ちょっとこっち側が調整してあげると
改善の余地があるなって思った。
フォットキャストをそれに寄せるって事なので、
残念ってことね。
ただちょっと、よかった点とかも言っておくと、
音楽と音声、両方入ってるって話をしたと思うんだけど、
これの入力がね。
であの視覚的にどこが音声でどこ どこからどこから音声どこから音楽みたいなやつとかを
あの表示してくれたりするんだよね色とかで だからなんかここから見ればいいのかとかっていうのがあるほど
っていうのとあの時間が出る何分から何秒からこれが始まってますよっていうのが パートで分かれているっていうのとフィラーっていうのかな
あのえーとかねあーとかあの辺をちゃんと綺麗にほぼ全部無視してくれてる っていうのは結構いいポイントなのでちょっとなんか個人的には使ってみてもいいかなとは
思った クラウド経由で後からブラウザでアクセスしたらあの
パソコンからパッと見れるみたいなあたりのなんだろう UX が結構スムーズに作られているので僕としては割と個人で使うには
15:03
いいかなとは思ったという感じかな はいはいはいはいでえっと肝心のウィスパーの話をここからするんだけど
あのねウィスパーはえっとギットハブの派でもあるって言った通りあのローカルでも できますと
はいなのでローカルでやってみたのとえっとグーグルコラボレーションでやってみコラボラトリで やってみたっていうのがあるので
えっとそれぞれ話をするんだけどえっとまずローカルであった えっと僕の5年もの6年ものぐらいのゲーミング pc やったんだけど
あのえっとこれいつのえっとインテル i5 7600系のやつでやりましたと でえっと gpu は gtx 1070 という懐かしいモデルです
メモリ8ギガでえっと gpu のメモリ8ギガ cpu あとそのパソコン全体のメモリは16ギガなんだけどそっちは
あんま使い切ってないって感じでえっとやっていきました でモデルはあの後々ちょっと気になる人はギットハブとか見てもらうといいんだけど
結構いろんなモデルに分かれてるねあの ちょっとちゃちー
あの精度で文字起こしをしてもするけど軽いやつとかあのディッチなやつとかあって まあ一番上と上から2番目を実質的にやっていったんだけど
まあ上から2番目のミドルやつは割と問題なくえっとこの pc でもできましたが 精度も結構いってたまになんかこれどっから来たのみたいなよくわから文字列が
ブーブーしたりとか まあでもそれは一括時間したら消せるレベルなのでまぁいいかなっていう感じで
ラージっていう一番リッチなやつはあのね gpu のメモリが足りなかったっぽくて その8ギガの分がでなんか16分のファイル音声ファイル入れたら入れて1時間経って終わら
なくて pc が結構な音を立ててたのでちょっと止めたみたいな感じ ローカルの厳しいか
まあ最近のパソコンをちゃんと使えばいいかもっていう感じだね でもまあそれがないとできないっていうのちょっと不便な話なので
あのグーグルコラボラトリーの無料分でできないかなということでやってみましたと あの使った後で人ならわかるかもしれないあの
コラボラトリー開きますノートブックの設定開きます gpe を選択します ok っていう状態なだけ いやー便利だな
ブーブー言ってもまあとりあえずやってみたんだけど あのミドルまでは同じもう一瞬でえっとラージの方はね16分のファイルが16分で終わり
ました いやこれすごいよねマジでマジでちょっとリソースくれすぎなんだよ
であのそのテキストを見今宮地に送ってあるんだけど ちょっと読みましょうかこれすごいよちょっと勘見てね感動した本当にちょっと軽く読み
ますけど はい
えっと皆さんこんにちはトライキャッチ fm ですこのポッドキャストは ibm に新卒で同期入社した エンジンあたりがテッグ
ここがちょっと見せてるだけだねテッグキャリアライフの中でもについてゆるく話していきます やっていきましょうかはいお願いしますお願いします
結構宮地ってまだ在宅勤務の日は多いんだっけ そうですね一時期ちょっと月2回くらい出所しましょうみたいな時期が戻ってきたんだけどまたちょっと
18:03
戻ったというか完全在宅にもう完全在宅なんだ なんか在宅勤務の時ってこれは会社の緩さにもよると思うんだけどみんな結構いろいろな
格好するじゃないですか会議とかしてると だってこれで今完全に僕らがワイヤーた会話喋ってるだけだけどほぼ
正解よこれちょっとミスってるというとさっきのテックっていうところと あと僕はラフな格好しますよそもそもパジャマがなんかない
内着のズボン事務用のズボンみたいなやつに入って言ったのがない内衣のズボン 内装の衣服
内衣のズボンってなってるこれ多分僕の滑舌の問題だと思うんですけど まあでもそこがちょっとミスってるくらいで
99パーくらいあってるなぁこれすげーな だってエアリズムユニクロサラファインみたいな単語ちゃんと引いてる
意外と全部いける マジですごいこれ
これは出せるレベルだね普通にそうなんだよねまぁあの なんか断りだけ入れておいたらああそうなんだと思って見てもらえるレベル
なのでいやこれはこれはすごいですねって感じ いやマジですごいなぁ未来生きてるなぁ
ねだからいやーこれ無料範囲でできるんだったらちょっと僕らはこれを今後の 文字起こし毎回とりあえずポンと流して
あのどこかプログか何かに上げ続けて ちょっとあの文字 seo 側からの8流入はちょっと
確かかなと 確かに確かに
課題の話もさあちょっとあのこれ宮地にファイルを送った状態で飛ばしたから なんかカタカナ m が苦手なのかなとか議論しようと思ったんだけど
いや強いんだよなんかあんまり言うことがない いや本当だって途中のさあ多分これ前グラマリーの
サービス紹介した時の記事だけどアメリカ イングリッシュブリティッシュイングリッシュカナディアイングリッシュオーストラリアイングリッシュ
っていう4パターンあるらしいけどっていうところも完全に書き起こしてるからね すごいな足というならね
僕これあの会議時の服装の話をしてて人米買った話してるんだけど 人米だけ5位にないのか
1個目の人米とかカーゾーンがになっててこいつ人米を知らんのでは 音はちゃんと聞き取っている
カチョコ知らないことだよねだからまあ単純に5位いないだけなんだなぁくらいの 感じだねえなくても取れるすげーな
すごいねー いやーこれはもうね採用ですねって感じの量ですよねこれなんか適当に冗談でちょっと早く
て言ってたなんか足りねえ足りねえな2020夏と思ってたんですよねみたいな 適当なことも完璧に撮れてるんだよ
普段言わないじゃんこのまましみたいなやつはちゃんと撮れてるから 適当なことを言っても撮ってくれるって安心感いいな
でこれフィルア音もまあ消しているのかなってさこういうふうに俺が相槌をうん うんとかってやってるじゃない
21:03
入ってないっぽいから入ってないねえーとかああとかもないからこれはね ないねいやー素晴らしいじゃん素晴らしいなぁウィスパー
なるほどねじゃあこれでいきましょうはいこれであのもうサイトはねほぼ作ってるんで まああとはテキストをぶっ込んで
あと s 4乗せると いいねいいねますあざます
yeah はい じゃあ
そうねまあでも比較したのはグーグル gcp のスピーチってテキストとピクセルとウィスパー っていう感じかな
そうだね基本それまあ無料で試せるのはねだいたいここらへんだよね うん
やっとこのウィスパーのおかげであのコラボのリソーサー前からあったけど この制度でやるには結構た大変だったもしか無理だったと思うんだよね
いやー気持ちがいいからはっはっは なんか本当あの議事録サービスとかさ
うんこれからどんどん普及しそうな気もするちゃうねこれだけ制度良かったらね うんだってこれ
github で公開されてるんだからスペックさえあれね なんか全然取り込んでできるのではい
あざますじゃあ終わりましょうか はいはいではこんな感じですね週2回のペースで配信しているので
アップルポッドキャストもしくは spotify 時の方はぜひフォローとレビューお願いしますでは 今回も聞いていただきありがとうございました
ありがとうございましたまたねー