でまぁ、すごくまぁ、今すごい流行ってると、やっぱ音声入力ね。
流行ってんだ。
流行ってます。でなんかやっぱ、すごいよ。
これこそ驚き屋さんじゃないけど、もうキーボードをワコンって言ってる人いるから。
これすごい。
キーボード捨てろって言ってる人いるから。
極端だな。流石にそれはないんじゃないかって。
キーボード捨てろみたいな。
喋るより手を動かした方が早い時もあるぞ。
音声入力の神みたいな人がいてですね。で俺は、
鏡だな。
俺はね、タイピング派なんですよ。
あーそうなんだ。
俺はね、打ちたい派で音声入力否定派だったんだけど、
あ、そううん。
なんだけど、なんで音声入力否定派かっていうと、メインの作業場所が電車なのね。
あーなるほどね。
なるほどね。喋れないよと。
喋れないから、今まで使ってこなかったんだけど、
ちょっと環境は変わるじゃない?単身不認して。
あ、そうだうん。
で、ね、ちょっと一人暮らしにもなるし、
これ音声入力試せんじゃね?と思って。
いいね。ずっと喋ってられる。
もしかしたら今まで知らなかった新たな効率化の窓が開けるかもしれないなと思って。
一人でずっと喋ってんじゃない?
すでに一人でずっと喋ってるからさ、パッドキャストマインしちゃってるし。
そうだよねそうだよね。
あんま変わんないかもしれない。
さらに喋り続ける。
さらに喋り続けるかもしれない。
ていうんで、ちょっと今日は、自分で音声入力ソフトを色々使ってみようかなっていうか、下調べをしたって感じかな。
で、その結果というか、内容をカネリンにも、そしてリスナーの皆さんにも伝えるみたいな。
そんな回でございます。
で、ちょっと大前提の話をさせてもらうと、
音声入力ソフトって、何するものなの?みたいな。
何するもの?
何をするものなのか。
入力するものじゃないの?
そう、入力するものなんだけど、
これちょっとね、AIの文脈でだいぶ意味合いが変わってきていて。
あら、そうなの?
元々そのマイクに向かって喋ると、カーソルが今いる、カーソルで指定されている場所に文字がバーって入ってきますみたいな。
そういうソフトで、タイピングの代わりに口で文字入れるツールと言えばOKなんだけど、
昔は聞き取った音を文字起こしして置換するっていう感じだったのに。
昔なんだ、それ。
そう、昔。
今はLLMを裏で動かして、整形をしてくれるっていうのが音声入力ソフトです。
要は何?どういうこと?
だから、フィラーとかさ、言い間違いとか、そういうのを全部直して、
あとさ、言葉だけだとわかんない、動音異語みたいのもあるじゃん。
あるね。
ああいうのも、自分の辞書を裏で持っておくことによって、ちゃんとそっちの意味で変換してくれるとか、文脈を理解して正しい感じにしてくれるみたいな。
そういうサポートを裏でLLMでしながら、爆速でこう、文字起こししていくっていうのが音声入力ソフトなんで、今の。
じゃあ、入力しながらGPTかけつつ、語触を直していってるみたいなもん。
便利じゃね。
だから、それが今の音声入力ソフトなんだね。
で、Appleそんな機能ないから、語触だらけだよ。
えーとかあーとか言ったらさ、えーあーとか入るじゃん。
入る入る。
ある程度ね、Appleのやつはフィラー切ってくれた気もするけど。
入るしなんかさ、電話帳に登録してある人の名前とかがさ、いきなりバーンって出てくるんだけど、肩書き付きでさ。
あ、そうなの?
そうなんか、松田とか言ったらさ、松田括弧捜査第1課、刑務法〜〜みたいなさ、おいおいおいみたいな。
変な連携してるじゃん。
そうそう。
Appleあるあるじゃない?
Appleでもあんまりやったことないよね。
消し方わかんないのよ、それ。
おー。
もう電話帳の名前がバンバンバンバン出てくるのよ、人の名前。
あ、えー。
上田とか松田とか松本とか言っても、もうフルフルでフルネームとそいつの肩書きみたいな。ギョギョしい肩書き。
でも良かれと思ってやってんだよね。
そう。
iPhoneではね。
そうなのよ。
なんか無効にする方法ありそうだけどな、それ。
ありそうだよね。
ありそうだけど、まあなんかやっぱ、そうね。
まあ今日は、あるよ。
そういうもう標準のものじゃなくて、ちゃんとしたツールを使いましょうって。
専門のね。
専門のツールを使っちゃいましょうみたいな。
持ちは持ちはなんだ、そこ。
持ちは持ちはです。
はい。
ただ残念なことにですね、ちゃんと使うと思ったらお金かかるものもあるんで。
あー。
また課金ですよ。
またじゃん。
AIって言ったら課金だからもう。お金払ってください。
払わなくていいやつも。
あるの?
あります。
GPTやってよ、それ。
GPTもあるよ。
あるの?
文字起こし。
だからそもそもウィスパーっていうね。
なんかあるね。
文字起こしのやつはオープンAIが作った。
結構性能いいやつね。
そうそうそうそう。
うんうん。
だしね。
まあそこにウィスパーで文字起こしを爆速でしながら、こういろいろな形でサポートしていくみたいなやつが、
まあだいたい文字起こしっていうか音声入力ソフトの概要なんだけども、
みんなその速度とか使い勝手を気にしながらいろんなソフトを選んでますと。
で、音声入力ソフト。
いろいろあるんだけど代表的なやつ4つあります。
うん。4つもある。
4つ。とりあえずこれを押さえておけばだいたいいいかなっていう感じ。
みんな個人、好みによって使い分けてはいるんだけど、
全部のソフトウェアが一応無料で使える期間っていうのがあるので、
がっつり毎日使おうと思ったら多分課金しなきゃいけないけど、
月でこんだけしか使わないよってだったら無料の範囲でも全然いけるよみたいな感じになってるんで、
みんなその特徴を把握しながら自分に合ったものを使えばいいかなと思いますということで、
ちょっと紹介していきますけども、
まず1つ目ですね。
アミカル。
アミカル。
というツールでございます。
聞いたことないわ。
俺今これをメインで使ってます。
えー。
使ってます。最近使い始めたばっかなんだけど。
これ何かっていうと、
オープンソースの音声入力ソフトなんで、
無料です。
無料いいじゃん。
無料。
無料なんてゴミでしょどうせ。
いいよ。
無料なんだけど、
一個特徴があって、
ローカルで動きます。
おー大好きなやつだ。
めっちゃ早いってこと?だから。
早いです。ただその代わりパソコンのスペックもそれなりに要求してくる。
あ、そうなんだ。
ちょっとしたパソコンみたいなやつじゃ動かないんで。
ちょっとしたパソコンみたいなやつってどういうやつ?
ちょっとしたパソコンみたいなやつ。
結局文字起こしの時に、
LLMで整形するんで、
ローカルLLMみたいなやつを中で動かします。
へー。
が仕組みになってるんで、
あんまりスペックどのくらいの推奨だったか忘れちゃったけど、
少なくとも俺のパソコンはそれなりにハイスペックなので、
MacBook?
いや、MacBookでやってない。
あ、やってないんだ。
デフトトップPCで使ってたしね。
RTX4070の。
あーでかいやつね。
ちょっとでかいやつ。
これはもうただで使いたい方、もういくらでも使えます。オープンソースで。
で、これいいのかな?
いい。すげー。
これでしばらくやってたけど、
よかった。
えー。
使い勝手はそれなりによかったです。
はいはいはい。性能もいい?
性能もいい。
へー。
基本的にはそのなんか、
ショートカットキーを押しながら喋ったら、それが全部バーって入力されますよみたいな。
アンサーも純正のiPhoneの入力が50だとしたら、
基本全部それ上ってことだよね?
上上上。全然上よ。
全然上?
全然上よ。
ちゃんとなんかあーとかえーとかもなくて、文章としてバッと出てくる。
全然変な文章になったりせんの?それ。
なんないね。
へー。
早く教えてよ。
だから結構なんか、わちゃわちゃこう適当に喋っても、
ちゃんと喋ったことを要約して文章にしてくれるなっていう感じがする。
なるほどねなるほどね。
あーこう、あーそういうことねって思った。
音声入力なんかみんなやってるけど、
何がいいんだそんなと思ったけど、
あーやっぱその、ただ喋ったことを文字で入力してくれるんじゃなくて、
ちゃんとAIがなんかいい感じに要約してくれるから、みんなやってんだと思って。
これさ、それで言うと音声ファイルバンってぶち込んでとかもできるの?
それはできるけど、
あーこのツールにできるのかな?
なんかね、文字起こしにも使えるってことだよね要はね。
文字起こしにも使えるんじゃ、文字起こしにも使えるのかな。
いつもね、このポッドキャストの文字起こしをね、
うん。
ジェミニーエアスタジオでやってるんだけども、あれがね、ちょっと時間かかるのよ。
ジェミニーに時間かかる人はなんかさ、
止まるのよ。
こんなこと俺言ってねーんだけどみたいな文字起こしてくるんだけど。
そう、めちゃめちゃ怖いよ。
あれ怖くない?
中身全然フェイクのやつある。
あれ、あれどうしたって感じじゃない?びっくりするんだけどほんとに。
お化け。お化けだよねマジで。
そう、なんか。
結構バーをさ、調整しないとそういうのハルシネーション出やすいみたいなのもなんかね。
あ、そうなんだ。
らしいけど、でも調整しても出るとき出るだよね。
いやなんか全然違う内容になってるなと思って。
怖いよね。
え?俺こんなこと喋ったっけ?と思いながら。
ね、もはや自分の記憶の方を疑うよね。
そうそうそう。
寝不足だしさ。
だから寝不足だからバレないかもしれない、AIもね。
こいつどうせチェックしねえからこのぐらいでいいだろうみたいな。
やっぱりあんま良くないんだ。
だから代替を探しててさ、ローカルLMで動く方が早いだろうしいいなと思って。
アミカルちょっと待ってね、アミカル。
えーと、音声入力。
やっぱり性能はあんま良くないのかな。
さすがにジェミニの方がいいのかな。
文字起こしのさ。
もう単純に文字起こしするんだったらなんか、
バイブコーディングで自分で作った方がいいんじゃないかって思うけど。
あ、マジですか。APIでってこと?
いや、ウィスパーっていうモデルはローカルで動かせるようにダウンロードしてこれるから。
あ、オープンAIの?
うん。
それめちゃくちゃ性能いいやつじゃないの?
ウィスパーはいけるはず、うん。
マジですか。
そういうことでクロードで作ればいいのか。
自分のところで動かせるように。だからMacBook Proとかだったら動くと思うよ、ウィスパー。
マジですか。
なんかこれも自分のパソコンじゃないけど、
なんかGoogleコラボラトリーっていう環境でウィスパーを動かして文字起こししてた気がするもん。
えー、今はどうしてんの?
今はもうジェミニ使ってるとりあえず。
てか文字起こしはそんなにしない。
あ、しないんだ。
うん。
あ、そうですか。
文字起こしするタイミングそんなにないのよ。
ホットキャストぶち込まないんだ。
基本原稿全部書いてるからホットキャスト。
あーそうか。
だから文字が先にあるもんで俺の場合は。
あーすごいなそれ。
さっきも別のプロジェクトでさ、結構俺が1万文字ぐらいの文字をバンバン毎日ぶち込んだりするからさ、情報共有で。
なんかもうそれテキストあんまり読めない人がいて、音声で欲しいって言われて。
でも音声だけじゃ記憶残んないからテキストでも欲しいから、音声で入力して投げたやつを文字起こししてそれを文章にしたやつくれって言われて。
両方。だからもう文字起こししなきゃいけない。
あ、そういうこと?
え、喋ったやつと。
喋ったやつとそれを文字起こししたやつ両方くださいみたいな。
あ、へー。
だからもう文字起こし需要めっちゃあんのよ俺。
そういう感じか。
なんかもうなんならディスコード上だからさ、ボット入れて自動でなんないかなとかちょっと思ったけど。
文字起こし、単純な文字起こしだったら自分でバイブコーディングでローカルでできるように作った方がいいとは思うけど、いいとは思う。
ウィスパーなんとかね、はいはい。
多分それでいいと思うけどな。
ウィスパーってのがLLMも兼ねてんの?
ウィスパーは文字起こしをしてくれるから、その後ちょっと整形するために。
あ、そうか。整形用のLLMは別で。
LLMは動かさなきゃいけないかもしれんな。
ダブルでね。
音声をそのまま文字起こししてくれるツールがウィスパーだね。
はいはいはい。単純に文字起こしするわけね。
そう。
それこそあれか、iPhoneのあれみたいなもんだね。
まあそうだ、それに近いね。
音声入力か。
それを文脈に沿って整形するよみたいな。
こういう音声入力のソフトはどっちかっていうと速さを求めてるから即時性みたいなね。
同時通訳みたいなね。
そうそうそうそう。
やっぱそのいかに早くそこに正確に入力できるかってとこだから、
あんまりカネリンが言う文字起こしの需要にはあってないかもしれないね。
ちょっと機能としてあるかもしれんけど、そこまで調べられてないわ。
うんうんうん。
っていうので1個アミカルというものがあって、これはローカルで動くので。
ローカル最高。
ローカルで動くとやっぱセキュリティ的にもいいよねって話があって。
外に出さない。
そこで完結してるからクラウドに上がんないよねと。
なるほどね。
それなりに精度もいいので、結構ファンが多くて使われている音声入力ソフトになります。
ただ、PCのスペックを要求してくるから、そこがちょっとネックかなって感じ。
そんな音声なんかでそんなにいるんだ。CPUですか?
だからさっき言ったようにLLMを、ローカルLLMを動かしてるから裏で。
CPUが使われる?
そうCPUが使われます。
なるほどね。
GPUも使われる、CPUか。
CPUね。
すごく要求してくるものになっております。
MacBookはもうちょっといいやつ買います。
MacBook Proだったら十分だと思うけどな。
なんかね、メモリが足りないのよ。
メモリいくつ?
18。
おー、18?
18。
ちょっと半端でしょ。
半端。
あ、18なんだ。
18なんです。ちょっと足りないんでね。
足りなそう。プロでしょ?
プロの下の方やね。
あー。
メモリがすごい足りないですね。
それはちょっとあれだね。
そうなの?
買わないと。
この間、Podcast Mixerで現地でやってて、ブチ切れてさ。
何の作業もできんつって。
裏で。
そうそうそうそう。
だからもうその帰り道にポチったから。
早え。
ポチった。もうムカついたから。
仕事にならんわと思って。
いやでもそれはそうね。
いくつ安かったの?
48MBか。
え、今高いんじゃない?
42MBかな。
50万くらいすんじゃない?
50万超えた。
だよね。
もう本当にしょうがない。
もうビデオポッドキャストもバンバン増えるし。
あ、そっか。
授業だもんね。別に趣味でやってるわけじゃないもん。
授業でも趣味でも一緒なんだけどさ。
まあまあまあ。
なんかマシンスペックがーとか思ってなんかさ。
ちょっとお呼び越しになるの嫌だし。
現地行ってさ、すぐその場で作業できないのちょっとしょぼいしさ。
そうね。
ちょっとイラついちゃって。
いやいいと思います。
すいません、もうバリバリフルパワーマシンで。
フルパワーマシンだから重くなるわけじゃないし別に重さがね。
ね、そうなのよ。
そうそうそう。
だったらマシ、ね。
もうエージェントだろうがローカルだろうが何でも来いみたいな感じで。
これもMacBook Pro欲しいな。
今の何?Proじゃないの?
Proじゃないよ。MacBook Airですよ。
普段持ち歩いたあの緑色のノートパソコンは。
渋調だったよね。リアル移動多いし。
家に帰らんとしっかり作業できんっていうのはちょっと嫌だね。
そう。結局家に帰らんと作業できんだったらデスクトップPCが別にあればいいよねっていう話もあるから。
そうね。
そうそうそう。そこでちょっとね今。
だったら出先は軽いやつの方がいいんじゃないかみたいな話もあって。
割と俺がやる、というかインターネットと繋がってればさ、そんなにPCのリソースなくても意外と行けたりするから。
そうか。リモートでね。操作してる。
そうそうそうそう。そっちに任せちゃえばね。
今のところは一応運用してるけど、なんかさ、やっぱガジェット好きだから。
そうね。
Pro、Proですっていうやつをやりたいだけ。
やっぱ今回支障が出たからさ。
ホットキャストミキサーで音声の静音作業めっちゃ時間かかって、その間パソコン使えない柔軟時間みたいなさ。
それ辛いな。
辛くて、これダメだって思ったね。背中押していただきました。
よかったです。
ミキサーさん。
ありがとうございました。
ミキサーに。じゃあAppleからもねちょっとスポンサーと付きいただかないとね。
そうね。
ミキサーのおかげでMacBook Pro1台売れたよってことで。
さらにね、外に出る足が遠のいちゃうからさ。
そうね。
外で作業できねえわとかさ。
メインのPC、話がどんどんそれるけど、全てをMacBook Proでやってんの?家にデスクトップあんだっけ?
全てをね、全てをこの1台にするっていう思想でこれ買ったのよ。
やってんだ。
これ買ったの。
なるほど。
今まで切り替えてたんだけど。帰ったらデスクトップでみたいな。
それやるとこっちにデータがないとかないとか環境が変わるとかっていう問題めんどくさくて。
帰っても出先でもこの1台みたいな風に変えて。
これ2年くらい前に。
でちょっとこれ足りなくなってきて。
で今回ちょっとスーパーマシンにしようと思って。
これじゃあ家にデスクトップないんだ?
一応あるけど使ってない。
なるほどね。
うんうん。
じゃあスーパーマシンだったら。
これでちょっとフットワーク軽くなるかなって。
秘部長にさ引きずり出されること多くなりそうだしさ。
そうね。
これ1台あれば安心っていう状態にしたくて。
それ1台さえ持ってればどこでもカネヤンのポッドギャスを作れるよっていう状態で。
そうそうそうそう。
そうなんだよ。なんかね、だからすごい引力があるのよ俺。
スタジオというか自宅というか会社の方にさ。
そうよね。
すっげえ引力があって。
それって多分この母艦に座らないと落ち着かないっていう。
マイクとかレコーダーとかの配信機材もここが一番いいし。
パソコン系もSSDがあっていろいろ拡張でモニターがいっぱいあってっていう風だから。
すっげえこの基地に帰りたいのよ俺はいつも。
それはでも俺もそうよ。
あ、そうなの?
うん。
画面一個で作業してると効率悪いし。
そうなんだよね。
2畳半の狭い部屋。
狭い部屋。
落ち着くなって感じ。
コックピットねコックピット。
コックピットが落ち着くなっていう。
うんうん。
感じではあるんですけど。
それをね理論上は一台で何かどこへでもっていうの憧れるんだけど。
分かる。
でもそれはね結局隣の市は青い現象になってさ。
うん。
一台に主役すると分けてる人羨ましくなるのよ。
分けると一台に主役してる人羨ましくなるのね。
永遠にもう。
一台で完結するに越したことないけどね俺。
でもやっぱり初めて一台にしてみてめちゃめちゃ快適だったよ。
いやそうだけどさ重いじゃん。
まあ重い。
結構。
重いって何?パソコンが重くなるってこと?
いやあの物理的な重さ。
グラムが?
なんかさスタイリッシュにさなんか必要なことだけ
iPad miniとかでパチパチパチってやってる人がスタイリッシュに見えてくるのよ大体一台主役すると。
俺なんでこんなでかいやつパソコンなんか新幹線で開いてんだろうみたいになってくるね。
そうか。
だんだん。
ああいうスタイルもいいなーって。
MacBook一台くらいだったらだいぶスタイリッシュじゃん。
MacBookだったらねまあまあでもMacBook Proってそれなりに重くね?
ちょっとねサイズ14インチで結構まあ重いけど。
厚みと重さがちょっと若干それなりの重量感。
今まででかからよかろうだったから16インチとかあったの絶対。
今回思い切って14インチにしてみたのよ。
14インチのMacBook Pro。
持ち運びいいよやっぱり。
あれもう来た?
ん?
もう来てる?
来てない来てない。
これ今のやつが14インチ。
ああそういうことね。
今までの人生でかからよかろうだったから。
ああそういうことね。
2年前に初めてちょっと思い切ってちっちゃいのにして。
今回も14インチ新しかったの?
今回も14インチですね。
ああ。
初代大きい14インチで。
いいね。
やっぱりでかいと思う。
なんかそれだけで外出たくなくなるし。
うんうん。
重い。
そんな感じですね。
14、15ぐらいが一番いいな。
はい。
ちょっと話がない。
脱線気味で。
脱線気味ですけど。
はいそんな感じで。
今音声文字起こしのソフトウェアを1個紹介したと。
まだまだ1個ね。
アミカルでございます。
ローカル。
他のやつ俺ほとんど使ってないから。
ああそう。
あんまり説明できない。
ぱぱっと流しますけど。
はいよ。
これがね一番定番。
うん。
こちらですね。
アクアボイス。
アクアボイス。
アクアボイス。
これはもうどこのAI系発信者、AI系のYouTuberみんな言ってるアクアボイスと。
へえ。
これはさっきとは打って変わって、クラウドです。
インターネットと繋がってないと文字起こしできませんよと。
はいはいはい。
いうやつなんですけど。
日本語の精度が非常にいいらしくて。
日本語がね。
なんかいろんなメディアでもうやっぱアクアボイスだよねと。
うんうん。
いう風に言われてますと。
そうなんだ。
あとはねレイテンシーって言って喋り終わってから文字が出るまでの速さがめっちゃ速いと。
へえ。
クラウドなのに。
クラウドなのに。
相当な速度が出てるので。
うん。
やっぱいいよねと。
うん。
あとはカスタム辞書って言ってさっき言ったよりさその動音以後変換したりとか自分がよく使う辞書みたいなやつを。
うん。
自分で登録しておけるから。
うんうん。
それでいろいろこう時間パパーンとできたりとかして非常にいいと。
はいはい。
弱点としてはやっぱ完全クラウド処理なんだよねこいつは。
うん完全。
なので機密情報とか喋っちゃうとそっちに一旦上がっちゃいますよみたいな。
なるほどね。
うっかり入っちゃいそうだよね。
そうそこが気になってる人とかはちょっとつらいかなっていうのとあとこれはもう月間サブスクなので。
サブスクなんだ今ダウンロードボタン押しかけたよ。
えっとね月が多分10ドルぐらい。
あーまあまあ1500円。
そんなに大きくはないんだけど。
試してみてもいいかもね。
お試し期間はあるしその一定の期間だったら無料で月々使えるはずだから。
うんうん。
まあこれも別にお試しするのはいいと思うし一番定番だねアクアボイス。
なるほど。
はいっていうのが一個ともう一個紹介するとタイプレスというのがあります。
タイプレス。
タイプレス。
これもえーとねなんかこの。
聞いたことあるこれ入れたかもこの間。
これはねアクアボイスを超えたというふうに日本でレビューされていた。
されているような結構新しい。
イベントでね会った人がやってたんじゃないかなこれ。
タイプレス?
うんあのAIラボのAGIラボの。
あーそうか。
なんか聞いたことあるわこれ。
これもね定番ですはい。
でまあほとんどアクアボイスと多分変わりはしないんだけど好みの問題。
スマホ。
あこれ違うのなんかyoutubeで誰か使ってて入れてみたんだ。
あ入ってる?
うん入ってるけど鬱陶しくて消した。
何で鬱陶しくて。
なんかキーボードジャックしてくるからなんか鬱陶しくてさ。
あそうキーボードジャックして。
あとねこいつはこれもクラウドで処理してるんだけど。
うんうんうん。
一応その学習には絶対使わないよっていう風にちゃんとプライバシーポリシーに明記されてますよと。
なるほどね。
なのでまあ一個ちょっとアクアボイスよりセキュリティが高そうだぞという風には言われていると。
プライバシーポリシー。
あとスマホがちょっと強いらしくてこれ。
あー強いんだ。
Mac、Windows、iOS、Android全てのプラットフォームに対応しているという点が他のものと違うと。
あ他パソコンばっかなんだ。
そう特にスマホアプリの出来栄えは群を抜いていて使い勝手が非常に良いと。
なるほどね。
ただやっぱちょっとレイティシーはアクアボイスには劣ると。
ちょっと遅いってことね。
ちょっと遅い。
あと若干高い。
ほう。
えーとねこれ年払いを要求してくるタイプのやつで。
うわー。
年払いだったら月額10ドルだけど月払いだったら月額30ドル取るぜという。
高っ。
3倍いくの?
そう3倍いく。
あー小気やなー。
結構小気なことやってるねこれね。
腹立つねなんか。
そう。
でも一応無料でも使える枠があるので。
中国系でしょこれ。
タイプレス中国だったからちょっと国見てなかった全部。
ちょっとこのウェブサイトから漂う。
チャイナ州がある。
チャイナ州。
適当なこと言っとるけど。
どこだ国。
会社マニフェスト。
うわ。
チャイナっぽいなこの薄っぺらい。
アメリカでした。
薄っぺらい感じ。
アメリカです。
アメリカ。
すいませんでした。
はい。
全然テイスティングできてないですね。
ごめんなさいアメリカさん。
テイスティングできてない。
テイスティングできてません。
すいません。
音声入力テイストはそぶりはできないかもしれんね。
あれでもこれあれよ。
CEO創設者CEOは。
うん。
中国の人じゃないの。
これシリコンバレーから生まれたベンチャー企業みたいなところだよね。
そういうことね。
分かりました。
はい。
っていう感じでタイプレスというものがありますよと。
最後。
そうっすか。大事だよなでも。スマホで使いたいよね多分ね。
スマホでフリック入力一番嫌だからね。
遅いんだよな。キーボードより。
スマホで入力したいタイミングって割と外にいるからさ。
あとマイクもないから。
俺はあんまスマホで入力できなくてもまあまあ困らないかなって感じはした。
マイクって何あんの?付いてるじゃんスマホに。
スマホには付いてるけどさ。
面倒くさくない?画面見れないじゃん。
だってこうやってやるじゃん。
そんな近づけんでも認識するでしょ。
これでいける?
いけるでしょ。
いけるのかな?
いけるでしょ。
使い比べてみたいねこれもね。
使い比べまでいけたらよかったんだけど。
これも案件じゃないですか。
案件はあると思うよ。Aqua Voiceとか結構。
同時にやりたいよね。
本当は今日使い比べてきましたってやりたかったんだけど全然巻いてなかったんで。
これぜひコミュニティで皆さん使い比べてください。
そうね。困ったらコミュニティ全部。
そういうのは快適だよね。
そうね。
これもリンクは全部貼っておきますんで。
基本的にはアミカル以外は、アミカルはもちろん最初からオープンで無料なんですけど、
全て無料枠があるんで、試すことができますんで。
皆さん試してみてください。
無料枠でね。
ちょっと前から話ししらっとしたんですけど、
入力ってやっぱりガジェットも大事だよね。
入力ガジェットも大事なんですよね。
パソコンで音声入力するときに、みんなどのマイクで入力してるんだみたいな。
本体マイクでしょもうそれはね。本体マイクですよ。
いやいやいや本体マイクじゃん。
いちいちこんなポッドキャストのマイク引っ張り出してやってんの?
違う違う違う違う。
なになに?
ちゃんとそのさ、Bluetoothのさ、首元に付けるマイクあるんですよ。
DJIみたいな。
音声入力って結局ボソボソやりたいのよねみんな。
あ、そうねそうねそうね。
その時にどういうデバイスが使えるかなっていう話。
大事だね。
大事。
でね、ちょっと最近話題になってたっていうか、めっちゃ定番のやつがあって。
俺もこれはもともと使ってたんだけど、
あのね、ショックスのオープンコム2ってやつね。
骨電動タイプの。
あーはいはいはい。
オープンイヤー型の。
はいはいはいはい。
これは俺もう2年ぐらい使ってるけど、Zoomのミーティングとかで。
うんうん。
めちゃくちゃいいです。
いいんですかこれ。
いい。めっちゃいい。
マジ?
音楽聴くとか無理よ。
うん。
なんだけど、そのウェブミーティングとかすげー使いやすいから。
えー。
これが結局、もともとウェブミーティング用に俺は買ってずっと会社とかで使ってたんだけど、
音声入力のデバイスとしてめっちゃ評価が高いです。
あ、そう?
うん。
なんで?
まず、ずっとつけてられると。
あ、そうか。耳ふさがないから。
耳ふさがないから、別につけっぱなしでもいいと。
で、マイクの性能もいいし、マイクも口元に出てくるから、
うんうんうん。
すげーボソボソ喋っても入力してくれるよね。
なるほどね。ボソボソ拾ってくれるんだ。
うん。
だからそのね、周りの音も聞こえるし、自分の入力もできるしっていうので。
まあ問題点はちょっと高いっていうことぐらい。
22,800円。
うん。ちょい高い。
なるほどね。おすすめですか。
でも2年使っててね、全然いいし。
Bluetoothでスタイリッシュにできるし。
じゃあこれ、リンク貼っときますよ。
はい。これリンク貼っといてください。
で、もう一つ最近話題になってたので紹介すると、
DJIのマイクミニ2。
2?
2。
なぜ3じゃないんですか?
いやいや、DJIのマイク3じゃなくて、
マイクミニ2っていうのが最近出たのよ。
ミニ2最近出た?
ミニ2最近出た。
めっちゃちっちゃいってこと?
もともとミニがあったんだけど。
ちっこいね。
ミニ2はね、安いの。
なんかおもちゃみたい。
そう。7000円ぐらいで。
安っ。
安いね。
おもちゃじゃん。
レシーバーとセットで買えるのよ。
こんな安い値段で出てきちゃった。
でも言っても安くてもDJIだから。
でも形は、大きさはもうマイク3じゃん。
マイク3と同じぐらい。
私が使っているやつ。
そうそうそうそう。
でも値段は全然安いよね。
だから音質は多分全然期待できないんだけど、
だからPodcastの収録とかで使おうと思ったら、
若干きつい部分はあるんじゃないかなと思うんだけど、
それでもこれが意外とレシーバーついてるから、
そのままパソコンにつけちゃって、
音声入力ガジェットとして優秀だよみたいな話があった。
なるほどね。
これを首元にマイクつけておいて、
ボソボソ喋ればパソコンに入力できますよ。
しかも安いから1万円以下で。
安いな。
マイク2つついたら使えるから。
すごいねこれ。
違う用途でも使えるし、
結構そのSHOXって言ったらもう完全にウェブイヤホンとして、
ウェブミーティングのイヤホンとして使うけど、
これ多分音声収録したいよねみたいな時に合わせても使えるから、
音声入力用のガジェット兼違う用途でも抱き合わせで使えるし、
いいんじゃないかなっていうので。
カラーバリエーションも無駄にあるし。
見てるけどさ、
マイク3との性能差そんなにめちゃくちゃ大きいような、
スペック差はあんま感じないよね。
32ビットフロートじゃない24ビットとかさ、
まあ十分じゃんね。
そうね、本当にあれよ、
先月出たぐらいよ。
一瞬買いそうになったもん。危なかった。
買っちゃうよね、こんな安いの。
こんな安かったら買っちゃうね。
でも買っちゃおうかなと思ったけど、
マジでいらないってことに気がついて、
使い道がねえと思って。
持ってくから、普通にDJのマイクね。
マイクね、それでいいよと。
これで良くないみたいな感じになって、危なかった。
危ないね、それね。
あと2手で買うぐらいだった、本当に。
もうちょっと差を分かるように買ってくれないとさ、
マイク3が売れなくなるよね。
そうね。
どんどんで出してくんね、なんかこのちっこいマイクね。
いや、DJはね、やっぱすごいよ。
ドローンもDJだしね。
DJの、あれ言ったっけ?
オスモポケットね。
オスモポケット4の話だよね。
見たよ、検索して。8万ぐらいのがあったわ。
そうそうそうそう。
ポチリスとなってやめた。
まだリアルで収録することはそうないと。
でもビデオポッドキャスト作ってくださいとかさ。
ビデオポッドキャストで金井さんやりましょうみたいな。
リモートでやりましょうって。
家から出ない。
リモート極めたいよね。
リモートね、確かに。
リモートの良さあるからな。
リモートってさ、相手の環境に依存するじゃん。
そうね、音質とかね。
ポッドキャストやってる人だったら相手がいいけどさ、
ちょっと音声収録とかわかんないんですよみたいな人と相手だとめっちゃ困るじゃん。
それはそう。そういう人とはリアルしかないね。
そう、そういう人はリアルしかないなって思うよね。
はい、ということで入力ガジェットもありますと。
はいよ。
だから音声入力バチバチやっていきましょうという話をしたいわけじゃないんですよ。
違うの?
そう、音声入力いいんだけど。
何も。
ちょっと音声入力。
早くやりたいよ、俺。
課題評価されすぎなんじゃないかせず俺は唱えたい。
あ、そっち?
そっち。
今もうポチる寸前だったよな、アクアタイムズみたいなやつ。
いや、それポチってもいいと思う。
ポチってもいいんだけど。
うん。
なんかね、落ち着きAI的な話をしたくて。
はいはい。
言うんですよ、みんな。
人が話す速度っていうのは1分間で300文字ですよと。
タイピングっていうのはだいたい平均で1分間で150から200文字だから。
おお、倍ぐらいいくの?
だいたい1.5倍か2倍ぐらいのスピード、アウトプットのスピードが違うんですと。
喋る方が早いってことね?
喋る方が全然早いと。
ああ、なるほど。
だから喋ってアウトプットした方が2倍のアウトプットが出ますよと。
いいねいいねいいね。
っていう話があるんだが。
好きそうだね、なんか。
みんなそんな話をするんだよ、音声入力するときに。
はいはい。
これをちゃんと調べるとですね、その前提条件なんなんみたいな。
考えたことありますか?と。みんな音声入力を押す人はさ。
いやいや、もう倍違うからと。
そうね。
言うんだけど、じゃあどういうシチュエーションで試して倍違ったかっていうのを語らないね、みんなね。
シチュエーション?
シチュエーション。どういう実験の状態で倍違うんですかと。
研究者っぽいちょっと。
これですね、あのね、画面に出てくる短いフレーズをアワって打ちますみたいな。
はいはい、すしだみたいなやつだ。
すしだみたいな。すしだよりはさすがに長いかもしれないけど。
ああいうので勝負したときに倍早いよと。
うん、なるほど。そういうことなんだ。
うん。
小説読んだみたいなことじゃないんだ。
小説読んだに近い、でも。
短いフレーズ。
だから書き写しただけだよね。だから目の前に出てきた文字をもう一回打ってって言ったときに音声入力で、
てかそれを打つか、しゃべって読むかでどっちが早いかって話だよね。
なるほどね。
それはしゃべってた方が早いに決まってんじゃないかな。
うん。そりゃそうだ。
そりゃそうじゃと。
でもってことは別に全部早いんじゃないの?しゃべった方が。
と思うでしょ?
違うんですよ。
違うんですか?
それは確かにそうなんだけど、それって書き写しだけのタスクですよねと。
うんうん。
しゃべるって、
うん。
疲れるんですよ。
おー、なるほど。
ていうのは、
打つのも疲れるよ。
いや、それがですね、脳ですね。脳脳。どういうワーキングメモリーを脳の中で使ってるかって話。
うんうん。脳の中ね。
そう。だから結局話すっていう行為って指を動かして文字を打つよりも、いっぱい脳のリソース使うのよ。
これを発話しようって言って、こういう口でこういうのでって動かすとかいっぱいあるから。
なるほど。
脳のリソースを意外と使ってると。
うん。決断疲れだ。
そう。いろいろだから、じゃあ考えながら口でアウトプットしようとした時って、内容について考えようとするリソースを口を動かして発話しようとするリソースを食っちゃうわけ。
実はそのワーキングメモリーの取り合いが起きてますよという話がありますと。
はいはいはいはい。
だから音声入力の方が実は考えるタスクでは疲れる。
うんうん。
し、長いものはなかなか結構アウトプットしにくいという結果があるらしいです。
なるほどね。
はい。でやっぱ。
疲れるんだ。
このね、アウトプットしている時に自分が今までアウトプットした内容をバーって見えるのと、言葉で喋ろうとしたらリアルタイムでザーって出てくるわけじゃないからさ。
うん。
その長文喋った時に自分が喋った内容を最初から目に見えてないのね。
うん。
っていうところで喋った内容を記録しておかなきゃいけないっていう負荷もあるから。
うん。
意外とアイデア出す時って、書いた方がアイデア出るのが多かったりする。
あ、そう喋るより。
喋るより。
喋るとやっぱ喋ったこととか、そこまで喋ってきたことを覚えておくっていうところにもやっぱ脳のリソースが使われると。
記憶しようと。
そう。
そうですか。
アンチ音声入力だ。
そうです。だからその音声入力、キーボードを捨てちゃダメってことね。
捨てるなと。
捨てるな、そう。
だからその音声入力こそが、もうなんか全てだみたいな。
そのなんかタイピングとの比較だけで。
うん。
速度を比較。
音声入力の方が優れてるっていうのは、少し想定な感じは調べてみて、わかったんだけど体験的にそういう感じがしたのよ。
口で、慣れてないっていうのもあるんだけど、口でこうやりながらいろいろ作ってるときに、やっぱ何か喋ろうとか口でまとめようと思ったときにさ、ちょっと脳のリソース負荷がかかるなっていう感じがあって。
なるほどね。
なんかちょっとやりにくいなと。
ただ、それもAIがうまく要約してくれるんだったら、もうとにかく喋っちゃえみたいな。
っていうやり方もあるから。
思ったことを全部ね、喋ってね。
そうそう。そこはツールに助けてもらいながら、結構やっぱいいアンバイナーになってると思うんだけど、
だからその音声入力こそ神みたいな感じではなくて、実はよしよしちゃんとあるから、それぞれ残ってるよって感じ。
音声入力はやっぱあんまり長いスパンで考えなくてもいいようなタスクとか入力にだいぶいい感じ、使える感じ。
そのまま限りの。
それこそ、バイブコーディング用の入力とかAIに指示するとき、これやってこれやってみたいな。
これこうなっちゃってるからこういう風にしてほしいし、これこうなっちゃってるからこういう風にしてほしいよみたいな。
AIのアウトプットに対して指示してバイブコーディングを走らせるときは別に打たなくても、それをそのまま見たまま口で言えばいいから。
すごくそういうAIに指示を出すバイブコーディングでは音声入力すごく使えると。
てかなんかこう彼らがやろうとしてる本を書くみたいなのって。
ちょっとなんか向かなさそうな話だね。
あと音声でやろうとすると、実は逆に使えるかもしれない。
ていうことでございます。
なるほど、もう発砲したがりだ。
いや、塞がってないよ全然。全然塞がってないよ。
塞がってないよ。もう手書きで書こうかな。
最初のアウトラインは手書きでもいいと思うよ。
そうだね。
白紙に手書きっていうのはその枠がないからいろんな発想が出てくるよねってある。
それはすごくいいと思います。
はい、なるほど。
なんでちょっとその音声入力こそ神だっていう感じではないけど、やっぱよしよしあるよっていう話でございます。
なるほどね。
でも俺もちょっとねバイブコーディングの時は確かにこれ音声入力めっちゃいいなと思ったから。
うーん。
打たずにね。
そう。
それはあのローカルのやつで使ったってこと?
使った。クラウドコードに入力してやるとやっぱ早いよね。
うん、それのローカルのやつアプリの中で書いてコピーして打つってこと?
違うよ。
え?
別にクラウドコードに
そのまま喋ればいいの?
そのまま喋ればいい。
いいじゃんそれ。
だから音声入力ってそういうもので、今カーソルがあるとこに文字が入るからそのまま。
うん、いいじゃんそれ。
ショートカットキーだけ設定しておいてこのキーを押しているときは入力モードになるから
マイクについて喋ってあげれば今打とうとしているそのカーソルがアクティブになっているとこにバッと文字が入ると。
いいじゃない。
それがあれだよ。基本的にはもう全部そう。音声入力ソフトは。
それローカルで無料のやついいね。
そう、ローカルで無料のやつでもそうそう。
まあ全部そうなんだけど。
入れない手はない?
ローカルで無料のやつそれでできるからいいと思います。
絶対入れた方がいいじゃん。
そうそうそう、いいよ。だからこれは確かに手が動かせないときとか流れでバイブコーディングしようと思ったときは
結構そうやってちょっとAI作業終わったなと思ったらボタン押してバーって喋って。
それこそワイヤレスマイクつけて喋って指示出すみたいな。
いいっすね。
これはあり。なぜAI界隈で流行ってるかよくわかったわ。
バイブコーディング用なんだ。
そう、それとタスクとの相性がめちゃくちゃいいと思う。
だからこのアイデア出しとかブログの作成にまで使うと結構実は脳が疲れる可能性がある。
なるほどな。文章を構成するみたいなことには喋りながら向かないんだ。
そう、あと一個やってみて懸念があったのはパワハラを口で言うと性格が悪くなるかもしれない。
あらボケ滑走みたいな。
強い口調を日常的に口から出してると普段のコミュニケーションでも口が慣れて言っちゃう可能性があるなって思った。
言わないでください。
でもさ、言うじゃん。
だってAIに言わない方がいいんでしょ?
言わない方がいいよ。
我慢しないと。
でもほら、最近クロードコードアホになってさ、なんか微妙な時あるのよ。性能が落ちて。
今度それちょっと録音しといてよ。
俺が指示出してる感じ?
そうそうそう。こんな感じですみたいな。
いいよ。
ちょっとそれをお披露目したい。
でも録音してるってなったら優しいこともなっちゃうかもしれないし。
ダメだねそれ。猫被って。
猫被るか、逆に不自然になるよね。面白くしてやろうと思ってわざとパワハラするみたいなのが一番寒いじゃん。
そうだね。
だからカネリンがなんか密かに盗撮してるみたいなやつじゃないとやっぱ自然体は出ないよそこではな。
そうか。
人目を気にするタイプなんだって。
そう。見栄え、人目をね。いいカッコしいだから。
ひょうひょうと言ってそうだよね多分。
ナチュラルにね。
表情変えずに。
表情変えずにすごいきついこと言ってるかもしれない。
やば。こわ。
こわ、みたいな。
それあれだよね。でも旗から見たらめっちゃ怖いよね。
めっちゃ怖いよ。
音声入力でAIにパワハラしてる人がさ、カフェとかにいたらさ、死ねポケカスみたいなこと言ってる。
死ねポケカスはやばい。
死ねポケカスはやばいよ。
やばい。
何やってんのって。そのままで言ってないやんみたいな。
せっかく寝不足だからかなって思っちゃう。
らしいよ。寝不足だとやっぱねなんか精神がその安定せずに攻撃的になるらしいからね。
じゃあ寝不足のせいだね。
あと極端に疲れてると下ネタしか考えられなくなるらしいよ。
そうなの?そんなことあるの?
下ネタをすごく言う人はすごく疲れてる可能性があるってSNSで書いてあった。
支部長そのせい。
でも今回下ネタ言ってないから。
そうか。
一切言ってません。
そうだね。パワハラか下ネタどっちかだね。
パワハラで下ネタ。合体させたらセクハラとかになるのかな。
一番ね。
AIにセクハラしまくる。
AIにセクハラヤバいね。AIにセクハラもう人間の終わり感あるよな。
だって近いんじゃない?AIにセクハラする日も支部長。
だってエージェントなんか女の子にしてエッチなことやらしてるでしょ。
まあそうだね。でもそれはハラスメントじゃないから。
いいパンツだねみたいなこと言っちゃうんじゃない今度。
向こうも良かれと思ってやってるからそれは。ハラスメントにはならないよね。
良かれと思ってやってるから。
おじさんじゃんそれ。
こんなケツしてるこいつが悪いんだみたいな。
いいケツしてるしアンザン型だなとかってな。
最悪な。
AIで破産してもらって。
昭和のセクハラおじさんでございますね。
ひどいな。職場でポロッと行っちゃってください。
一瞬でクビだからね。危ないよね本当にね。
AIにそういうさ。一瞬でクビよ。セクハラなんて一番クビだから。
怖い怖い。AIでお楽しみください。
音声入力の時はAIにパンハラしない方がやっぱ自己率低くなるので。
優しくしましょうと。逆に音声入力にしたらAIに優しくなれる可能性もあるよね。
あるね。性格が良くなるかも。