1. おちつきAIラジオ
  2. 【音声入力AI】キーボードはも..
【音声入力AI】キーボードはもうオワコン!? 最新AI音声入力AIツール4選と「喋る方が疲れる説」の真相(ep.73)
2026-05-29 1:01:07

【音声入力AI】キーボードはもうオワコン!? 最新AI音声入力AIツール4選と「喋る方が疲れる説」の真相(ep.73)

spotify apple_podcasts youtube

【重要なおしらせ】実践型の有料コミュニティ、遂にオープン!みんなでAIを触っておちつこう!

https://rooom.listen.style/p/ochitsuki-ai?tab=membership

※番組の継続をサポート頂ける方の為のサポートプランもご用意しています。ぜひよろしくお願いします。


【トーク内容】

今回は、現在急速に進化している「AI音声入力ツール」について、しぶちょーとかねりんがやさしく解説します!「キーボードはもうオワコン?」という声もある中、実際のところどうなのか。Apple標準の音声入力とは異なり、裏側でLLMが動き、フィラーの除去や文脈に合わせた誤字修正を自動で行う最新技術の仕組みを解き明かします。番組内では、完全無料かつローカル環境で動く「Amical」や、クラウド型で爆速の「Aqua Voice」、スマホ対応の「Typeless」、そして買い切り可能な「Super Whisper」など、代表的なツールを比較。さらに、音声入力に最適なマイク(ShokzやDJI)の紹介から、「実は喋る方が脳のワーキングメモリを使って疲れる説」という深い考察まで、充実の1時間をお届けします!


【目次】

() オープニングトーク「試してみたい音声入力」

() かねりんの執筆事情とiPhone純正メモの限界

() 音声入力ソフトは「入力」+「LLMでの整形」に進化

() おすすめソフト1:完全無料でローカル動作「Amical」

() おすすめソフト2:爆速クラウド処理の大定番「AquaVoice」

() おすすめソフト3:スマホ対応が優秀な「Typeless」

() おすすめソフト4:買い切り可能でMacに最適「Super Whisper」

() 音声入力におすすめのガジェット:ShokzとDJI

() 音声入力の罠:実は「喋る」ほうが脳のリソースを使う?

() AIへのハラスメント注意!言葉遣いとVibe Coding

() エンディング

() オフエアートーク:引っ越しと収録の裏話


【今回の放送回に関連するリンク】AquaVoice

https://aquavoice.com/

Amical

https://amical.ai/

Superwhisper

https://superwhisper.com/

Typeless

https://www.typeless.com/

Shokz  OpenComm2(アフェリンク)

DJI Mic Mini 2(アフェリンク)

【今回の要チェックキーワード】

AquaVoice(アクアボイス):喋り終わってから文字が出るまでの速度(レイテンシ)が最速級で、現在最も評価が高いクラウド型の音声入力ツール。

Amical(アミカル):完全にローカル環境で動作し、機密案件の処理にも適したMITライセンスの完全無料・オープンソース音声入力ツール。

Superwhisper(スーパーウィスパー):話した内容を「AI向けの最適な指示文」に自動変換するカスタムプロンプト機能が優秀で、開発者に人気の音声入力ツール。

Typeless(タイプレス):スマホ(iOS/Android)での体験が突出して良く、プライバシー設計やAIによるトーン自動調整に強みを持つ最新世代の音声入力ツール。

Whisper(ウィスパー):OpenAIが開発した、人間が話した音声を非常に高い精度でテキストに変換できる高性能な音声認識モデル。

レイテンシ(Latency):マイクに向かって話し終わってから、実際に画面に文字が生成・入力されるまでの「遅延時間」のこと。

フィラー除去(Filler Removal):「えーっと」や「あー」といった、発話時の意味を持たない繋ぎの言葉をAIが自動で認識して削ってくれる機能。

—----------------------------

【番組の概要】

日々のAIトピックを、現役のAIエンジニアがやさしく解説する対談番組。AIニュースに驚き疲れたあなたに、おちつきを提供します。AIニュースの、驚くポイント、驚かなくても良いポイントがわかります。

★ご感想やコメントは、番組公式ハッシュタグをつけてX(旧Twitter)でポストしていただけるとありがたいです。

【番組公式Webサイト】※お便りはこちらから

https://ochituki-ai.com/

【公式ツール】

・おちつきAI RAG

https://ochitsuki-airag.com/

【番組公式ハッシュタグ】

#おちつきAI

【番組公式X】

https://x.com/ochitsuki_AI

【パーソナリティ(MC)】

▼しぶちょー

・AIエンジニア

・技術士(機械部門) 

「大手機械メーカーでAI開発の最前線を担う現役エンジニア。AI(ディープラーニング)の実装スキルを証明する「E資格」を保有。機械(ハードウェア)への高度な知見も有し、双方の専門性を掛け合わせ『AIの社会実装』に貢献する。情報発信活動にも精力的に取り組み、ブログ・音声配信(Podcast/Voicy)・SNSなどで幅広く活躍。単なる技術解説でなく、行動変容を伴う情報発信を信条とする。その姿勢が評価され、2025年UJA科学広報賞 審査員特別賞を受賞。著書に『集まれ設計1年生 はじめての締結設計』(日刊工業新聞社)。岐阜県テクノプラザものづくり支援センター広報大使、生成AI EXPO in 東海 共同代表も務める。」

https://x.com/sibucho_labo

https://voicy.jp/channel/3963

▼かねりん(金田勇太)

・KANERIN Podcast Studios 代表

・一般社団法人 地方WEB3連携協会 理事

「刑事司法実務の最前線で多数の犯罪捜査を指揮。2017年から暗号資産業界へ参入。数々のグローバルプロジェクトに参画しコンサルティング、情報分析・アドバイザリー業務を提供。コンサートライブ配信業、音声配信業、テックメディア創業等を経て、ポッドキャストレーベル兼プロダクション「KANERIN Podcast Studios」を創業。多様なパートナーと共に、未来へつなぐ声の原典を共創している。」

https://x.com/kanerinx

https://voicy.jp/channel/2534

【プロデューサー】

かねりん https://x.com/kanerinx

【サウンド・アーキテクト】

Aviv Haruta https://x.com/oji_pal

【カバーアートデザイン】

UTA https://x.com/uta_dib

【制作/著作】

KANERIN Podcast Studios

--------------------------------------------------

※画像引用元:

【各種ポッドキャストスタンドへのリンク】

Spotify

https://open.spotify.com/show/6iGk39bSta5KZ1QD7jvK2o

Apple Podcast

https://podcasts.apple.com/us/podcast/id1841316430

Amazon Music

https://music.amazon.co.jp/podcasts/aba8e9a4-aefb-404a-b366-4b7a11b3f7cb/

YouTube

https://www.youtube.com/playlist?list=PLNQiF7XIko7QOIlyFMiI_aDdk1eJzNiCD

LISTEN

https://listen.style/p/ochitsukiai

感想

まだ感想はありません。最初の1件を書きましょう!

サマリー

今回のエピソードでは、急速に進化するAI音声入力ツールに焦点を当て、その現状と活用法が解説されました。従来の音声入力が単なる文字起こしであったのに対し、最新ツールはLLM(大規模言語モデル)を裏側で動かし、フィラー除去や文脈に合わせた誤字修正を自動で行うことで、より自然で正確なテキスト生成が可能になっていると説明されています。 番組では、完全無料でローカル環境で動作し、セキュリティ面で優れる「Amical」、日本語の精度と速度が非常に高く評価されるクラウド型「Aqua Voice」、スマートフォン対応が優秀でプライバシー保護を重視する「Typeless」、そしてローカル・クラウド処理を選択でき、買い切りオプションもある「Super Whisper」の4つの代表的なツールが比較紹介されました。また、音声入力に適したガジェットとして、Shokz OpenComm2やDJI Mic Mini 2といったマイクも推奨されています。 しかし、音声入力には「喋る方が脳のワーキングメモリを使い、疲労しやすい」という落とし穴も指摘されました。タイピングに比べて発話速度が速いという利点がある一方で、思考を伴う長文作成やアイデア出しには必ずしも最適ではない可能性が示唆されています。特にAIへの指示出し(バイブコーディング)のような特定のタスクでは非常に有効であるものの、キーボードを完全に置き換えるものではなく、それぞれのツールの特性を理解した上で使い分けることの重要性が強調されました。

オープニングと音声入力への関心
おちつきAI
おちつきAI
おちつきAI
AIエンジニアのしぶちょーです。
AI素人のかねりんです。
この番組は、日々のAIニュースで驚き疲れたあなたに、ゆっくりじっくり、AIを学んで落ち着いていただく番組です。
はい、ということで始まりました、おちつきAIラジオ深掘り会ですね。
今回はですね、一つのトピックについて深掘っていきたいと思います。
早速ですけども、今日のテーマはこちらです。
試してみたい音声入力でございます。
音声入力の現状とAIによる進化
はいはいはいはい。
これね、どういう話題かというと、
直接、AIとは関係なくはないけど、
クリティカルにAIっていう感じじゃないんだけど、
今、AI界隈で音声入力めっちゃ熱いんですよ。
そうなの?
かねりんそもそも音声入力って使ってる?
音声入力使ってるし、それこそ例の本は音声入力で書こうとやきもきしてます。
そうなんだ。
手で打つの無理です。
出た出た。
手で打つの無理なんで、音声で入力してちょっときれいにしてもらおうと思って。
AI先生。
ちなみに音声入力何のソフト使ってるの?
意外とiPhoneのメモで。
iPhone純正キーボード。
純正のメモのやつね。
ダメですか?ダメですか?
いや、ダメじゃないです。
ダメじゃないですけど、
今、やっぱりAI界隈で流行ってるツールいくつかあるから。
そう、そっちの方がいい?
早く教えてよ、ギリギリじゃん。
今日はちょっとそれで、
それを色々、全部試したいんだけど、こんなのありますよって紹介する回でございます。
めっちゃいいクリティカル。
良かった、クリティカルで。
なんならちょっと遅いぐらい。
早速これ使って本書きます。
是非、早く本書いて。
で、てかもう遅くない?
ライブ前に言ってたよね、本書くのってね。
そうなんです。ヤバいんで本当に。
頑張りたいです。本当にヤバいんで。
いや、あのね、本あるあるだから大丈夫。
俺1年寝かしてっから。
いやいやいや。
1ページも書かなかった1年ね。
そんなことヤバいな。
本に書くサインしか考えなかった。
サイン?
サインあるもんね。
サインあるんだよ。支部長サインやってた。
あれさ、本書く前に、
ココナラでデザイナーに作ってもらったのよ。
あ、そうなんだ。サインをね。
本が書いた暁には、そこにサインを書くぞという。
最初にそれを書くことによって、
執筆のモチベーションが上がるかなと思って、
作ったんだけど、全然上がらなくて。
ダメだな。
あまり意味ないサインを考えても。
絶対もうそれさ、テスト勉強前にさ、
なんか漫画読み出す人じゃん、それ。
そう、いや違う、テスト勉強前に部屋掃除する人だよ。
そんな関係ありそうな関係ないことやるから。
あ、そっかそっか、漫画じゃダメ。
漫画はさ、もう完全に勉強と相反するとこじゃん。
罪悪感あるじゃん。
なんだけど部屋掃除するって、なんか勉強の準備っぽいから、
罪悪感ないのよ。
ランニング行く前にちょっと靴洗うみたいな感じかな。
そうそう、なんか関係ありそうな関係のないこと。
濡れちゃったから走りに行けないみたいな。
そう。それと同じ感じでサインを考えてましたけど。
その本はもう無事書けたの?
無事書けました。
あーよかったよ。
で、そのサインもその本に書いてるから、一応やりたいことができてるって感じだね。
サインね。はいはい。
カネリンも早くサインもらいたいな、カネリンの本でな。
そうね、いろんな店の壁に実は俺のサインとか書いてあったりするんで。
あ、そうなの?
もうすでに?
昔の界隈の時にね。
あー、そうか、U3インフルエンサー時代のね。
インフルエンサー時代のね。
サインはすでにあるんだね、じゃあね。
ちょっと違うサインを開発しないといけないね。
最新版カネリン、そう、ポッドキャスト版カネリン仕様のさ、
サインをぜひとも考えてください。
そしてその、まずそのキャンパスとしてね、本を完成させなければならず、
その本のために音声入力がいると。
そういうことそういうこと、早く知りたいです、今日はだね。
ありがとうございます。
え、じゃあぶっちゃけそのiPhoneメモで音声入力なんかも全然ダメ?
いや、ダメじゃないけど、パソコンでやりたくないって話?
パソコン別に、パソコンのメモでやるよ。
パソコンのメモ?
パソコンの音声入力ボタンF5を押してやるよ、いつも。
あー。
一緒やん、一緒。
一緒であるけど、微妙に一緒でないのよね。
おー。
ローカル動作の無料ツール「Amical」とPCスペックの重要性
でまぁ、すごくまぁ、今すごい流行ってると、やっぱ音声入力ね。
流行ってんだ。
流行ってます。でなんかやっぱ、すごいよ。
これこそ驚き屋さんじゃないけど、もうキーボードをワコンって言ってる人いるから。
これすごい。
キーボード捨てろって言ってる人いるから。
極端だな。流石にそれはないんじゃないかって。
キーボード捨てろみたいな。
喋るより手を動かした方が早い時もあるぞ。
音声入力の神みたいな人がいてですね。で俺は、
鏡だな。
俺はね、タイピング派なんですよ。
あーそうなんだ。
俺はね、打ちたい派で音声入力否定派だったんだけど、
あ、そううん。
なんだけど、なんで音声入力否定派かっていうと、メインの作業場所が電車なのね。
あーなるほどね。
なるほどね。喋れないよと。
喋れないから、今まで使ってこなかったんだけど、
ちょっと環境は変わるじゃない?単身不認して。
あ、そうだうん。
で、ね、ちょっと一人暮らしにもなるし、
これ音声入力試せんじゃね?と思って。
いいね。ずっと喋ってられる。
もしかしたら今まで知らなかった新たな効率化の窓が開けるかもしれないなと思って。
一人でずっと喋ってんじゃない?
すでに一人でずっと喋ってるからさ、パッドキャストマインしちゃってるし。
そうだよねそうだよね。
あんま変わんないかもしれない。
さらに喋り続ける。
さらに喋り続けるかもしれない。
ていうんで、ちょっと今日は、自分で音声入力ソフトを色々使ってみようかなっていうか、下調べをしたって感じかな。
で、その結果というか、内容をカネリンにも、そしてリスナーの皆さんにも伝えるみたいな。
そんな回でございます。
で、ちょっと大前提の話をさせてもらうと、
音声入力ソフトって、何するものなの?みたいな。
何するもの?
何をするものなのか。
入力するものじゃないの?
そう、入力するものなんだけど、
これちょっとね、AIの文脈でだいぶ意味合いが変わってきていて。
あら、そうなの?
元々そのマイクに向かって喋ると、カーソルが今いる、カーソルで指定されている場所に文字がバーって入ってきますみたいな。
そういうソフトで、タイピングの代わりに口で文字入れるツールと言えばOKなんだけど、
昔は聞き取った音を文字起こしして置換するっていう感じだったのに。
昔なんだ、それ。
そう、昔。
今はLLMを裏で動かして、整形をしてくれるっていうのが音声入力ソフトです。
要は何?どういうこと?
だから、フィラーとかさ、言い間違いとか、そういうのを全部直して、
あとさ、言葉だけだとわかんない、動音異語みたいのもあるじゃん。
あるね。
ああいうのも、自分の辞書を裏で持っておくことによって、ちゃんとそっちの意味で変換してくれるとか、文脈を理解して正しい感じにしてくれるみたいな。
そういうサポートを裏でLLMでしながら、爆速でこう、文字起こししていくっていうのが音声入力ソフトなんで、今の。
じゃあ、入力しながらGPTかけつつ、語触を直していってるみたいなもん。
便利じゃね。
だから、それが今の音声入力ソフトなんだね。
で、Appleそんな機能ないから、語触だらけだよ。
えーとかあーとか言ったらさ、えーあーとか入るじゃん。
入る入る。
ある程度ね、Appleのやつはフィラー切ってくれた気もするけど。
入るしなんかさ、電話帳に登録してある人の名前とかがさ、いきなりバーンって出てくるんだけど、肩書き付きでさ。
あ、そうなの?
そうなんか、松田とか言ったらさ、松田括弧捜査第1課、刑務法〜〜みたいなさ、おいおいおいみたいな。
変な連携してるじゃん。
そうそう。
Appleあるあるじゃない?
Appleでもあんまりやったことないよね。
消し方わかんないのよ、それ。
おー。
もう電話帳の名前がバンバンバンバン出てくるのよ、人の名前。
あ、えー。
上田とか松田とか松本とか言っても、もうフルフルでフルネームとそいつの肩書きみたいな。ギョギョしい肩書き。
でも良かれと思ってやってんだよね。
そう。
iPhoneではね。
そうなのよ。
なんか無効にする方法ありそうだけどな、それ。
ありそうだよね。
ありそうだけど、まあなんかやっぱ、そうね。
まあ今日は、あるよ。
そういうもう標準のものじゃなくて、ちゃんとしたツールを使いましょうって。
専門のね。
専門のツールを使っちゃいましょうみたいな。
持ちは持ちはなんだ、そこ。
持ちは持ちはです。
はい。
ただ残念なことにですね、ちゃんと使うと思ったらお金かかるものもあるんで。
あー。
また課金ですよ。
またじゃん。
AIって言ったら課金だからもう。お金払ってください。
払わなくていいやつも。
あるの?
あります。
GPTやってよ、それ。
GPTもあるよ。
あるの?
文字起こし。
だからそもそもウィスパーっていうね。
なんかあるね。
文字起こしのやつはオープンAIが作った。
結構性能いいやつね。
そうそうそうそう。
うんうん。
だしね。
まあそこにウィスパーで文字起こしを爆速でしながら、こういろいろな形でサポートしていくみたいなやつが、
まあだいたい文字起こしっていうか音声入力ソフトの概要なんだけども、
みんなその速度とか使い勝手を気にしながらいろんなソフトを選んでますと。
で、音声入力ソフト。
いろいろあるんだけど代表的なやつ4つあります。
うん。4つもある。
4つ。とりあえずこれを押さえておけばだいたいいいかなっていう感じ。
みんな個人、好みによって使い分けてはいるんだけど、
全部のソフトウェアが一応無料で使える期間っていうのがあるので、
がっつり毎日使おうと思ったら多分課金しなきゃいけないけど、
月でこんだけしか使わないよってだったら無料の範囲でも全然いけるよみたいな感じになってるんで、
みんなその特徴を把握しながら自分に合ったものを使えばいいかなと思いますということで、
ちょっと紹介していきますけども、
まず1つ目ですね。
アミカル。
アミカル。
というツールでございます。
聞いたことないわ。
俺今これをメインで使ってます。
えー。
使ってます。最近使い始めたばっかなんだけど。
これ何かっていうと、
オープンソースの音声入力ソフトなんで、
無料です。
無料いいじゃん。
無料。
無料なんてゴミでしょどうせ。
いいよ。
無料なんだけど、
一個特徴があって、
ローカルで動きます。
おー大好きなやつだ。
めっちゃ早いってこと?だから。
早いです。ただその代わりパソコンのスペックもそれなりに要求してくる。
あ、そうなんだ。
ちょっとしたパソコンみたいなやつじゃ動かないんで。
ちょっとしたパソコンみたいなやつってどういうやつ?
ちょっとしたパソコンみたいなやつ。
結局文字起こしの時に、
LLMで整形するんで、
ローカルLLMみたいなやつを中で動かします。
へー。
が仕組みになってるんで、
あんまりスペックどのくらいの推奨だったか忘れちゃったけど、
少なくとも俺のパソコンはそれなりにハイスペックなので、
MacBook?
いや、MacBookでやってない。
あ、やってないんだ。
デフトトップPCで使ってたしね。
RTX4070の。
あーでかいやつね。
ちょっとでかいやつ。
これはもうただで使いたい方、もういくらでも使えます。オープンソースで。
で、これいいのかな?
いい。すげー。
これでしばらくやってたけど、
よかった。
えー。
使い勝手はそれなりによかったです。
はいはいはい。性能もいい?
性能もいい。
へー。
基本的にはそのなんか、
ショートカットキーを押しながら喋ったら、それが全部バーって入力されますよみたいな。
アンサーも純正のiPhoneの入力が50だとしたら、
基本全部それ上ってことだよね?
上上上。全然上よ。
全然上?
全然上よ。
ちゃんとなんかあーとかえーとかもなくて、文章としてバッと出てくる。
全然変な文章になったりせんの?それ。
なんないね。
へー。
早く教えてよ。
だから結構なんか、わちゃわちゃこう適当に喋っても、
ちゃんと喋ったことを要約して文章にしてくれるなっていう感じがする。
なるほどねなるほどね。
あーこう、あーそういうことねって思った。
音声入力なんかみんなやってるけど、
何がいいんだそんなと思ったけど、
あーやっぱその、ただ喋ったことを文字で入力してくれるんじゃなくて、
ちゃんとAIがなんかいい感じに要約してくれるから、みんなやってんだと思って。
これさ、それで言うと音声ファイルバンってぶち込んでとかもできるの?
それはできるけど、
あーこのツールにできるのかな?
なんかね、文字起こしにも使えるってことだよね要はね。
文字起こしにも使えるんじゃ、文字起こしにも使えるのかな。
いつもね、このポッドキャストの文字起こしをね、
うん。
ジェミニーエアスタジオでやってるんだけども、あれがね、ちょっと時間かかるのよ。
ジェミニーに時間かかる人はなんかさ、
止まるのよ。
こんなこと俺言ってねーんだけどみたいな文字起こしてくるんだけど。
そう、めちゃめちゃ怖いよ。
あれ怖くない?
中身全然フェイクのやつある。
あれ、あれどうしたって感じじゃない?びっくりするんだけどほんとに。
お化け。お化けだよねマジで。
そう、なんか。
結構バーをさ、調整しないとそういうのハルシネーション出やすいみたいなのもなんかね。
あ、そうなんだ。
らしいけど、でも調整しても出るとき出るだよね。
いやなんか全然違う内容になってるなと思って。
怖いよね。
え?俺こんなこと喋ったっけ?と思いながら。
ね、もはや自分の記憶の方を疑うよね。
そうそうそう。
寝不足だしさ。
だから寝不足だからバレないかもしれない、AIもね。
こいつどうせチェックしねえからこのぐらいでいいだろうみたいな。
やっぱりあんま良くないんだ。
だから代替を探しててさ、ローカルLMで動く方が早いだろうしいいなと思って。
アミカルちょっと待ってね、アミカル。
えーと、音声入力。
やっぱり性能はあんま良くないのかな。
さすがにジェミニの方がいいのかな。
文字起こしのさ。
もう単純に文字起こしするんだったらなんか、
バイブコーディングで自分で作った方がいいんじゃないかって思うけど。
あ、マジですか。APIでってこと?
いや、ウィスパーっていうモデルはローカルで動かせるようにダウンロードしてこれるから。
あ、オープンAIの?
うん。
それめちゃくちゃ性能いいやつじゃないの?
ウィスパーはいけるはず、うん。
マジですか。
そういうことでクロードで作ればいいのか。
自分のところで動かせるように。だからMacBook Proとかだったら動くと思うよ、ウィスパー。
マジですか。
なんかこれも自分のパソコンじゃないけど、
なんかGoogleコラボラトリーっていう環境でウィスパーを動かして文字起こししてた気がするもん。
えー、今はどうしてんの?
今はもうジェミニ使ってるとりあえず。
てか文字起こしはそんなにしない。
あ、しないんだ。
うん。
あ、そうですか。
文字起こしするタイミングそんなにないのよ。
ホットキャストぶち込まないんだ。
基本原稿全部書いてるからホットキャスト。
あーそうか。
だから文字が先にあるもんで俺の場合は。
あーすごいなそれ。
さっきも別のプロジェクトでさ、結構俺が1万文字ぐらいの文字をバンバン毎日ぶち込んだりするからさ、情報共有で。
なんかもうそれテキストあんまり読めない人がいて、音声で欲しいって言われて。
でも音声だけじゃ記憶残んないからテキストでも欲しいから、音声で入力して投げたやつを文字起こししてそれを文章にしたやつくれって言われて。
両方。だからもう文字起こししなきゃいけない。
あ、そういうこと?
え、喋ったやつと。
喋ったやつとそれを文字起こししたやつ両方くださいみたいな。
あ、へー。
だからもう文字起こし需要めっちゃあんのよ俺。
そういう感じか。
なんかもうなんならディスコード上だからさ、ボット入れて自動でなんないかなとかちょっと思ったけど。
文字起こし、単純な文字起こしだったら自分でバイブコーディングでローカルでできるように作った方がいいとは思うけど、いいとは思う。
ウィスパーなんとかね、はいはい。
多分それでいいと思うけどな。
ウィスパーってのがLLMも兼ねてんの?
ウィスパーは文字起こしをしてくれるから、その後ちょっと整形するために。
あ、そうか。整形用のLLMは別で。
LLMは動かさなきゃいけないかもしれんな。
ダブルでね。
音声をそのまま文字起こししてくれるツールがウィスパーだね。
はいはいはい。単純に文字起こしするわけね。
そう。
それこそあれか、iPhoneのあれみたいなもんだね。
まあそうだ、それに近いね。
音声入力か。
それを文脈に沿って整形するよみたいな。
こういう音声入力のソフトはどっちかっていうと速さを求めてるから即時性みたいなね。
同時通訳みたいなね。
そうそうそうそう。
やっぱそのいかに早くそこに正確に入力できるかってとこだから、
あんまりカネリンが言う文字起こしの需要にはあってないかもしれないね。
ちょっと機能としてあるかもしれんけど、そこまで調べられてないわ。
うんうんうん。
っていうので1個アミカルというものがあって、これはローカルで動くので。
ローカル最高。
ローカルで動くとやっぱセキュリティ的にもいいよねって話があって。
外に出さない。
そこで完結してるからクラウドに上がんないよねと。
なるほどね。
それなりに精度もいいので、結構ファンが多くて使われている音声入力ソフトになります。
ただ、PCのスペックを要求してくるから、そこがちょっとネックかなって感じ。
そんな音声なんかでそんなにいるんだ。CPUですか?
だからさっき言ったようにLLMを、ローカルLLMを動かしてるから裏で。
CPUが使われる?
そうCPUが使われます。
なるほどね。
GPUも使われる、CPUか。
CPUね。
すごく要求してくるものになっております。
MacBookはもうちょっといいやつ買います。
MacBook Proだったら十分だと思うけどな。
なんかね、メモリが足りないのよ。
メモリいくつ?
18。
おー、18?
18。
ちょっと半端でしょ。
半端。
あ、18なんだ。
18なんです。ちょっと足りないんでね。
足りなそう。プロでしょ?
プロの下の方やね。
あー。
メモリがすごい足りないですね。
それはちょっとあれだね。
そうなの?
買わないと。
この間、Podcast Mixerで現地でやってて、ブチ切れてさ。
何の作業もできんつって。
裏で。
そうそうそうそう。
だからもうその帰り道にポチったから。
早え。
ポチった。もうムカついたから。
仕事にならんわと思って。
いやでもそれはそうね。
いくつ安かったの?
48MBか。
え、今高いんじゃない?
42MBかな。
50万くらいすんじゃない?
50万超えた。
だよね。
もう本当にしょうがない。
もうビデオポッドキャストもバンバン増えるし。
あ、そっか。
授業だもんね。別に趣味でやってるわけじゃないもん。
授業でも趣味でも一緒なんだけどさ。
まあまあまあ。
なんかマシンスペックがーとか思ってなんかさ。
ちょっとお呼び越しになるの嫌だし。
現地行ってさ、すぐその場で作業できないのちょっとしょぼいしさ。
そうね。
ちょっとイラついちゃって。
いやいいと思います。
すいません、もうバリバリフルパワーマシンで。
フルパワーマシンだから重くなるわけじゃないし別に重さがね。
ね、そうなのよ。
そうそうそう。
だったらマシ、ね。
もうエージェントだろうがローカルだろうが何でも来いみたいな感じで。
これもMacBook Pro欲しいな。
今の何?Proじゃないの?
Proじゃないよ。MacBook Airですよ。
普段持ち歩いたあの緑色のノートパソコンは。
渋調だったよね。リアル移動多いし。
家に帰らんとしっかり作業できんっていうのはちょっと嫌だね。
そう。結局家に帰らんと作業できんだったらデスクトップPCが別にあればいいよねっていう話もあるから。
そうね。
そうそうそう。そこでちょっとね今。
だったら出先は軽いやつの方がいいんじゃないかみたいな話もあって。
割と俺がやる、というかインターネットと繋がってればさ、そんなにPCのリソースなくても意外と行けたりするから。
そうか。リモートでね。操作してる。
そうそうそうそう。そっちに任せちゃえばね。
今のところは一応運用してるけど、なんかさ、やっぱガジェット好きだから。
そうね。
Pro、Proですっていうやつをやりたいだけ。
やっぱ今回支障が出たからさ。
ホットキャストミキサーで音声の静音作業めっちゃ時間かかって、その間パソコン使えない柔軟時間みたいなさ。
それ辛いな。
辛くて、これダメだって思ったね。背中押していただきました。
よかったです。
ミキサーさん。
ありがとうございました。
ミキサーに。じゃあAppleからもねちょっとスポンサーと付きいただかないとね。
そうね。
ミキサーのおかげでMacBook Pro1台売れたよってことで。
さらにね、外に出る足が遠のいちゃうからさ。
そうね。
外で作業できねえわとかさ。
メインのPC、話がどんどんそれるけど、全てをMacBook Proでやってんの?家にデスクトップあんだっけ?
全てをね、全てをこの1台にするっていう思想でこれ買ったのよ。
やってんだ。
これ買ったの。
なるほど。
今まで切り替えてたんだけど。帰ったらデスクトップでみたいな。
それやるとこっちにデータがないとかないとか環境が変わるとかっていう問題めんどくさくて。
帰っても出先でもこの1台みたいな風に変えて。
これ2年くらい前に。
でちょっとこれ足りなくなってきて。
で今回ちょっとスーパーマシンにしようと思って。
これじゃあ家にデスクトップないんだ?
一応あるけど使ってない。
なるほどね。
うんうん。
クラウド型音声入力ツール「Aqua Voice」と「Typeless」
じゃあスーパーマシンだったら。
これでちょっとフットワーク軽くなるかなって。
秘部長にさ引きずり出されること多くなりそうだしさ。
そうね。
これ1台あれば安心っていう状態にしたくて。
それ1台さえ持ってればどこでもカネヤンのポッドギャスを作れるよっていう状態で。
そうそうそうそう。
そうなんだよ。なんかね、だからすごい引力があるのよ俺。
スタジオというか自宅というか会社の方にさ。
そうよね。
すっげえ引力があって。
それって多分この母艦に座らないと落ち着かないっていう。
マイクとかレコーダーとかの配信機材もここが一番いいし。
パソコン系もSSDがあっていろいろ拡張でモニターがいっぱいあってっていう風だから。
すっげえこの基地に帰りたいのよ俺はいつも。
それはでも俺もそうよ。
あ、そうなの?
うん。
画面一個で作業してると効率悪いし。
そうなんだよね。
2畳半の狭い部屋。
狭い部屋。
落ち着くなって感じ。
コックピットねコックピット。
コックピットが落ち着くなっていう。
うんうん。
感じではあるんですけど。
それをね理論上は一台で何かどこへでもっていうの憧れるんだけど。
分かる。
でもそれはね結局隣の市は青い現象になってさ。
うん。
一台に主役すると分けてる人羨ましくなるのよ。
分けると一台に主役してる人羨ましくなるのね。
永遠にもう。
一台で完結するに越したことないけどね俺。
でもやっぱり初めて一台にしてみてめちゃめちゃ快適だったよ。
いやそうだけどさ重いじゃん。
まあ重い。
結構。
重いって何?パソコンが重くなるってこと?
いやあの物理的な重さ。
グラムが?
なんかさスタイリッシュにさなんか必要なことだけ
iPad miniとかでパチパチパチってやってる人がスタイリッシュに見えてくるのよ大体一台主役すると。
俺なんでこんなでかいやつパソコンなんか新幹線で開いてんだろうみたいになってくるね。
そうか。
だんだん。
ああいうスタイルもいいなーって。
MacBook一台くらいだったらだいぶスタイリッシュじゃん。
MacBookだったらねまあまあでもMacBook Proってそれなりに重くね?
ちょっとねサイズ14インチで結構まあ重いけど。
厚みと重さがちょっと若干それなりの重量感。
今まででかからよかろうだったから16インチとかあったの絶対。
今回思い切って14インチにしてみたのよ。
14インチのMacBook Pro。
持ち運びいいよやっぱり。
あれもう来た?
ん?
もう来てる?
来てない来てない。
これ今のやつが14インチ。
ああそういうことね。
今までの人生でかからよかろうだったから。
ああそういうことね。
2年前に初めてちょっと思い切ってちっちゃいのにして。
今回も14インチ新しかったの?
今回も14インチですね。
ああ。
初代大きい14インチで。
いいね。
やっぱりでかいと思う。
なんかそれだけで外出たくなくなるし。
うんうん。
重い。
そんな感じですね。
14、15ぐらいが一番いいな。
はい。
ちょっと話がない。
脱線気味で。
脱線気味ですけど。
はいそんな感じで。
今音声文字起こしのソフトウェアを1個紹介したと。
まだまだ1個ね。
アミカルでございます。
ローカル。
他のやつ俺ほとんど使ってないから。
ああそう。
あんまり説明できない。
ぱぱっと流しますけど。
はいよ。
これがね一番定番。
うん。
こちらですね。
アクアボイス。
アクアボイス。
アクアボイス。
これはもうどこのAI系発信者、AI系のYouTuberみんな言ってるアクアボイスと。
へえ。
これはさっきとは打って変わって、クラウドです。
インターネットと繋がってないと文字起こしできませんよと。
はいはいはい。
いうやつなんですけど。
日本語の精度が非常にいいらしくて。
日本語がね。
なんかいろんなメディアでもうやっぱアクアボイスだよねと。
うんうん。
いう風に言われてますと。
そうなんだ。
あとはねレイテンシーって言って喋り終わってから文字が出るまでの速さがめっちゃ速いと。
へえ。
クラウドなのに。
クラウドなのに。
相当な速度が出てるので。
うん。
やっぱいいよねと。
うん。
あとはカスタム辞書って言ってさっき言ったよりさその動音以後変換したりとか自分がよく使う辞書みたいなやつを。
うん。
自分で登録しておけるから。
うんうん。
それでいろいろこう時間パパーンとできたりとかして非常にいいと。
はいはい。
弱点としてはやっぱ完全クラウド処理なんだよねこいつは。
うん完全。
なので機密情報とか喋っちゃうとそっちに一旦上がっちゃいますよみたいな。
なるほどね。
うっかり入っちゃいそうだよね。
そうそこが気になってる人とかはちょっとつらいかなっていうのとあとこれはもう月間サブスクなので。
サブスクなんだ今ダウンロードボタン押しかけたよ。
えっとね月が多分10ドルぐらい。
あーまあまあ1500円。
そんなに大きくはないんだけど。
試してみてもいいかもね。
お試し期間はあるしその一定の期間だったら無料で月々使えるはずだから。
うんうん。
まあこれも別にお試しするのはいいと思うし一番定番だねアクアボイス。
なるほど。
はいっていうのが一個ともう一個紹介するとタイプレスというのがあります。
タイプレス。
タイプレス。
これもえーとねなんかこの。
聞いたことあるこれ入れたかもこの間。
これはねアクアボイスを超えたというふうに日本でレビューされていた。
されているような結構新しい。
イベントでね会った人がやってたんじゃないかなこれ。
タイプレス?
うんあのAIラボのAGIラボの。
あーそうか。
なんか聞いたことあるわこれ。
これもね定番ですはい。
でまあほとんどアクアボイスと多分変わりはしないんだけど好みの問題。
スマホ。
あこれ違うのなんかyoutubeで誰か使ってて入れてみたんだ。
あ入ってる?
うん入ってるけど鬱陶しくて消した。
何で鬱陶しくて。
なんかキーボードジャックしてくるからなんか鬱陶しくてさ。
あそうキーボードジャックして。
あとねこいつはこれもクラウドで処理してるんだけど。
うんうんうん。
一応その学習には絶対使わないよっていう風にちゃんとプライバシーポリシーに明記されてますよと。
なるほどね。
なのでまあ一個ちょっとアクアボイスよりセキュリティが高そうだぞという風には言われていると。
プライバシーポリシー。
あとスマホがちょっと強いらしくてこれ。
あー強いんだ。
Mac、Windows、iOS、Android全てのプラットフォームに対応しているという点が他のものと違うと。
あ他パソコンばっかなんだ。
そう特にスマホアプリの出来栄えは群を抜いていて使い勝手が非常に良いと。
なるほどね。
ただやっぱちょっとレイティシーはアクアボイスには劣ると。
ちょっと遅いってことね。
ちょっと遅い。
あと若干高い。
ほう。
えーとねこれ年払いを要求してくるタイプのやつで。
うわー。
年払いだったら月額10ドルだけど月払いだったら月額30ドル取るぜという。
高っ。
3倍いくの?
そう3倍いく。
あー小気やなー。
結構小気なことやってるねこれね。
腹立つねなんか。
そう。
でも一応無料でも使える枠があるので。
中国系でしょこれ。
タイプレス中国だったからちょっと国見てなかった全部。
ちょっとこのウェブサイトから漂う。
チャイナ州がある。
チャイナ州。
適当なこと言っとるけど。
どこだ国。
会社マニフェスト。
うわ。
チャイナっぽいなこの薄っぺらい。
アメリカでした。
薄っぺらい感じ。
アメリカです。
アメリカ。
すいませんでした。
はい。
全然テイスティングできてないですね。
ごめんなさいアメリカさん。
テイスティングできてない。
テイスティングできてません。
すいません。
音声入力テイストはそぶりはできないかもしれんね。
あれでもこれあれよ。
CEO創設者CEOは。
うん。
中国の人じゃないの。
これシリコンバレーから生まれたベンチャー企業みたいなところだよね。
そういうことね。
分かりました。
はい。
っていう感じでタイプレスというものがありますよと。
最後。
買い切り可能な「Super Whisper」と主要ツールの比較
こちらですね。
スーパーウィスパー。
スーパーウィスパー。
スーパーウィスパー。
ウィスパー。
ウィスパーですね。
ウィスパー。
さっき言ったのと一緒です。
オープンAIの持ち起こしの。
ウィスパー。
のスーパーウィスパーって。別にオープンAIが出してるわけではないけど。
ちょっと名前をかぶらせてるな。
これは非常に評価が高いです。
特徴はローカル処理もあればクラウド処理もあると。
選べる。
ローカルで完全に使い切ることもできるし、
クラウドを使うこともできるっていう。
結構シームレスというか。
選べるの?
選べる感じらしい。
もう一個珍しいのが買い切りできる。
珍しいね。
サブスクだと8ドルなんだけど月。
買い切りで使おうと思ったら250ドルで買い切ります。
250ドルちょっと高いね。
ちょっと高い。
そんな2年後とかもうアンタはやっとるんでしょっていうね。
どこまであるかわかんないけど。
サブスク嫌いに対してはちょっと嬉しいかなって感じかな。
サブスク嫌いだけど2年半分ぐらい一気に払わされるわけでしょ。
そうそうそう。
いらねーよな。絶対その時ゴミになってる。
どうなってるかな。
AIサービスで買い切りって珍しいね。
珍しい。
高いよね。1年契約でもみんな嫌がるのに。
ちょっと使ってみてもうこれでいいやってなったらもう買い切りボーンでいけちゃうっちゃいけちゃうけどね。
なるほどね。
っていうこの4つのソフトウェアがありますと。
どれを使えばいいですか?
俺はアミカルを使っているけど。
性能的にはどうなのよこれ。
グラドの方が良さそうだよね。
なんかね、スーパーウィスパーが見た感じ良さそうな感じがする俺は。
性能?
性能。
Macを使ってるのであれば。
Apple Siliconの前提とした最適化されてるっぽい。
ソフトがね。
そうなんだ。
だからスーパーウィスパーがいいんじゃないかなとは思うけど。
定番はAqua Voice。
えっとなんだっけそれ。最初のやつか。
最初はアミカル。
早いやつね。
クラウドで早いやつ。
Aqua Voiceいいんじゃないかな。
Aqua Voiceよりスーパーウィスパーがいいと思ったのは。
文字起こし精度。
早いらしい。
何よりも早いと。
あとローカルを選択できるのもいいよなと思って。
あと俺的には買い切りがあるっていうのをちょっと惹かれたぐらいかな。
そうなんだ。
ただ俺はアミカルを入れてオープンソーセス使ってるから。
それはそれでも十分。
使った感じ十分だったから。
これでも基本的にはクラウドの方が性能高そうだよね。
クラウドの方が高いだろうね。
多分。
Aqua Voiceの精度はやっぱりずば抜けているという評価が多いです。
Aqua Voiceですか。
最初のやつか。
無料版もちょっと入れられてなくて。
基本的にアミカルで音声文字起こし。
音声入力どんな感じなんだろうっていうのをずっと試してた感じだけど。
調べてみるとこの4つがすごく名前として上がってくるので。
これスマホ対応してるのはあれだけだよね。タイプレスだけ。
タイプレス。最近Aqua Voiceもスマホ対応は出たとか出ないとかって話がどっかにあった気がするな。
音声入力におすすめのガジェット
そうっすか。大事だよなでも。スマホで使いたいよね多分ね。
スマホでフリック入力一番嫌だからね。
遅いんだよな。キーボードより。
スマホで入力したいタイミングって割と外にいるからさ。
あとマイクもないから。
俺はあんまスマホで入力できなくてもまあまあ困らないかなって感じはした。
マイクって何あんの?付いてるじゃんスマホに。
スマホには付いてるけどさ。
面倒くさくない?画面見れないじゃん。
だってこうやってやるじゃん。
そんな近づけんでも認識するでしょ。
これでいける?
いけるでしょ。
いけるのかな?
いけるでしょ。
使い比べてみたいねこれもね。
使い比べまでいけたらよかったんだけど。
これも案件じゃないですか。
案件はあると思うよ。Aqua Voiceとか結構。
同時にやりたいよね。
本当は今日使い比べてきましたってやりたかったんだけど全然巻いてなかったんで。
これぜひコミュニティで皆さん使い比べてください。
そうね。困ったらコミュニティ全部。
そういうのは快適だよね。
そうね。
これもリンクは全部貼っておきますんで。
基本的にはアミカル以外は、アミカルはもちろん最初からオープンで無料なんですけど、
全て無料枠があるんで、試すことができますんで。
皆さん試してみてください。
無料枠でね。
ちょっと前から話ししらっとしたんですけど、
入力ってやっぱりガジェットも大事だよね。
入力ガジェットも大事なんですよね。
パソコンで音声入力するときに、みんなどのマイクで入力してるんだみたいな。
本体マイクでしょもうそれはね。本体マイクですよ。
いやいやいや本体マイクじゃん。
いちいちこんなポッドキャストのマイク引っ張り出してやってんの?
違う違う違う違う。
なになに?
ちゃんとそのさ、Bluetoothのさ、首元に付けるマイクあるんですよ。
DJIみたいな。
音声入力って結局ボソボソやりたいのよねみんな。
あ、そうねそうねそうね。
その時にどういうデバイスが使えるかなっていう話。
大事だね。
大事。
でね、ちょっと最近話題になってたっていうか、めっちゃ定番のやつがあって。
俺もこれはもともと使ってたんだけど、
あのね、ショックスのオープンコム2ってやつね。
骨電動タイプの。
あーはいはいはい。
オープンイヤー型の。
はいはいはいはい。
これは俺もう2年ぐらい使ってるけど、Zoomのミーティングとかで。
うんうん。
めちゃくちゃいいです。
いいんですかこれ。
いい。めっちゃいい。
マジ?
音楽聴くとか無理よ。
うん。
なんだけど、そのウェブミーティングとかすげー使いやすいから。
えー。
これが結局、もともとウェブミーティング用に俺は買ってずっと会社とかで使ってたんだけど、
音声入力のデバイスとしてめっちゃ評価が高いです。
あ、そう?
うん。
なんで?
まず、ずっとつけてられると。
あ、そうか。耳ふさがないから。
耳ふさがないから、別につけっぱなしでもいいと。
で、マイクの性能もいいし、マイクも口元に出てくるから、
うんうんうん。
すげーボソボソ喋っても入力してくれるよね。
なるほどね。ボソボソ拾ってくれるんだ。
うん。
だからそのね、周りの音も聞こえるし、自分の入力もできるしっていうので。
まあ問題点はちょっと高いっていうことぐらい。
22,800円。
うん。ちょい高い。
なるほどね。おすすめですか。
でも2年使っててね、全然いいし。
Bluetoothでスタイリッシュにできるし。
じゃあこれ、リンク貼っときますよ。
はい。これリンク貼っといてください。
で、もう一つ最近話題になってたので紹介すると、
DJIのマイクミニ2。
2?
2。
なぜ3じゃないんですか?
いやいや、DJIのマイク3じゃなくて、
マイクミニ2っていうのが最近出たのよ。
ミニ2最近出た?
ミニ2最近出た。
めっちゃちっちゃいってこと?
もともとミニがあったんだけど。
ちっこいね。
ミニ2はね、安いの。
なんかおもちゃみたい。
そう。7000円ぐらいで。
安っ。
安いね。
おもちゃじゃん。
レシーバーとセットで買えるのよ。
こんな安い値段で出てきちゃった。
でも言っても安くてもDJIだから。
でも形は、大きさはもうマイク3じゃん。
マイク3と同じぐらい。
私が使っているやつ。
そうそうそうそう。
でも値段は全然安いよね。
だから音質は多分全然期待できないんだけど、
だからPodcastの収録とかで使おうと思ったら、
若干きつい部分はあるんじゃないかなと思うんだけど、
それでもこれが意外とレシーバーついてるから、
そのままパソコンにつけちゃって、
音声入力ガジェットとして優秀だよみたいな話があった。
なるほどね。
これを首元にマイクつけておいて、
ボソボソ喋ればパソコンに入力できますよ。
しかも安いから1万円以下で。
安いな。
マイク2つついたら使えるから。
すごいねこれ。
違う用途でも使えるし、
結構そのSHOXって言ったらもう完全にウェブイヤホンとして、
ウェブミーティングのイヤホンとして使うけど、
これ多分音声収録したいよねみたいな時に合わせても使えるから、
音声入力用のガジェット兼違う用途でも抱き合わせで使えるし、
いいんじゃないかなっていうので。
カラーバリエーションも無駄にあるし。
見てるけどさ、
マイク3との性能差そんなにめちゃくちゃ大きいような、
スペック差はあんま感じないよね。
32ビットフロートじゃない24ビットとかさ、
まあ十分じゃんね。
そうね、本当にあれよ、
先月出たぐらいよ。
一瞬買いそうになったもん。危なかった。
買っちゃうよね、こんな安いの。
こんな安かったら買っちゃうね。
でも買っちゃおうかなと思ったけど、
マジでいらないってことに気がついて、
使い道がねえと思って。
持ってくから、普通にDJのマイクね。
マイクね、それでいいよと。
これで良くないみたいな感じになって、危なかった。
危ないね、それね。
あと2手で買うぐらいだった、本当に。
もうちょっと差を分かるように買ってくれないとさ、
マイク3が売れなくなるよね。
そうね。
どんどんで出してくんね、なんかこのちっこいマイクね。
いや、DJはね、やっぱすごいよ。
ドローンもDJだしね。
DJの、あれ言ったっけ?
オスモポケットね。
オスモポケット4の話だよね。
見たよ、検索して。8万ぐらいのがあったわ。
そうそうそうそう。
ポチリスとなってやめた。
まだリアルで収録することはそうないと。
でもビデオポッドキャスト作ってくださいとかさ。
ビデオポッドキャストで金井さんやりましょうみたいな。
リモートでやりましょうって。
家から出ない。
リモート極めたいよね。
リモートね、確かに。
リモートの良さあるからな。
リモートってさ、相手の環境に依存するじゃん。
そうね、音質とかね。
ポッドキャストやってる人だったら相手がいいけどさ、
ちょっと音声収録とかわかんないんですよみたいな人と相手だとめっちゃ困るじゃん。
それはそう。そういう人とはリアルしかないね。
そう、そういう人はリアルしかないなって思うよね。
はい、ということで入力ガジェットもありますと。
はいよ。
音声入力の落とし穴と適切な活用法
だから音声入力バチバチやっていきましょうという話をしたいわけじゃないんですよ。
違うの?
そう、音声入力いいんだけど。
何も。
ちょっと音声入力。
早くやりたいよ、俺。
課題評価されすぎなんじゃないかせず俺は唱えたい。
あ、そっち?
そっち。
今もうポチる寸前だったよな、アクアタイムズみたいなやつ。
いや、それポチってもいいと思う。
ポチってもいいんだけど。
うん。
なんかね、落ち着きAI的な話をしたくて。
はいはい。
言うんですよ、みんな。
人が話す速度っていうのは1分間で300文字ですよと。
タイピングっていうのはだいたい平均で1分間で150から200文字だから。
おお、倍ぐらいいくの?
だいたい1.5倍か2倍ぐらいのスピード、アウトプットのスピードが違うんですと。
喋る方が早いってことね?
喋る方が全然早いと。
ああ、なるほど。
だから喋ってアウトプットした方が2倍のアウトプットが出ますよと。
いいねいいねいいね。
っていう話があるんだが。
好きそうだね、なんか。
みんなそんな話をするんだよ、音声入力するときに。
はいはい。
これをちゃんと調べるとですね、その前提条件なんなんみたいな。
考えたことありますか?と。みんな音声入力を押す人はさ。
いやいや、もう倍違うからと。
そうね。
言うんだけど、じゃあどういうシチュエーションで試して倍違ったかっていうのを語らないね、みんなね。
シチュエーション?
シチュエーション。どういう実験の状態で倍違うんですかと。
研究者っぽいちょっと。
これですね、あのね、画面に出てくる短いフレーズをアワって打ちますみたいな。
はいはい、すしだみたいなやつだ。
すしだみたいな。すしだよりはさすがに長いかもしれないけど。
ああいうので勝負したときに倍早いよと。
うん、なるほど。そういうことなんだ。
うん。
小説読んだみたいなことじゃないんだ。
小説読んだに近い、でも。
短いフレーズ。
だから書き写しただけだよね。だから目の前に出てきた文字をもう一回打ってって言ったときに音声入力で、
てかそれを打つか、しゃべって読むかでどっちが早いかって話だよね。
なるほどね。
それはしゃべってた方が早いに決まってんじゃないかな。
うん。そりゃそうだ。
そりゃそうじゃと。
でもってことは別に全部早いんじゃないの?しゃべった方が。
と思うでしょ?
違うんですよ。
違うんですか?
それは確かにそうなんだけど、それって書き写しだけのタスクですよねと。
うんうん。
しゃべるって、
うん。
疲れるんですよ。
おー、なるほど。
ていうのは、
打つのも疲れるよ。
いや、それがですね、脳ですね。脳脳。どういうワーキングメモリーを脳の中で使ってるかって話。
うんうん。脳の中ね。
そう。だから結局話すっていう行為って指を動かして文字を打つよりも、いっぱい脳のリソース使うのよ。
これを発話しようって言って、こういう口でこういうのでって動かすとかいっぱいあるから。
なるほど。
脳のリソースを意外と使ってると。
うん。決断疲れだ。
そう。いろいろだから、じゃあ考えながら口でアウトプットしようとした時って、内容について考えようとするリソースを口を動かして発話しようとするリソースを食っちゃうわけ。
実はそのワーキングメモリーの取り合いが起きてますよという話がありますと。
はいはいはいはい。
だから音声入力の方が実は考えるタスクでは疲れる。
うんうん。
し、長いものはなかなか結構アウトプットしにくいという結果があるらしいです。
なるほどね。
はい。でやっぱ。
疲れるんだ。
このね、アウトプットしている時に自分が今までアウトプットした内容をバーって見えるのと、言葉で喋ろうとしたらリアルタイムでザーって出てくるわけじゃないからさ。
うん。
その長文喋った時に自分が喋った内容を最初から目に見えてないのね。
うん。
っていうところで喋った内容を記録しておかなきゃいけないっていう負荷もあるから。
うん。
意外とアイデア出す時って、書いた方がアイデア出るのが多かったりする。
あ、そう喋るより。
喋るより。
喋るとやっぱ喋ったこととか、そこまで喋ってきたことを覚えておくっていうところにもやっぱ脳のリソースが使われると。
記憶しようと。
そう。
そうですか。
アンチ音声入力だ。
そうです。だからその音声入力、キーボードを捨てちゃダメってことね。
捨てるなと。
捨てるな、そう。
だからその音声入力こそが、もうなんか全てだみたいな。
そのなんかタイピングとの比較だけで。
うん。
速度を比較。
音声入力の方が優れてるっていうのは、少し想定な感じは調べてみて、わかったんだけど体験的にそういう感じがしたのよ。
口で、慣れてないっていうのもあるんだけど、口でこうやりながらいろいろ作ってるときに、やっぱ何か喋ろうとか口でまとめようと思ったときにさ、ちょっと脳のリソース負荷がかかるなっていう感じがあって。
なるほどね。
なんかちょっとやりにくいなと。
ただ、それもAIがうまく要約してくれるんだったら、もうとにかく喋っちゃえみたいな。
っていうやり方もあるから。
思ったことを全部ね、喋ってね。
そうそう。そこはツールに助けてもらいながら、結構やっぱいいアンバイナーになってると思うんだけど、
だからその音声入力こそ神みたいな感じではなくて、実はよしよしちゃんとあるから、それぞれ残ってるよって感じ。
音声入力はやっぱあんまり長いスパンで考えなくてもいいようなタスクとか入力にだいぶいい感じ、使える感じ。
そのまま限りの。
それこそ、バイブコーディング用の入力とかAIに指示するとき、これやってこれやってみたいな。
これこうなっちゃってるからこういう風にしてほしいし、これこうなっちゃってるからこういう風にしてほしいよみたいな。
AIのアウトプットに対して指示してバイブコーディングを走らせるときは別に打たなくても、それをそのまま見たまま口で言えばいいから。
すごくそういうAIに指示を出すバイブコーディングでは音声入力すごく使えると。
てかなんかこう彼らがやろうとしてる本を書くみたいなのって。
ちょっとなんか向かなさそうな話だね。
あと音声でやろうとすると、実は逆に使えるかもしれない。
ていうことでございます。
なるほど、もう発砲したがりだ。
いや、塞がってないよ全然。全然塞がってないよ。
塞がってないよ。もう手書きで書こうかな。
最初のアウトラインは手書きでもいいと思うよ。
そうだね。
白紙に手書きっていうのはその枠がないからいろんな発想が出てくるよねってある。
それはすごくいいと思います。
はい、なるほど。
なんでちょっとその音声入力こそ神だっていう感じではないけど、やっぱよしよしあるよっていう話でございます。
なるほどね。
でも俺もちょっとねバイブコーディングの時は確かにこれ音声入力めっちゃいいなと思ったから。
うーん。
打たずにね。
そう。
それはあのローカルのやつで使ったってこと?
使った。クラウドコードに入力してやるとやっぱ早いよね。
うん、それのローカルのやつアプリの中で書いてコピーして打つってこと?
違うよ。
え?
別にクラウドコードに
そのまま喋ればいいの?
そのまま喋ればいい。
いいじゃんそれ。
だから音声入力ってそういうもので、今カーソルがあるとこに文字が入るからそのまま。
うん、いいじゃんそれ。
ショートカットキーだけ設定しておいてこのキーを押しているときは入力モードになるから
マイクについて喋ってあげれば今打とうとしているそのカーソルがアクティブになっているとこにバッと文字が入ると。
いいじゃない。
それがあれだよ。基本的にはもう全部そう。音声入力ソフトは。
それローカルで無料のやついいね。
そう、ローカルで無料のやつでもそうそう。
まあ全部そうなんだけど。
入れない手はない?
ローカルで無料のやつそれでできるからいいと思います。
絶対入れた方がいいじゃん。
そうそうそう、いいよ。だからこれは確かに手が動かせないときとか流れでバイブコーディングしようと思ったときは
結構そうやってちょっとAI作業終わったなと思ったらボタン押してバーって喋って。
それこそワイヤレスマイクつけて喋って指示出すみたいな。
いいっすね。
これはあり。なぜAI界隈で流行ってるかよくわかったわ。
バイブコーディング用なんだ。
そう、それとタスクとの相性がめちゃくちゃいいと思う。
だからこのアイデア出しとかブログの作成にまで使うと結構実は脳が疲れる可能性がある。
なるほどな。文章を構成するみたいなことには喋りながら向かないんだ。
そう、あと一個やってみて懸念があったのはパワハラを口で言うと性格が悪くなるかもしれない。
あらボケ滑走みたいな。
強い口調を日常的に口から出してると普段のコミュニケーションでも口が慣れて言っちゃう可能性があるなって思った。
言わないでください。
でもさ、言うじゃん。
だってAIに言わない方がいいんでしょ?
言わない方がいいよ。
我慢しないと。
でもほら、最近クロードコードアホになってさ、なんか微妙な時あるのよ。性能が落ちて。
今度それちょっと録音しといてよ。
俺が指示出してる感じ?
そうそうそう。こんな感じですみたいな。
いいよ。
ちょっとそれをお披露目したい。
でも録音してるってなったら優しいこともなっちゃうかもしれないし。
ダメだねそれ。猫被って。
猫被るか、逆に不自然になるよね。面白くしてやろうと思ってわざとパワハラするみたいなのが一番寒いじゃん。
そうだね。
だからカネリンがなんか密かに盗撮してるみたいなやつじゃないとやっぱ自然体は出ないよそこではな。
そうか。
人目を気にするタイプなんだって。
そう。見栄え、人目をね。いいカッコしいだから。
ひょうひょうと言ってそうだよね多分。
ナチュラルにね。
表情変えずに。
表情変えずにすごいきついこと言ってるかもしれない。
やば。こわ。
こわ、みたいな。
それあれだよね。でも旗から見たらめっちゃ怖いよね。
めっちゃ怖いよ。
音声入力でAIにパワハラしてる人がさ、カフェとかにいたらさ、死ねポケカスみたいなこと言ってる。
死ねポケカスはやばい。
死ねポケカスはやばいよ。
やばい。
何やってんのって。そのままで言ってないやんみたいな。
せっかく寝不足だからかなって思っちゃう。
らしいよ。寝不足だとやっぱねなんか精神がその安定せずに攻撃的になるらしいからね。
じゃあ寝不足のせいだね。
あと極端に疲れてると下ネタしか考えられなくなるらしいよ。
そうなの?そんなことあるの?
下ネタをすごく言う人はすごく疲れてる可能性があるってSNSで書いてあった。
支部長そのせい。
でも今回下ネタ言ってないから。
そうか。
一切言ってません。
そうだね。パワハラか下ネタどっちかだね。
パワハラで下ネタ。合体させたらセクハラとかになるのかな。
一番ね。
AIにセクハラしまくる。
AIにセクハラヤバいね。AIにセクハラもう人間の終わり感あるよな。
だって近いんじゃない?AIにセクハラする日も支部長。
だってエージェントなんか女の子にしてエッチなことやらしてるでしょ。
まあそうだね。でもそれはハラスメントじゃないから。
いいパンツだねみたいなこと言っちゃうんじゃない今度。
向こうも良かれと思ってやってるからそれは。ハラスメントにはならないよね。
良かれと思ってやってるから。
おじさんじゃんそれ。
こんなケツしてるこいつが悪いんだみたいな。
いいケツしてるしアンザン型だなとかってな。
最悪な。
AIで破産してもらって。
昭和のセクハラおじさんでございますね。
ひどいな。職場でポロッと行っちゃってください。
一瞬でクビだからね。危ないよね本当にね。
AIにそういうさ。一瞬でクビよ。セクハラなんて一番クビだから。
怖い怖い。AIでお楽しみください。
音声入力の時はAIにパンハラしない方がやっぱ自己率低くなるので。
優しくしましょうと。逆に音声入力にしたらAIに優しくなれる可能性もあるよね。
あるね。性格が良くなるかも。
エンディングとコミュニティのお知らせ
ちょっと今後音声入力をもっと積極的に。
今日紹介した3つね。ちょっと俺も使おうかな。あ4つか。
1個は使ってるんでね。残りの3つも。
なるべく課金しない方向で。お金が最近すごい出費してるから。
ちゃんとマネタイズしてってもらって。
ローカル使います。
ローカルを使いましょう。
っていうところですかね。今日の話は。
音声入力皆さん是非とも試してみてくださいという。
AI会話で今流行っております。今というかずっと流行っておりますから。
アクアボイス。本当によく聞くのはアクアボイスだよね。
だいたいどのライバル番組じゃないけど。
AI系の番組見てもみんなオススメしてるね。
でも全部吸い取られちゃうんでしょ。
そうだね。
それはちょっとね。
吸い取られちゃうのがどう思うかって感じだね。
ちょっと嫌だね。
はい。こんな感じでございます。
今日はここまでですね。
1時間いいね。
いいじゃん。いい時間帯でございますね。
というわけで今回は深掘り回ということで。
1つのテーマについてじっくり深掘って解説しましたけども。
火曜日は速報回ということで1週間のテーマをゆるくお伝えしている回もやっております。
週2の不審でやっておりますので。
是非ともそちらも聞いてみてください。
番組方式ハッシュタグはシャープ落ち着きAIひらがなで落ち着きアルファベットでAIです。
番組の感想はXなどSNSでハッシュタグ付きで書き込んでください。
今回の話良かったな落ち着いたなという人は星5レビューアップルスポティファイつけてくださいお願いします。
よろしくお願いします。フォローもよろしくお願いしますね。
お願いします。そして落ち着きAIコミュニティ大盛況順次毎回毎回登録者増えておりますので。
ありがとうございます。
月額980円。
早くねもうちょっといろんなことをいろんな仕掛けをしていきましょう。
そうそうそうそう本当になんかいろいろ逆に提案してもらいたいなっていう感じで。
こんなんやりましょうよみたいな。
ね。
支部長を召喚できますんで。
ね。支部長を召喚できますんで。ちょっとね俺も積極的に参加していきます。
ちょっとコースが。
コースねみんなリスナーさんねコースね奪ってかないとね。
そう。
支部長さんどんどんどんどんね。
新しいこと入れちゃうから。
いろんなとこでコースで取られるだけなんでね。
そう暇になってくるのでね。開いたら入れるんでね。
開く前に付き上げないとダメです。
開く前に付き上げないとダメです。
お願いします。
はい。お願いします。
それではまた一週間。
落ち着いて過ごしていきましょう。
さよなら。
おーもう一時間だよ。
オフエアートーク:多忙な日々
いい感じやない?
いい感じだね今日はね。
短縮できてきた。
短縮できてきました。
もう12時半ですけど。
あー。
やばかった今日。なんかね。
やばかった眠かった?
眠そうになった。
眠りそうになった。
危ない。
危ない危ないちょっと。
危ないね。
睡魔がすごい。途中なんか何喋ってるかわからなかったわ。
ちょっと一回寝てもらって。
今にね。もうあれだよね。どんどん忙しくなってくるとさ。
収録中になんか寝る回が出てくるかもしれない。
やばいやばい。ちょっとまたセミナー会始まるよこれ。
いやーそうよ。
セミナー会。
どうしようあれ。
これ企画倒されるこれ。
いやーねちょっとね。
先生なんとかしましょうよ。
じゃあなんとかしたいんだけど。
全く6月まで隙間がなくて。
どうしようか今迷ってる。
どうしちゃったの先生。そんな。
いやーやっぱゴテゴテというかやっぱあれだね。
引っ越し思ったよりも。
きつかったわ。
工数がかかるのと。
うん。
結局愛知と東京の行き来にめっちゃ時間取られるんだよな。
あー。
通勤時間だねまた。
通勤以上だよね。だって普通に。
なんか州の真ん中で帰ったりするからさ。
そんな時に帰るの?
また愛知も行ってみたいな。
結局時間取られるんだよな。
ちょっとねーそう。
なんとか設計します。
頑張ろう。
頑張ろう。
お願いします。
はーい。
01:01:07

コメント

スクロール