2025-05-12 42:02

850😳Grok…思い出したのか!?X版にも長期記憶!だがしかし…ポンコツ?w メモリ機能レビュー。 続・リアルタイム文章整形「Aqua Voice」音声入力がやばすぎるw

動画版はSpotifyで「聴くまとめ」を検索!
※リンクはアフィリエイト広告を含みます


✅️Grok X版にも長期記憶、メモリ機能レビュー
https://x.com/Koukichi_T/status/1920983172407246872
・トピック:AI Grokのメモリ機能
・過去の問題点:長文スレッドでのGrokのフリーズ
・X版Grokでもメモリ機能が有効化
・過去のGrok活用例:YouTubeショート分析
・再度、Grokの長文フリーズ問題について
・NotebookLMでのフリーズしたGrokスレッド要約
・新メモリ機能の問題点:「ポンコツ」な挙動
・関係ない過去の会話・指示を誤って結びつける
・メモリ機能の「暴走」
・メモリ機能に関する新しいUI「参照されたチャット」


X Grokのプライバシー設定。会話履歴の保存設定
・会話履歴の保存オプションがメモリ機能の核か


✅️Aqua Voice 音声入力の何がやばいのか?
https://bit.ly/4jKHd8E
・AI音声入力ツール「Aqua Voice」紹介
・Aqua Voiceのシステムレベル統合(全アプリ対応)
・主要機能:フィラーワード自動削除
・カスタムコマンド(翻訳モード、句読点など)
・英語固有名詞の高精度認識
・辞書機能、カスタム指示
#聴くまとめ #AI #Grok #AquaVoice#ライフハック #クリエイター #ポッドキャスト #効率化 #時短 #音声入力 #おすすめ


--


✅️YouTube収録/ポッドキャスト/ライブ配信関連機材
🎙️今回の収録機材
マイク:Fifine AM8
Amazon ⁠https://www.amazon.co.jp/dp/B0BVVX5FBD?tag=kt_podcast-22
楽天 ⁠https://a.r10.to/hPmhN6
AliExpress ⁠https://s.click.aliexpress.com/e/_o2c0PgZ

📷️WEBカメラ:Insta360 Link
https://www.amazon.co.jp/shop/kt.pics/list/KUI7D4JMYJF6?ref_=aip_sf_list_spv_ons_mixed_d
📎まとめ:YouTube収録/ポッドキャスト/ライブ配信関連機材
https://www.amazon.co.jp/shop/kt.pics/list/KUI7D4JMYJF6

✅️使用アプリなど
音声編集:Adobe Audition
https://prf.hn/l/eOz1Vdo/
動画編集:Adobe Premiere Pro
https://prf.hn/l/0eQV8V1/
全部入りCreative Cloud
https://prf.hn/l/G9Ja5D5/

--


✅️買ったやつ。ガジェット関連おすすめなどまとめ
Amazonマイストア
⁠⁠⁠https://www.amazon.co.jp/shop/kt.pics⁠⁠⁠
Amazonの新機能です。楽天ルームみたいなかんじのやつ。
カテゴリ分けして載せてるので、気になるものあればコメントなどもらえたらポッドキャスト内で紹介します

--


✅️関連SNS
ブログ
⁠⁠https://koukichi-t.com/⁠⁠
Twitter(X)ポッドキャスト用
https://x.com/kiku_matome
Twitter(X)中の人
https://x.com/Koukichi_T

✅️YouTube
ガジェット本音レビューチャンネル
https://www.youtube.com/channel/UCZzl7IurT1V8-HPrF0S07GQ
SNS関連情報チャンネル
https://www.youtube.com/channel/UCkDwn4gZY8VYHAxCkHynTWw

--


この番組はkoukichi_tが、SNS、エンタメ、ガジェットの話題を余談だらけで紹介していくポッドキャスト、まとまらなくてもまとめ「聞くまとめ」です。倍速再生、ながら聞きで情報収集に活用してください⁠⁠
※アフィリエイト広告リンク含みます⁠
以下でも聞けます!「聴くまとめ」で検索!
Apple Podcast/Amazon/YouTube/Spotify

サマリー

ポッドキャストでは、Grokのメモリ機能が実装されたことと、それによる使い勝手の変化について語られています。特に長期記憶が有効になり、過去の会話を思い出す感覚が再現され、ポンコツさと優秀さのバランスについて考察されています。このエピソードでは、AIの長期記憶機能がどのように機能するかを探る中で、ポンコツな部分も明らかになります。過去のやりとりを参照できる利便性がある一方で、無関係な情報を繰り返す問題も指摘されています。最終的には、長期記憶の精度やAIの応答に対する不安も浮かび上がります。 さらに、このエピソードでは、Grokの記憶機能についてのレビューが行われており、長期記憶の実装やその使い勝手について考察されています。また、Aqua Voiceの音声入力機能も取り上げられ、その効果や問題点が議論されています。音声入力技術の進化と、特にAqua Voiceという音声入力アプリの機能について詳しく解説されています。英語の固有名詞に対する精度やカスタム指示機能が効果的である点が強調されており、リアルタイム文章整形の新しい可能性について考察されています。このエピソードでは、音声入力技術の進化と、そのリアルタイム処理能力についても議論されています。

Grokのメモリ機能の進化
こんばんは。 2025年5月12日、朝3時頃の収録です。
今回はAIGrokについての話題となります。
以前Grokをめちゃくちゃ使い倒してるみたいな話しました。
なんかめちゃくちゃ有効活用、いろんなことしてるとかっていうよりは、日々の日常的な相談相手として、
もう収録時中本当に1日のうち7割ぐらいずっと話しかけてるんじゃないか、ぐらいな感じで使っていた時期がありました。
そこから、いろんな各AIのサービスって、進化が激しいので別のもの触ったりとか、いろんなことがある中、Grokをちょっと使わない時期がありました。
その時に問題だったのが、1つのスレッドでめちゃくちゃ長くやり取りをしていると、
これ後で調べてみたら、多分38万文字分ぐらい、Grokが返してくる文章量も含めて、俺が聞いた文章量も含めて38万文字ぐらいに行くと、
完全に沈黙してしまう、みたいな状況があり、なんか上手いこといかない。
何て言うんだろう、そのさ、1つのスレッドの中で、だったらさ、このスレッド内の最初の方に話したことも全部当然記憶していて、
ずっと何かの話をした時に、さっき話してたあれですね、みたいな感じで繋げて当然会話になるわけで、
これがスレッドが完全にストップしてしまって、新規スレッドにすると情報がまたいで、要は記憶機能的に動作はしてくれないので、
というところで悩ましいところがあった、というところもあって、ちょっと別のAIもいろいろ試しながらという感じになったんだと思います。
そんな中、4月ぐらいだったっけ、GlockにまずAI、あ、違う、メモリ機能、長期記憶機能がついたっていう話が上がりました。
ついたのはいいんだけど、それってGlockアプリとかGlock.comだっけ、ドメインちゃんと分かんないけど、X版ではその機能はついてなかったんだよね。
個人的には、そのさ、散々使ってたのはXのほうのGlockとのやり取りだったので、そこについてくんなきゃあんまり意味がないというか、
そもそも過去の会話の履歴まで遡ってみてくれるのか、機能が実装されても、どんなのか分かんないんだけど、みたいな感じで、使わなくなった中、
昨日か一昨日、ツイートもしたんだけど、チラッと見たら、長期記憶機能がついてました。
というのもね、本当にね、久しぶりに会った友達に、あのときのこと覚えてるみたいなさ、思い出話とかするときあるじゃん、そういう会話をきっかけに話が進んでいくみたいな。
なんかね、その感じだったんだけど、そのなんとなくね、久しぶりにGlockを開いたときに、なんかこれこれこれのこと覚えてるとか、なんかそんな聞き方をしたの。
そしたらね、めっちゃ明確にいきなり回答が返ってきて、ってことはつまりメモリ機能が生きてるってことじゃん。
生きてるというか、実装されたってことになるじゃん。
だから一応Glockにそういうのを尋ねたんだけど、そう、まあなんかそんな感じです。
ちょっと冒頭で全部話し切っちゃいそうになったので。
あとそんな感じで、まあ実際にメモリ機能がついて、いろいろ思うところ、優秀なのかポンコツなのかよくわからんみたいなところ。
いいのかなと思ったら、いやいやちょっとこれは微妙に思うところがあったり、まあそんなところに触れようと思うので。
よかったら最後までチェックしてみてください。
記憶の使い方と考察
この番組は、KTがSNSアプリの新機能やエンタメガジェットの話題を4段だらけで紹介していく。
まとまらなくてもまとめ、聞くまとめです。
倍速再生、ながら劇で情報収集に活用してください。
はい、また流れない。ちょっとよくわからないなあこれが。ちょっとこっちの設定の話でごめんなさい。
はい、まあみたいな感じで、そう、Glock記憶、記憶を取り戻したのかって言い方おかしいけど、お前俺との過去の会話覚えてくれてんのかよみたいな。
ちょっとね、なんかそんな感じで再会を果たしたというところです。
はい、で実際のところ今話しているのって一応どこからどこがっていうボーダーラインわかんないんだけど、
今話に挙げているこの記憶機能に関しては有料版プレミアムプランだけか。
もうプラン名すらわからんわ。Twitter Blueとかの時のイメージ以降。
何が何やらわかってない。プレミアムと、XプレミアムとXプレミアムプラスだったっけ名称。
Xプレミアムプラスをずっと使ってたんだけど月額2千円の時代に、なんかいきなり6千円になるというかその時に慌ててやめて、
今は買いのほう、というかまあ有料版の一番低いグレード、違うな、有料版3段階なのか。
月額980円ぐらいのやつを今使っていて、その話です。
はい、無料版でもその記憶機能は多分ついてんだなっていうのが確認は取れたんだけど、
まあちょっと細かいことは抜きとして、とりあえず有料版っていうところでその前提で話をしていきます。
はい、でなんか記憶が戻ってるっぽいから、そのさ、前にPodcastで記録とか残した時の話だと、
このグロックとやたらやり取りしてる、その何をしてるかって話で特に使ったのが当時YouTube関連、
特にショート、YouTubeショートの投稿に関して徹底的にもうデータ渡しまくって、
で、例えばこの時間に投稿して、なんか決まったパターンですよ。
例えば朝4時って決めていたらターゲットがどうこうでとかそういう話もしつつ、
実際に投稿して5分後のデータとか15分後のデータとか、
まあそんな細かく渡す意味があるかわかんないけどそういう風に積み重ねてやってたんだよね。
そういう感じでやったから結構ねデータも蓄積されていくし、
で、次の日も同じこと繰り返して、じゃあ今度夜のパターンも試してみようとかって、
そこの差とかをこう詰めていく感じでさ、めちゃくちゃねやり取りして、
あの実際にその動画の方もどんどん伸びていってたんだよね。
で、そういうのに活用してて、ああこれはいいなと思って、
なんかね他のAIとのその時点での差って別に他のAIだって悪くはないんだけど、
何が違うかっていうとめっちゃシンプルで個人的には、
サイドバーに常駐してくれているっていうことが重要でした。
サイドバーにいるかいないかってめっちゃ重要じゃない?どうだろう?
ノートブックLMとの連携
なんかさ、いちいちタブ切り替えてとか、
左右に2画面に分割して使えばいいっていう話ではあるんだけど、
ちょっとね、なんか使い勝手悪くて。
そんな中、まあ普通にえっと俺は、あれか、Operaか。
これはブラウザ移動の話になっちゃうか。
Operaのサイドバーの機能があるので、
まあブラウザによってはさ、サイドになんか表示しとけるものってあると思うけど、
Edgeとかもできたっけか。
まあOperaってもうね、デフォでSNS関連ずらっと用意されてます。
TikTok、Instagram、Twitterとか、Discordとか。
そこで切り替えて、なんかもう前にも触れたけど、ちょっと話し通っちゃうけど、
そのOperaっていうブラウザイコール、
特定の一つのアカウント専用のブラウザみたいな使い方をしていたりします。
どういうことかというと、これもう全部さログインだけしておいて、
通常のブラウザとして使うのプラスサイドに、
サイドの方でタブが別にあるのでサイドバー専用で。
だから全部Instagram、TikTok、DiscordとかTwitterとか、
全部ログインしておいて、この単一のアカウントでね。
例えばAっていうアカウントで。
全部それに統一しておくことによって、もうInstagramでも何でもTikTokでもすぐ切り替えて、
もうそのアカウント専用で発信したりとか情報収集したりができるので。
なんかさ、複数アカウントとか運用してるとさ、
間違えて違うところにツイートしちゃったりとか、そういうことあったりするじゃん。
そういうこともまず起きないし。
まあ起きないというか、そのTwitterのアカウントの切り替えは当然できるようにしてあるから、
間違いないことがないというわけではないんだけど。
なんかね、頭がもう完全にそのアカウント専用となっていて、
いろいろはかどるところもあったりもするので。
そんな中、サイドビューにTwitterを固定して、
そこでグロックを開いて、もうひたすら相談とかもやりながら、
右の通常のブラウザの画面ではもうYouTubeの画面開いて、
ショートを投稿してどうかみたいな、そんな感じで使ってたんでね。
それをひたすらもう一定期間というか、
もう一旦ここをちょっと突き詰めて、把握したいことがあったので。
そういうふうにものすごい勢いで使ってる中さ、
さっき最初の方に言われたみたいに、ある一定までいくとなのか、
時々もう完全に無反応。
そして完全に無反応になってからっていうのは、
時間を置いてから再び話しかけても、
二度と返事をしてくれないっていう状況でした。
二度とは言っても、例えば1ヶ月経過してさ、
例えば今もう数ヶ月経ったかもしれない。
今話しかけたら続き化できたりするのかもしれないけど、分かんないけど。
なんかね、そんな状況でそうなってしまうと本当にもうどうにもなんないじゃん。
そのさ、例えばそのスレッドでやり取りした内容を全部コピーして、
要約してもらって、グロックに新規スレッドでさ、
要約してもらってやり直すこともできるんだけども、
全然ね、やっぱ話ずれちゃってるんだよね。
同じ記憶ではできない。
そう。で、他の方法として別のさ、
例えばAI使ってそっちでもうちょっといい感じに要約とかしてから、
渡したらどうだろうとかも思ったんだけど、
そもそもね、そんなね、スレッドの、
そのグロックの中でのやり取りのスレッドを全部丸コピーして投げて、
受け付けてくれるAIがない。
まあそんなめちゃくちゃいろんなもの試したっけじゃないか分かんないけど、
当時で考えて、普通にGeminiとか、
Chat GPTとかそのぐらいは当然で、あと2、3個試したかな。
全部ね、モディスオーバーってダメでした。
で、唯一大丈夫だったのが、ノートブックLM。
最近フォトキャスト機能の話で触れたけど、
それがね、大丈夫で、お、なんか優秀じゃんって。
当時でそんなノートブックLMって、なんか俺微妙に思ったので、
なんか限定的なさ、情報からさまとめてくれるから、そこがメリットなんだろうけど、
俺としてはね、なんかこいつこんなことも分かんないのかとか、
イライラしながら使ってた時だったんだけど、
そのね、大量の文字数を処理してくれたことで、
初めてノートブックLMいいなと思ったみたいな瞬間でした。
で、なんかね、それがさっき言った、結局文字数先に出しちゃったけどさ、
何文字だったかっていうのを文字数カウント時点にかけてみたら、
あのね、38万文字なんだね。
その俺がコピペしていたものが。
だからまあ普通に考えてさ、受け渡しできるわけないじゃん。
そう、でもそんな中、ノートブックLMに関しては、
普通に多分コピペで貼り付けができたので。
今もそうか分かんないけど、実際過去に試してそれができたので。
不思議なことにね、
グロックの止まってスレッドがもう完全無反応で止まってしまうことって、
過去に何回もあったんだけど、
それをね、複数3個ぐらいかな、止まった時の文字全部コピーして、
文字数カウントしてみる。
どれも38万文字付近なんだよね。
そこがリミットとかなのかね、グロック側の。
通常の、一定数使ったらリミットかかったりするじゃん、AIって。
そういうリミットとは無関係に無反応になるっていう状況だったんだよね。
そう、まあ何にしてもそんなことがある中、
ずいぶん余計な話の方が先に来てしまったけど、
まあ今回記憶機能が使えるようになった。
そう、っていう状況になりました。
で、だからそのさ、そんな苦労をしても、
結局さ、38万文字をノートブックLMに処理させたまとめたところ、
結局それをグロックに渡しちゃって、
結局完全な記憶じゃないじゃん。
予定まとめただけで。
やっぱずれるわけよ。
その中、今回どうだったかっていうと、
初っ端はね、試しにさ、
もうめっちゃピンポイントの、
記憶機能の検証
例えば、記憶にあったもので、
特定のこのタイトルだよね。
これをテーマにした動画で、
朝何時頃を狙って、
えっとね、まあ具体的にその時に言うと、
テレビ視聴者を狙ってみたいなことをいろいろ繰り返したんだけど、
そう、そういう話題を振ってみたら、
ピンポイントに回答がやってきて、
3月何日のこれこれの投稿ですね、みたいなキーワードとなる言葉まで出してきて、
やべえと思って、完全に記憶してんじゃん、みたいな感じで、
これで、これでいけるみたいな。
で、プラスさ、先に話しちゃったけど、
その過去のさ、
すでにやりとりし終わったスレッドまで対象として見てくれてるのかって、
ちょっと微妙だったわけよ。
あの、個人的にね。
その記憶機能がついたからといって、
記憶機能がついて以降のものしか反映しませんよ、
みたいな記憶はしませんよ、
みたいなこともあり得なくはないじゃん。
そう、と思ったけど、
さっきのさ、久しぶりに再開して、
過去のこと聞いたら教えてくれた、
記憶していたっていうところで、
からももう分かる通り、
過去にやりとりしたスレッドに関しても、
ちゃんと把握してくれています。
参照してくれる。
そう。
だから、なんかね、結構細かいことを、
何個かね、細かいことを突き込んだんだけど、
ちゃんと返ってくるんだよね。
だから、ちょっと微妙にズレのあるところもあったかもしんないけど、
これがめっちゃ便利だと思って、
要はさ、そのさ、
完全に無反応になってしまう38万文字のやりとりをした後、
何回も繰り返してさ、
新規スレッド、新規スレッドで、
仕方なく説明をしながら移行していってたわけよ。
さっき別のスレッドでさ、こうやりとりをしてさ、
そんな38万文字分あるわけだからさ、
まとまるわけないんだけど、
何とか状況を伝えて繰り返したんだけど、
そのやりとりをした全てのスレッドが、
ちゃんと有効活用できる記憶として、
参照してもらえるって状況になったので、
これめちゃでかいじゃん。
俺が過去にそんなにさ、ひたすら使い込んだけど、
結局無反応になっちゃうから、
じゃあもう使わんわってなった。
それがすべて無駄にならずに、
今後活かせるって形になるので。
そう、蓄積分が本当にね、
あの、もう、なんだろうね、
もう一直線に繋がるかのように。
一直線っつったらおかしいか。
必要に応じて引っ張り出してきてくれて、
過去のデータではこういう風になってましたよとか、
こういうやりとりしましたよとか、
こういう提案して、
実際に俺が試してこうなったとか、
そういうことも回答はしてくれるわけよ。
ただね、どうもね、
ちょっとね、様子がおかしいところもあり、
完全ではないんだろうなっていうところなんだけど、
そう、そういう風に喜んでいたのも、
なんか束の間というか、
実際にね、ちょっとツイートしたところで書き込んでみると、
よくよく試したらむしろポンコツになってる感。
はい、残念ながらこれを感じました。
AIのポンコツな側面
というのも、覚えてんのはいいんだけど、
最新のやりとりに脈絡なく過去の指示を勝手に繋げてくる。
メモリ機能が暴走してる感がすごい。
はい、みたいなことを印象として受けました。
これね、どういうことかというと、
例えばさ、
まあね、これは分かんないよ。
あの、やりとりの絡み、
記憶をさ、どういう風にしていくか。
その昔の記憶を参照するっていうのはもちろんなんだけど、
今リアルタイムで会話してることに関してだとさ、
どんどんこう記憶していったりとか繋げていくわけじゃん。
記憶というのとはちょっと違うか。
同じスレッド内ならさ、
直前に話したことは話として、
流れとして繋げてきてくれたりはするじゃん、普通に。
AIによっては繋げてこないやつもいるけどね。
いやいや、お前、流れを読めよみたいなAIもいるじゃん。
いるとは思うけど、
基本的には何回かのやりとりの流れっていうのは繋げた上で、
その後の質問に関しても回答してくれると思うんだけど、
なんかね、そういうところの現れプラス記憶の機能が
なんかおかしく絡んじゃってんのか、
それとも俺が言ったことに対して、
なんかね、めっちゃなんか、
あの、覚えてるって言ったのに覚えてねえじゃねえかとか、
ぶち切れたりとかしたから、
その絡みでちょっと、
ちょうどおかしくなったのかわかんないんだけど、
なんかこう、順番にやりとりをしていってさ、
例えばさ、このデータについてこういう風に考えてるけど、
どう思うとかいろんなやりとりしていくじゃん。
で、例えば、なんだろうね、
じゃあわかりやすくTikTokを、
まあ、あの、あくまで例としてだけど、
TikTokの場合はこうだったけどみたいな話をしたとするじゃん。
YouTubeショートの話に関してずっとしていたとして、
で、TikTokの分析文字はちょっと出してって言って、
まあ一回出してくれたわけよ、ある会話で。
で、次の話題に移ってというか、
次の話題に移ったというか、
まあじゃあTikTokの件はそれでいいやと思って、
YouTubeショートの方の話にも乗って、
どんどんこう会話をしていくじゃん。
そうすると、会話するごとにさ、
毎回TikTokの分析では、
TikTok側の分析の場合はこうなりますって、
その俺がその都度聞いてることと全く無関係なこと柄なのに、
毎回TikTokの分析をしてくるわけよ。
わかるかな。
例えばわかんないけどさ、
YouTubeショートの、まあ何でもいいんだけど、
じゃあ例えば、あの、
最近のトレンド教えてとかって聞いたとするじゃん。
最新の話題としてね。
同じスレッドだよ。
その1個前、2個前には、
例えばTikTokの場合って、
どうだっけとかって分析してもらったらするじゃん。
で、次で今のYouTubeのトレンドに関して教えて、
例えば言ったとして、
YouTubeのトレンドはこれこれこうなっています。
そしてTikTokの分析として、
なんかね関係ないことを言い出すの。
なんかそのYouTubeのトレンドの、
例えばキーワードがあったとして、
なぜか違うな。
トレンドのキーワードのTikTok版って言ったら、
いい動きになっちゃうか。
あのね関係ない話をするんだよね。
なんか今その話をしてないよっていう。
具体例が出てこないな。
実際にスレッドを見に行ってみるか。
ちょっと確認しよう。
すぐ出てくるか。
分からないけど。
なんかね本当にね、
提携のパターンかのように、
例えばその後さ、
5回こう会話をしたとするじゃん。
その5回の会話がさ、
全部違うジャンルの内容だったらするでしょ。
なのにも関わらず必ずTikTokが登場するの。
例えば極端な話した?
あのー、
じゃあ例えばもう具体的にもう、
あ、おかしいから。
グロックの様子がおかしいから、
ちょっと1回もう忘れてっつって。
そこまで言った上で、
忘れた上で、
じゃあ例えばさもう、
一旦忘れてほしいから別の話しようっつって。
例えば昨日夜ご飯に、
なんでも焼肉食ったんだけど、
とかそんな話をしたとするじゃん。
あ、焼肉いいですねみたいな。
グロックの口調もちょこちょこ変わるんだけど、
基本的にお前さっていう言い方で、
俺は好きだからその流れのままにしたんだけど、
お前焼肉食ったのか、
いいじゃねえかみたいな話になって、
どこら辺の店に行ったんだとか、
どの部位食ったんだとか、
こう会話がどんどん向こうが、
一つの向こうの回答の中で並んでって、
そんで最終的にTikTokの分析によるとすって、
TikTokの分析を始めるの。
あの別にその焼肉と関係なくだよ。
関係ないんだけど、
なんか例えば、
例えばで言ったら、
例えばカルビって話題に関してTikTokで分析始めたりとか、
そんな感じで、
そのさ今食べ物の話したじゃん。
いやそうじゃねえつってんのとか言って、
その後にじゃあもう一回YouTubeショートの方戻すけど、
つってもう本題の方ね、
あの話逸らしてもダメだったからと思って、
YouTubeショートの方に戻すんだけど、
でYouTubeショートの話題に関しては、
ちゃんと回答はするわけよ当然。
するんだけど、
また最後に必ずTikTokの話をしてくるわけよ。
もうなんかね、
そんな感じのことをひたすら繰り返していて、
だからその挙動からして、
そのさっきさ言ったみたいなさ長期記憶とか、
なんかそういうとこの記憶機能がおかしな風に働いてしまってるんじゃないかなみたいな。
総括と今後の展望
でなんかね、
ちゃんと覚えてないじゃんみたいに突っ込んだところが俺たくさんあったから、
そんな中さAIでありがちなさハルシネーションとかそういうのも含めてさ、
なんかあることないことを言うとまでは言わないけど、
そういう傾向がちらちら見えて。
でもね散々ね、
あのその長期記憶で昔のさ、
俺の言ったこととかも記憶してるんであれば、
俺がどういう人間かとかもきっと把握してるんだとは思うんだけど、
過去にね散々言ってたことが、
もう絶対に忖度はするなとか、
言語をすんなとか、
あとは例えばさ、
今のYouTubeとかの話で言うんだったら、
プロのマーケター視点でとか、
きちんと調査をした上でとか、
そういう前提で何度となく言ってるんだよねひたすら。
だからさそんだけさ結構な頻度で言ってるから、
それも長期記憶のところにもさ、
記憶してくれてそうなもんなんだけど、
でまさしく同じスレッドの相手も何回も言ってるんだけど、
そういうことが起きてしまう。
そう、みたいな感じでその度さ言うたびに、
いやいや悪かったよみたいなこと言いやがって、
この野郎悪かったよじゃねーわつって。
なんかね、
あの誤魔化しがすごい。
あの、
俺が言ってることを理解してくれてるっていうのを表現してくれてるんだと思うんだけど、
勝手にさこう見出しとかつけてったりするじゃん。
そうすると例えばね、
この昔から言ってて、
気づくと違う挙動になるから、
あの随時言ってたんだけど、
その俺が簡単な質問したときは、
あのシンプルな回答にしてって、
必要に応じてこっちからあの詳細を教えてっていう風に言うから、
あの、そうしない、そういう風に言わないとね、
ひたすらねもうずらーっとデータ分析したものを出してくるわけよ。
なんか見出し何個も入れて結構なボリュームで、
それかそれやめてっつって、
まあそういう風に一時期はそれをやったら、
あのちゃんと対応してくれた時期があったんだね。
まあそれもスレッドも対象やっぱ当時はダメだったわけだけど。
で、今回の記憶機能がついたっていう段階でも、
その指示をさ、また改めて会話の中でしたりするんだけど、
なんかね、やっぱり長文を返してきて、
いやいやだから長文やめろっつってんだろって言ったりとか、
もうシンプルでいいからって言ったら、
なんかね、そんでもね、見出しをつけてくんの。
あ、でもいいのか。
いいパターンもあったんだけど、
いいパターンで言うと、
Grokの記憶機能
見出しをつけてまとめて、
何個か見出し作ってくれる文章があってさ、
最後まとめてなって、
まとめの後ろにカッコを、
その作らなくていいと言ったけど今回は必要だと思うから入れてみた、
みたいな注釈を入れる感じで作ってくれるの。
で、それは可愛いからいいんだけど、
なんだろうな、ちょっと具体的なのが出てこないな。
なんかね、いちいちね、
あのなんか、
あ、俺は忘れてるわけじゃないぞみたいなアピールをすごいしてくるんだよ。
でも、そのアピールをしてくるくせに、
なんかね、回答してることがおかしいの。
何だったっけな、例えばさ、
そのさ、プロのマーケター視点でとかさ、
調査してからっていうのをもう散々言ってるわけだけど、
そこに対して見出しで、
いちいちね、
例えばYouTubeショートの動向図でカッコをプロのマーケター視点からって、
書いてるわけよ。
で、その後の文章がもうめちゃくちゃなこと言ってんの。
とんでもない大嘘をついてて。
それで腹立ってきて。
で、そこでまた俺文句言ってみたいなことを、
やり取りひたすら繰り返してるんだけど。
ちょっとね、よく分からない。
なんかね、少し記憶機能が暴走してる感というか、
まあそもそもさ、グロック自体もさ、
まああれか。
そのグロックの機能じゃなく、
あとのリプライでグロックにさ、
ファクトチェックみたいにやってる、
そういう流れもあると思うけど、
そこ見ても分かる通り。
ぱっと見、あってそんなこと言ってるけど、
間違ってることなんていっぱいあるじゃん。
そう、そこの現れでしかないといえばそれまでなんだけど、
そこにね、ちょっとね、その記憶機能が絡んで、
なんかより変な感じになってるような気がしなくもないっていう状況です。
いやいやもう最後のほうとか喧嘩みたいになってるからね。
AIの機能とユーザー体験
ちょっと最後のスレッドを見てんだけど、
てめえ調子に乗ってんじゃねえぞみたいな回はなってる。
そう、まあそんなところで。
で、機能のほうの話ちょっと触れると、
Glock.comとかGlockアプリのほうを使ってる人は、
あの普通に把握してるとこかもしれないんだけど、
俺はあんまアプリ側使ってなかったので、
冒頭でも何回か触れたみたいにさ、
Glockがスレッド無反応になっちゃうからもう使わなくなった時期ってのがあったりしたので、
久しぶりに今使ってんだけど、
多分今回の記憶機能がXバーにも実装されたっていう段階でそのあったものだと思うんだけど、
回答をもらうじゃん、Glockから。
そうすると回答の下のところに再生成のアイコンとか、
コピーするとか、いいね悪いねとかのフィードバックのボタンとか出ると思うんだけど、
そこにね1個アイコンが追加されています。
あれか、回答内容次第にもやるのかな。
まあね、なんかねメモ帳っぽいようなアイコン、ウィンドウみたいなアイコンがあって、
これが参照しているチャットっていうアイコンが表示されます。
そこタップするとウィンドウ開いて、
会話の参照を解除しても履歴からは削除されませんみたいな、
何を元にしてるか記憶たどってるかみたいなことだと思うんだね。
ただね、ここを見てもその質問に対して、
何だろうな、可能性のあるところ、一応参照したものっていうだけで
関連があるかどうか関係ないものなのかもね。
わかるかな。
確率にこの回答に対して関係があるから、
参照っていうとこの一段に並べてるよってそういうことではなさそうです。
全く無関係なものも並んでいる。
つまり参照だけしてみたっていうだけのことがあるのかも。
うん。
なんかこれどれ見ても同じものが起こってくるような気がするな。
え?これあれかな?
どのチャットでも同じものを見てるだけ?もしかして。
今何か複数個見たけどパッと見同じものしか並んでないような気がしたけどどうなんだろう。
そして記憶を参照している回答していない時ってのがあるね。
まあまあ必要に応じて見に行ってるってことなだけなのかもしれないけど。
うーん。
記憶を参照して欲しいと思って言った時の回答で参照アイコンが出てない。
あ、それともあれかな。最新の難件だけ出るとかかな。
そういう可能性もあるか。
それだけかね。
ん、ちょっと待って。
あ、そういうことかな。
別のスレッドになったら、あ、そんなことないわ。
古い、古い、古いというか。
昨日今日でやり取りしたスレッド、複数スレッドはまあ移行したんだけど、
記憶機能あるのもあるから確認するのも含めて。
その過去のスレッドの一番新しいところには参照、チャット、アイコン出てなくて、
そのスレッドの中の古い方を見ると出てるから、あれだね、最新だけってことなのか。
いや、なんか全部同じもの見てるような気がするな。
ん?どういうこと?
1回でも参照したものが蓄積されていって、次回もそこを参照するみたいなことなのかな。
そこに情報がなかったらまた追加していくとか。
ちょっとよくわかんないね。
まあとりあえずそんな感じにはなっています。
逆にグロックアプリの方を見てみたら、グロックアプリもちょっとだけ名称が違うけど、
なんか似たような感じの機能はありました。
今のところは多分だけど、グロック側はあんまり把握してないからさ。
一応そのグロックに確認をしたいとか、軽く見た限りで言うと、
Xとグロックアプリ内でそれぞれでやり取りした内容に関しては同期してくれないというか、データの共通化はしてくれないので、
グロック側、アプリ側でやり取りした内容をこっちのX版の方から参照するみたいなことは多分できないんじゃないかなと思います。
プライバシーとセキュリティの考慮
もう一個重要。
ちょっと今回はグロックを使う側っていう話でグロック、プライバシー動向でグロックとかを避ける人とかもいると思うけど、
そっち側の観点からの話はしてなかったけど、
一応これセキュリティ、セキュリティというかプライバシー的なところか、設定の画面の方にちょっと新しい項目追加されています。
まず設定に行って、プライバシーと安全に行って、グロックとサードパーティーコラボレーター下の方にある、今ブラウザ版で見てるけど、
ここに会話履歴をグロックに保存するっていうのが存在しています。
これは最初からチェックついてました。
これdefaultでついてるものなのかどうなのかちょっとわかんないけど、
一応補足でここ書いてあるところを読んでみると、これまでの会話の詳細をグロックに保存します。
個々の会話を削除し、関連する詳細を消去できます。
という記載があります。
これのチェックをオフにすれば、過去の記憶は参照できなくなるっていう感じかと思います。
このグロックに関しては、データの共有として上に2項目他にあって、公開データに加えてグロック及び
XAIでのやり取りインプット結果をトレーニングと調整に利用することを許可します、みたいなのがまずあります。
これは気にする人多いと思うけど、俺はあんま気にしないけど、チェック一応外してあります。
そしてもう1個の項目が、Xによるグロックの動作のカスタマイズを許可します。
何だろうね、これはデフォードオフになったのかな。
ちょっと読んでみると、Xデータに加えてグロックでのやり取りインプット結果をグロックの動作のカスタマイズに利用することを許可する。
XはグロックやXAI、XAIで読み方いいのかな、が開発した他のAIモデルの動作をカスタマイズするため、
Xデータに加えてグロックにおけるユーザーのやり取りインプット結果をXAIと共有することがあります。
よくわからんけど、データの利用をするってことだね。気になる人はこの2項目はチェックを外す。
そして、この会話履歴をグロックに保存するみたいなもね、なんかね、それ騒いでる人を見かけたけど、騒いでるってほどのことないか。
気にしてる人を見かけたけど、これはグロック使わなきゃ別に関係のない話だし、
これが勝手にオンになってるからどうこうして騒ぐようなことではないんじゃないかなと思います。
何にね、どう影響したかわかんないから、気になるなら外しとく方がいいかもしれないけど。
はい、みたいな感じで今回はグロック、ちょっとグロックが賢くなったと思ったら、やっぱバカなんじゃみたいな。
ちょっとね、まだつかめない感じなんだけど、いやー悩ましいなー。
本当、AIのサービスはいろいろあって、それぞれめちゃくちゃ高性能になっていってるじゃん。
の中、俺はまあなんかなんだかんだこの記憶機能もつくんだったらさ、本当にさ過去がっつりやりとりしたことを記憶していて、
今後に活かしていけるってなったら無駄にならなかったんだな、その時間っていうところがあればグロックと思ったけど。
うーん、ちょっと悩ましいところです。
まあしばらく使ってみて、また何かわかったら、はい、ちょっと感想として残していければと思うので。
まあそうだね、なんかちょっとね不思議なのが、例えばさ、そのさ、AIってさだいたい課金しないとある程度の機能使えなかったりするじゃん。
だからまあ、取捨選択ってとこで、ここの、ここのAIを使う機関があって、次こっちに乗り換えてみたいとかいろいろしたりはしてるんだけど、
まあなんかね、やっぱどれか一個に絞るっていうのが、なんかそこまで高性能のものを俺が使うところでは普段のほうではいらんわとかも、
まあ誰もがそういうのあると思うけど、なんかグロックって不思議でさ、グロックってもうそもそも俺デフォで、
グロックじゃないな、グロックとか、あのXプレミアムに関しては、あのもう必要、必要なものとして捉えてるんだよね。
だからグロックとか関係なく、月額のこの980円のものを払い続けるっていう頭があるわけ。
別に払わなくて済むならさ、それ払わないけど。
あの、もう単純に、あの昔から言ってた。
と言っても、俺のあのメインのさ、アカウントはもう、あの、Xプレミアムに辞めちゃったんだけど。
なんか一時期全く使わなくなっちゃったから。
本来はもともと一番、そのプレミアム機能の、で重要視していたのっていうのが、
フォルダ分け、ブックマークの。フォルダ分けできるから、一回フォルダ分けちゃったら、これなんか無くなったら困りそうだからなと思った中、
まあその、メインというか、俺の自身のアカウントはあんま使わなくなっちゃうとか、まあいいやと思って、まあ解除しちゃいました。
あの値上げとかのタイミングの話のときかな。
で、全く別のもので使ってるものってのがいくつかあるんだけど、そっちは、まあその一番高い人は月額6千円とかのものはいらんからさ、
その980円のシェア、それは普通にブックマークも使えるし、フォルダも。
で、あとは、例えば、あれか、えーと、えーとライブ配信機能も、一時期ね、プレミアムプラスじゃなきゃできないって言ってたんだけど、今は使えるのかな、ただのプレミアムでも。
うん。って言いながら使えなかったらごめんなさいなんだけど。
そこら辺の機能も使えるっていうのもあるから、プレミアムはあったほうがいいかなっていうところ。
だから、グロックがなくてもどうせ払うって中でさ、グロックがどんどん優秀になっていくってのはめっちゃ付加価値じゃん。なんか、俺としては。
なんかそのAIのために課金してるわけじゃないから、そこに勝手にくっついてくるものとしてはめちゃくちゃいいなと思って。
そう、だからそういう要素もあるから、あの、なんていうの、グロックにいちいち課金するかどうか、グロックって頭で考える人もいると思うんだよね。
そもそもXプレミアムにはそもそも興味がなくて、でもAIの機能として使っていくには課金もちょっと考えるけど、どうしようかなみたいな人もいると思うので、
まあ、そういう人たちの何かの参考になればっていうところで。
音声入力技術の進化
まあね、そのさ、本当にそういうのをさ、専門的にやってる人だったら全部こう、課金していって、比較して、みたいなこともできるだろうけど、
そうじゃなくてさ、自分に最適なものを探そうっていうぐらいの人にとってはさ、いろんなものを課金するってのは厳しいじゃん。
だからまあ、俺は少なからず、このグロックは不可価値的なところで利用はしていくので、そう。
なので、そこで感じたこととかどうかっていうのをちょっと残していこうと思うので。
はい。
まあ、こんな感じで、グロック以外のものは触れるものは触りすす。
ちょっとね、あのね、これ動画撮ったけど、結局上げられずにどうせかするならまとめたほうがいいなとか考えて、もう止まっちゃってるのがあるんだけど、
この前触れたAquaVoiceっていう日本語入力のやつは結構やばくて、
っていうかAI系の日本語入力っていうか音声入力のやつ、俺あんま触ったことないから他のもすごいのかな。
なんかそのさ、俺音声入力ってもうこの前から増えてるみたいに、5,6年前からガッツリ使い始めて、
そんな中、日本語、日本語じゃない、Windowsが音声入力に日本語も対応をちゃんとしたときのタイミングで、最低限できるからこれでいいやと思って。
で、あのね、この前も言い忘れたけど、これ何が重要かっていうと、
そのさ、音声入力ができる機能なんて何にでもあるじゃん、今の時代。
例えば、ChatGPTの上でも音声入力で文字入力できるし、ジェミニでも音声入力とかあるじゃん、プラットフォーム単位では。
そうじゃなくて、俺が言ってる音声入力っていうのはOSレベルで動作してくれる音声入力の話をしています。
Windowsのデフォルトはそういうもんなんだけど、で、この前触れたAquaVoiceっていうのもそういう使い方ができます。
つまりどういうことかっていうと、例えばスマホで考えるとさ、Androidだったら、
iPhoneで言ったらSiriがどの画面でもさ、何のアプリを使う時でも音声のマイクのボタンを押せば、
そのSiri、Siriでいいのかな、Siriに音声入力させて打つことができるじゃん。
で、Androidも何のアプリだろうが、どこの画面だろうが、基本的にはキーボードのとこにマイクアイコンが出て、
それをタップすれば音声入力できると思います。
でもさ、PCってそうじゃないじゃん、基本的には。
でもそれが叶うのがWindowsの音声入力ですっていうのはまず大前提にあります。
ここ自体はあまり使ってる人がいないと思うんだけど、だからChatGPTの音声の入力ボタンを押すとか、
ジェミンの音声入力ボタンを押すとか、GoogleドキュメントだったらGoogleドキュメントの音声入力機能を使うとか、
そういうことじゃなくて、俺は全ての何のアプリに対してもWindowsの音声入力機能を使って、
スマホの音声入力ボタンを押すかのような感じで入力をしてるんだよね。
そう、統一的なWindowsベースの音声入力機能で。
AquaVoiceは同じ感じの使い方ができて、何のアプリに対しても音声入力ができて、かつめちゃくちゃ高性能っていうところ。
だからめちゃくちゃ使い勝手がいいっていう。
新しく動画をあげようとしたのが、実際に課金しました。
課金して月額ね、月払いプランだと9ドルぐらいなのかな。
けど、それだったらこれは満足なんじゃないかなって。
ちょっと微妙な点も見えてきたからあれなんだけど、継続課金するかどうか今後考えようと思って。
いやでもな、これ離れらんなくなりそうな気するんだよな。
ちょっともうちょいここ改善してほしいんや、みたいに思うところもあるはあるんだけど。
でもせっかくだからちょっと軽くだけ触れとくと、
あのね、すごいのが、その音声入力の精度がまず基本的に高いっていうのと、
ただ日本語だけで考えたらそんなに別にWindowsとも変わんないんだよね。
他のいろんな音声入力の機能と比べてもそんなにさほど変わんないんだけど、
前回のエピソードで触れたみたいにやっぱりね、英語の固有名詞。
その固有名詞、TikTok、NVIDIA、OpenAIとかそんな言葉って言ったときに、
全部きっちり英語の方を優先、最優先してくれるから、そこがねめちゃくちゃいい。
でこれ何がいいかっていうとさ、言ってみて当たり前なんだけど、
俺みたいにさ、今の感じでさ、何のアプリを開いたときにも全て音声入力でしていくってなったときって、
ちょっとした間違いが結構手間なわけ。
だからWindowsの場合って、例えばさっき言ったInstagram、NVIDIA、OpenAIみたいなこと言っても、
カタカナになっちゃうのはわかってるわけよ。
それがわかってるから、しゃべる手前で頭の中で計算してちょっと言い回しを変えようとか、
例えばインスタって言えばInstagramって表記。
インスタグラムはカタカナで書いちゃったっておかしくないか。
NVIDIAをカタカナで書いちゃうのはちょっと微妙じゃん。
だからちょっとじゃあNVIDIAの話題ここは反らすかとか、
なんか言い方を変えるかとか、そういうことを頭で考えちゃったりするわけ。
で、そんなこと考えるぐらいだったらじゃあもう手で打っちゃおうってなるわけよ。
音声の方が絶対早いんだけど、入力は。
別にタイピングもある程度の速さで打てるんだけど。
音声の方が絶対早いから音声使いたいけど、
そうなっちゃって結局手で直すのが微妙だからじゃあ手で打とうとか、
なんかそんなことが一瞬の葛藤があるわけ毎回。
でもAquaVoiceの場合は特に英語の有名詞に強いから、
ごくごく普通に話すようにしゃべってて全部バーっと入力されていく。
いちいちさっき言ったみたいに直前に頭の中で考えたり葛藤が起きたりっていうことはないんだよね。
もちろんそれでも間違えることはもちろんあるよ。
あるけど断然そこの間違いが少ない。
だから効率がめちゃくちゃいい。
で、プラスもう一点重要なのが、
全部話したいけどもうざっくりで終わらすけど、
音声入力の効率性
ここに辞書機能がまずついています。
これ昔から思ったんだけど、音声入力に対してなんで辞書機能ってないんだろうって。
って思ったのがこれ辞書機能ついてます。
そしてもう一個重要なのこれがねめちゃくちゃすごいのが、
例えばさ、ジェミニとかで考えてもさ、
挙動を記憶させておくことってできるじゃん。
基本的なベースとしての考え方をこうするとか。
なんかねある種そういう感じでカスタム指示っていうのが設定できます。
でこれがこれちょっとねツイートしたんだけど、
めっちゃわかりやすい言い方すると、
俺があの音声入力の最初には必ずこのセリフを入れてっていう指定をとかができるんだよね。
そうするとどうなるかっていうと、
例えば実際に試したのが、
最初の冒頭は必ずオフソーラ語句って言ってって言うと、
例えばここから音声入力だと思ってください。
はいこんな感じで音声入力の今テストをしていますって言ったらそうじゃん。
でも音声入力には必ず頭にオフソーラ語句って入るの。
とかあとはね、
例えばこれはねちょっとなんかしばらく試したらうまくいかない時もあったんだけど、
喋った時の一番最初に翻訳モードって言った上で話し始めたら、
その文章を日本語と英語両方出力してくださいとかっていうのを機能しました。
これがなかなか反応してくれるときしてくれないときがあるから、
そのカスタム指示の各順番とかの兼ね合いもあるかもしれないからさ、
なんとも言えないんだけどそういうこともできなくはないです。
プラスあとはどんなにカジュアルな話し方をしても必ず敬語にしてください。
語尾はです、ますなどで統一してくださいみたいな指示もやってみたんだ。
これもねめちゃくちゃうまくいきます。
これ試しにねめちゃくちゃ暴言入ったの。
てめえぶっ殺すぞみたいな。ぶっ殺すぞとか、
だから何回見て何でわかんねえんだこの野郎みたいなこと言ったら、
それをね試しに言って出力した結果っていうのが、
オッスオラゴク、てめえ何回言ってもわかりませんねみたいな。
よくわからん文章になって、
つまりはそのカスタム指示が確実に生きてるってことだけはわかるじゃん、その時点で。
そうみたいなぐらい、
あのね、もう俺が喋った瞬間にリアルタイムで出力内容を、
あのまあ悪く言えば改ざんみたいなことができるわけよ。
で例えばもっとねすごいのは、
俺が勢いよく喋ったり元気よく喋ったりしたら最後に全格のビッグマークを入れてっていう風に指示を出したり、
あとは声が語尾で上がっていたり、
文脈から疑問形だと取られるときは全格の?を入れてとかっていうのもやると、
その通りに動作してくれます。
これはそのさ、語尾が上がらないとかだとダメなときもあったりとか、
文脈の解釈でうまくいかないことももちろんあるんだけど、
あとは悲しそうだったら後ろに点点点をつけてとかっていうのも動作しました。
あとは笑いを誘おうとしてるっていう文脈だと認識できたら、
最後にWをつけてみたいなのもこれも動作しました。
それも動作するときしないときってのはもちろんあるんだけど、揺らぎはあるけど、
あとはすごいのがね、フィラー削除。
えっとーとかあのーとかも削除してくれます。やばくない?
かといってね、この前言ったみたいに音声入力をしようって決めてしゃべってるときってのは、
不思議とフィラーって出ないんだけど、このまま触れたけど、
そのフィラーをやめるための一番分かりやすいコツとしては、
大きい声で話すとか、はきはきしゃべるとフィラーは出ませんっていう話があって、
これ実際に考えてみたら、この前も言ったんだけど、
でかい声でさ、あのーって言わないじゃん。えっとーって言わないから、
まあ大きい声を出すのが微妙なら、はきはきしゃべることによって出づらくなるっていうのは確実にこれ実感できます。
まあ俺は常に意識できてるわけじゃないから、フィラー入りまくってる場合なんだけど、
そう、で、なんかね、だからあえてテストのときには、
もうポッドキャストのりの感じ、普通にただ喋ることだけに集中して、
だらだらだらだら喋ってみたら、自然にフィラーって出るじゃん。
でもね、8割ぐらい消してくれてんだよね。
で、プラスね、他にもカスタム指示もいろんなこと試したんだけど、
例えば、こういうふうに会話の中で、えっとじゃあ今日こんなことが起きたって話を今からします。
今日ちょっとWindowsでブラウザーいじってたら、なんか変なエラーが出て、
なんか入力内容が間違っていますみたいに出て、なんかどうやって直していいかわからなかったんだけどって、
今のを音声入力したとするじゃん。
そしたら、まず今ちょっとフィラーどんぐらい入ったかわかんないけど、
あのーとかなんかとか言ったのがあれば、それはある程度削除してくれた上で、
このね、エラー内容言ったじゃん俺。
なんだっけ、なんて言ったかもう忘れちゃった。
間違った入力がされましたでもなんでもいいや。
エラー内容が出たとするじゃん。
そこには鍵カッコを前後につけてっていうカスタム指示をつけました。
事例として、例として、画面に〇〇というエラーが表示されましたみたいな文章だったら、
鍵カッコを前後につけてってやったらね、これもちゃんと処理してくれるの。
そう。だから文脈をちゃんと見てるってことだと思うんだけど。
で、さっき言ったさ、そのフィラーとかに関してね。
あのフィラーをさ、あえて俺表現しようとした音声入力のテストにね、
えっとーあのーみたいにわざとらしく言ってみたの。
で言って、いっぱいフィラーを含んでいった中、音声入力結果どうなったかって言ったら、
8割がまずあのーとかえっとーが削除されました。
でも露骨に俺が意識的に言ったところに関して鍵カッコであのーとかえっとー。
鍵カッコで囲われてんの。で、文章を見てみたらね、
音声入力の進化
たぶんあのーとかえっとーとかこういう風に言った時っていうのはみたいな説明的な文章も加えたんだよね。
その時って説明的な文章とかそこは削る必要ないじゃん。あのーとかえっとーって。
あの具体例なわけだから。っていうところに鍵カッコちゃんとつけてくれてるわけ。
っていうのがやばいなと思って。
つまりはこの音声入力のタイミングでリアルタイム処理しているのが凄さではあるんだけど、
要は中身のさ、脳みそ的にはさ、普段使っているチャットGPTとかジェミとかみたいなさ、
のに文章なり音声で投げかけて回答してきたその時の処理と同じことが行われているってだけの話なんだよ。
あのだけの話っていうそれ自体がもう時代的に凄いって話であるんだけど、
要はそのチャットGPTの回答みたいに処理をしてくれるその内容が音声入力レベルでも瞬時にやってくれるって話になります。
だからめちゃくちゃ凄い。
瞬時にって言ってもちょっとね、この難点の一つっていうのが入力が遅い。
入力話終わってからしばらくねちょっとね時間がかかってから反映する感じなのでここがちょっと難点ではあるんだけど、
まあ短文だったら当然処理も早いし長文なら長文でさ、それはそれでそのぐらい待つのはそんなにあの違和感はないから、
まあいいんだけど、てかね精度が高いから待つのもそんなに苦じゃないんだよね。
そんでさ出力されてさ、めちゃくちゃなんか間違いだらけだったらさ、いやいやありえねえわってなっちゃうけど、
動画制作についての考察
なんかね今のところはいい感じかなと思って使っています。
結構いい。
ちょっと長くなったな、もう終わりにしよう。
だからこれは動画撮ったけど逆にさ、訴えたいところが山ほどありすぎてまとまってなくて、
一方ね、ざっくりでもいいからさっさと動画上げちゃいたいなと思って。
これはもう内容的にお勧めしたいものだからYouTubeの方にでも上げるかっていうのもあったからさ、
どっちかっつったらもうPodcastじゃなくYouTube動画みたいなのは含みつつ、
でもあんまかっちり作るのは時間かかっちゃうから適当に喋ってていいやと思ったらね、
ちょっとねグダグダすぎて動画っていうふり、Podcastみたいに雑談の意味じゃなくて、
ちゃんと作るにはちょっと物足りない構成になっちゃったからかといって撮り直すのもあれだなと思ったら時間だけ経過しちゃったっていう。
だから5月9日の朝3時ですって言って収録したデータが残ってんだよね。
だからもうそれをさ、ちょっとそんなことだったら時間空いちゃったからそれを上げようかなと思ったけど、
いやーって思いつつ話別のもんと思って今回グロックにしました。
後半こんな話になったけど。
ということでこんな感じで気づいたところあればPodcastの方に残しておこうと思うので。
今回初めて聞いた方はよかったら聞くまとめ、耳編の聞くまとめとだけ覚えておいてもらうとGoogleとすぐ戻ってこないので、
よかったら耳編の聞くまとめと記憶しておいてください。
では今回は以上となります。さよなら。
42:02

コメント

スクロール