2025-07-07 07:42

🧬self.migrate_to(ai_clone, progress='logging') vol.882

動画版はSpotifyで「聴くまとめ」を検索!第882回です。今回は、ROG AllyとGemini CLIの話です。さらに、Google AI Studioを使って自作しているポッドキャスト用の音声編集ツールについても少し触れました ※アフィリエイトリンク含みます


🉐オーディオブック30日間無料!Amazon Audible

https://amzn.to/4lsMFNJ

※Amazonプライム会員限定で「3か月無料体験」みたいなキャンペーン開催してることあるので定期チェックを


✅️使用中AIサービス

音声クローンAI:Fish Audio

https://fish.audio/?aff=QLO4F7WRJEUDC

音声クローンAI:Elevenlabs

https://try.elevenlabs.io/xslt0g6h60gj

自立型AI「MANUS」

https://manus.im/invitation/8USCAUUP8MR4H

AI音声入力:Aqua Voice

https://withaqua.com/share?code=KT-N5GK


声に偏る世界線

https://open.spotify.com/show/0lmS4HzglwrCXjfjqlWIrf

関連ツイート

https://x.com/Koukichi_T/status/1942063833474060475


✅️ 目次

ROG Allyの使用感とトラブル、Gemini CLIの試用について

AIボイスクローンによる自身の口調再現の精度向上

ROG Allyで発生したインターネット接続トラブル

Wi-Fi接続の「制限あり」表示と日時ずれが原因

ROG AllyにGemini CLIをインストール

Gemini CLI使用時の操作性課題とソフトウェアキーボード問題

ROG Allyをモバイルコーディング目的で使いたい

ソフトウェアキーボード問題への対策検討

コンパクトキーボードと音声入力ショートカットによる解決策

ROG Allyの現実的な利用シーンと据え置き利用

検討した解決策の課題

Google AI Studioで自作したポッドキャスト音声編集ツール

自作ツールの機能紹介とAI活用例

自作ツールの進捗と記録について


ROG Allyを久しぶりに起動したらインターネットに繋がらないトラブルが発生し、Wi-Fiパスワードの自動入力ミスやWindowsの日時ずれが原因だと分かりました。まさか日時が原因とは盲点でした。


次に、ROG AllyにGemini CLIというAIツールをインストールしてみた体験を共有しました。コマンドラインでAIを使うツールですが、ROG Allyのタッチ操作でスクロールしようとするとソフトウェアキーボードが勝手に起動してしまい、操作性が悪いという問題に直面しました。


私はROG Allyをモバイルコーディング目的で使いたいと考えているので、このキーボードの問題は大きな課題です。コンパクト表示や音声入力ショートカットでの解決策を検討しましたが、据え置きで使うことが多いことや、入力ボックスにフォーカスが必要な点を考えると、まだ課題が残ると感じています。今後も実際に使いながら調整していこうと思っています。


さらに、Google AI Studioを使って自作しているポッドキャスト用の音声編集ツールについても少し触れました。「9 アンカー」のような機能を再現したもので、ドラッグ&ドロップでの配置変更や各種調整ができるツールです。これもAI活用の一例として紹介しました。今回はこのような雑談を通して、ROG Allyの使用感やAI活用の試みについて私の言葉でお伝えしました。


#聴くまとめ #ROGAlly #GeminiCLI #AI活用 #AIクローン #ポッドキャスト #UMPC #ガジェット #PCトラブル #GoogleAIStudio #バイブコーディング


--


✅️YouTube収録/ポッドキャスト/ライブ配信関連機材

🎙️今回の収録機材

🎙️Fifine AM8

Amazon ⁠https://www.amazon.co.jp/dp/B0BVVX5FBD?tag=kt_podcast-22

楽天 ⁠https://a.r10.to/hPmhN6

AliExpress ⁠https://s.click.aliexpress.com/e/_o2c0PgZ


📷️WEBカメラ:Insta360 Link

https://www.amazon.co.jp/shop/kt.pics/list/KUI7D4JMYJF6?ref_=aip_sf_list_spv_ons_mixed_d⁠

https://www.youtube.com/watch?v=tOtrGysvHNU


📎まとめ:YouTube収録/ポッドキャスト/ライブ配信関連機材

https://www.amazon.co.jp/shop/kt.pics/list/KUI7D4JMYJF6


✅️使用アプリなど

音声編集:Adobe Audition

https://prf.hn/l/vwza4G3/

動画編集:Adobe Premiere Pro

https://prf.hn/l/614bQWX/

全部入りCreative Cloud

https://prf.hn/l/3PqjAQJ/

Adobe Firefly

https://prf.hn/l/9O5qVXD/

Adobe Express(アドビ版Canva/Firefly連携が良い感じ)

https://prf.hn/l/lQOq3yd/

--


✅️買ったやつ。ガジェット関連おすすめなどまとめ

Amazonマイストア

⁠⁠⁠https://www.amazon.co.jp/shop/kt.pics

Amazonの新機能です。楽天ルームみたいなかんじのやつ。

カテゴリ分けして載せてるので、気になるものあればコメントなどもらえたらポッドキャスト内で紹介します


--


✅️関連SNS

ブログ

⁠⁠https://koukichi-t.com/

Twitter(X)ポッドキャスト用

https://x.com/kiku_matome

Twitter(X)中の人

https://x.com/Koukichi_T


✅️YouTube

聴くまとめ YouTube版

https://www.youtube.com/channel/UCy42LheJtEhKSjquP9BgiGQ

ガジェット本音レビューチャンネル

https://www.youtube.com/channel/UCZzl7IurT1V8-HPrF0S07GQ

SNS関連情報チャンネル

https://www.youtube.com/channel/UCkDwn4gZY8VYHAxCkHynTWw


--


この番組はkoukichi_tが、SNS、エンタメ、ガジェットの話題を余談だらけで紹介していくポッドキャスト、まとまらなくてもまとめ「聞くまとめ」です。倍速再生、ながら聞きで情報収集に活用してください⁠⁠

※アフィリエイト広告リンク含みます⁠


以下でも聞けます!「聴くまとめ」で検索!

Apple Podcast/Amazon/YouTube/Spotify

サマリー

今回のエピソードでは、ROGA-Liteデバイスの使用体験やトラブルについて、特にGemini CLIのインストールに関する感想が中心となっています。また、Google AI Studioを活用した作業用ツールの開発にも触れ、音声編集のプロセスを記録しています。

ROGA-Liteの使用体験
お疲れ様です。ケイティーです。今回は、最近ちょっとまた使い始めたROGA-Liteっていうデバイスについて話してみようかなと。
使ってて起きたトラブルとか、それにGemini CLIをインストールしてみた感想とか、そんな感じの雑談になるんで、何かの参考になるかはわからないですけど、よかったら聞いてみてください。
リアルケイティーです。今回はまた、AI Voice Cloneを使って読み上げをさせているんだけど、その台本にあたるもの、これをGemini CLIを使って以前から試していた、
俺自身の口調の再現っていう、これの精度が徐々に上がってきている気がするので、それの記録として捉えてもらえたら、それとして記憶を記録しています。
まだまだなんだけど、割と結構自然なんじゃないかなって、俺が使うような言い回し。あとは、あえてフィラーをもっと加えるとか、そういうことすれば、どんどんより俺っぽくなっていくとは思うんだけど、
これ記録していくことによって、徐々に精度を高めていってみたいなことをしたいと思っているので、後で振り返れるようにと思っての記録なので、
よかったらこの後、普段聞いている方だったら、俺がどんな感じで話すかってより分かっていると思うので、まんまではないんだけど、徐々に良くなってきているかなって。
細かいところは違うところもあるんだけど。ということで、この後聞いてみてください。
さて、久しぶりにROGAライを起動してみたら、いきなりインターネットにつながらなくて、ちょっと困った状況になった。
最初、あれ何でだろうって思ったんですけど、よくよく確認してみたら、どうやらWi-Fiのパスワードを入力するときに自動で余計な文字が何個も入っちゃってたみたいで、
それが原因で接続できなかったみたいです。俺もそんなことあるんだなと、ちょっとびっくりしました。
その余計な文字を消してパスワードをちゃんと入力し直したら、今度は無事に接続できたんですけど、それが制限ありっていう表示になっちゃってて、
完全にインターネットが使える状態じゃなかった。という、これって何だろうって調べてみたら、どうやらWindowsの日時の自動取得がうまくいってなくて、時間がずれてるとこういう状況になるらしくて、
結局手動で時間を合わせ直したら、ちゃんとインターネットにつながるようになったんですけど、まさか日時が原因でネットにつながらなくなるとは思わなかったんで、ちょっとした盲点だったかなと思います。
最近、奇妙なことが起こる。あれ?この知識、いつ手に入れたんだ?あの物語、いつ読んだっけ?誰かが直接私の記憶に知識を書き込んでいるかのように。そうか、君だったのか。
そう、その誰かとはAmazon Audible。あなたの聞くを最大化するオーディオブックサービス。今すぐ30日間無料で体験してください。詳細はこのポッドキャストの概要欄のリンクから。
続いて、そのROG AIにGemini CLIっていうのをインストールしてみたという話です。これは最近俺が結構注目しているAIをコマンドラインで使うためのツールで、これをROG AIで動かしてみたらどうなるかなと思ったという感じです。
ただ、ここで一つ問題が出てきて、ROG AIって画面をタッチして操作することも多いんですけど、Gemini CLIを使ってスクロールしようとすると、いちいちソフトウェアキーボードが起動しちゃう。これが結構使いにくくて操作性がすごく悪かったみたいな。
俺としては、ROG AIをバイブコーディング目的で使いたいっていうのがあります。つまり、キーボードとマウスを使わずに、本体のタッチ操作とか音声入力で直感的にコードを書いていきたいっていうのが目標。
だから、キーボードが勝手に起動するのはそのコンセプトと真逆で、ちょっと台無しになっちゃうかなと。何かうまいこと設定とか組み合わせで良い感じにならないかなって、いろいろ考えてみたんです。
例えばソフトウェアキーボードが起動しないようにするとか、もっとコンパクトに表示するとか、そういう方法がないかなって。それでいろいろ試行錯誤した結果、こうしたらどうかなっていうのが見つかったんで、ちょっと話してみます。
キーボードをコンパクト表示にして、画面の右下の方に設置する。これで画面スクロールの邪魔にはならなくなるかなと。
さらにマイクボタンさえ押せればいいって考えると、Windowsの音声入力ショートカットWinプラスHをROG AIのボタンに割り当てれば、もっと快適になるんじゃないかなって思いました。
これでわざわざ画面上のキーボードを触らなくても音声でコマンド入力ができるようになるから、かなり操作性が上がるはずかなと。
でも冷静に考えてみると、俺がROG AIをわざわざ手に持って使うことって、そこまで多くないかもしれないなとも思いました。
基本的に末置きで使うことの方が多くなる気がします。だから最終的な目標はあくまで末置きでの快適操作ってことになるかなと。
そして何よりも、まずテキスト入力ボックスにフォーカスしなきゃいけないので、結局ショートカットで音声入力できても1回はタップが必要になってしまうので、あまり意味ないかなとも感じました。
今後実際に使ってみながら微調整していってみようと思います。
音声編集ツールの開発
ということで今回は以上となります。今回初めて聞いた方は是非フォローお願いします。
また耳へんの聞くまとめと記憶してもらえると、検索などですぐに戻ってこられます。
最後までありがとうございました。また次回の配信でお会いしましょう。さよなら。
今回もう1個テーマ含んでいたので、そこも記録しておこうと思います。
前から時々触れていたところで、Google AI Studioというものを使って、自分用の作業用のツールとかアプリを開発みたいなことをしていました。
その中でポッドキャスト用のものとして、旧Anchorと呼ばれるSpotify Creatorsの昔の音声編集機能みたいなのを再現したツールを作って自分で使っています。
今回それを使っている感じになります。
あんまり細かいことは今ここで触れてもあれなんだけど、一応サムネに今回載せてあるのを見てもらうとなんとなくわかるかな。
いっぱい音声ファイルとか途中で挟んだ音声広告にあたるものとか、あとDJのスクラッチみたいなものが今回音声に入ったと思うんだけど、
そういうものを個別のファイルとして、俺が作ったアプリ上でドラッグ&ドロップで位置を入れ替えたりとか、そんな感じにできたりとか、
ボイスのエフェクトかけたりとか、各BGM、音声広告、俺の声、SEとかのボリュームの調整もできたりとか、
いろんなものを詰め込んだアプリを作って使っています。
それも徐々にいい感じにしていってるんだけど、それを使ったのも今回一緒に合わせて記録として残しています。
この点に関しては、声に偏る世界線、音声配信とかそういうことについて専門として配信しているポッドキャストがあるんだけど、
雑談も含めてる感じだから、この番組の延長線上の音声のことしか使わないものと思ってもらえたらいいと思うんだけど、
そっちでは動画形式でこんな感じで使ってますみたいのを記録しました。後であげようと思うんだけど。
とはいえ、これ別に公開して使ってもらえるようなものではないので、ゆくゆくは公開できたらいいなと思うんだけど、
やっぱり一個直すと一個壊れてみたいなことで、なかなか公開っていうのは難しい状況だなとか思いつつ、
とりあえずこんな形で使っていますとか、AIこんな感じで活用できますよっていうところの何かの参考になればというところでした。
ということで、こんな感じで今後も配信していこうと思うので、よかったらフォローなどお願いします。さよなら。
07:42

コメント

スクロール