1. ぴぼさんのゆる〜り在宅ワーク
  2. #158 Discordの音声文字起こし..
2025-12-27 11:12

#158 Discordの音声文字起こしボット作ってます

会社を辞めて在宅ワークになるとどうなるの?

 

2025年4月から在宅ワークを始めたぼくが

毎日の生活の中で気付いたことなど

ゆる〜っとお届けします。


今回の英語: I’m working on a Discord bot that transcribes voice into text.


https://x.com/39ceeport39


#在宅ワーク

サマリー

今回のエピソードでは、Discordの音声文字起こしボットを作成する過程について話されています。特に、AIを活用した文字起こし技術や、Pythonを使ったBotの開発手法について説明されています。

Discordボットの開発開始
Hey guys, this is pibots radio. こんにちは、ぴぼっとです。
今回は、Discordの音声文字起こしボット作ってます、というお話です。
英語で言うと、I'm working on a Discord bot that transcribes voice into text、という感じですかね。
この中で、transcribeというのがありまして、文字に書き起こす、文字に変換させるような意味ですかね。
transcribe、スペルはですね、t-r-a-n-s-c-r-i-b-e、transcribe、文字に書き起こすという意味ですね。
音声で話したことを文字に、AIとかを使って自動的に文字に変換する時にtranscribeと使うので、今回はI'm working on a Discord bot that transcribes voice into text、という感じの英語になります。
今はですね、Discordの音声文字起こしボットというのを自分でやってみようかなと思って作ってます。
どこか、Xだったと思うんですけども、けいすけさんのAIボットみたいなのがあって、それで文字起こしをDiscordでできるとすごく便利だというお話をされてたんですね。
他のアプリでですね、話して文字起こししてもらおうと思ってもですね、あんまり僕の中では見当たらないというか、新しいアプリをインストールするか、無料でもできるのはあるんですかね。
けいすけさんが言うには、Discordの文字起こしがすごくいいという感じで言われてたので、それをですね、無料でですね、けいすけさんの方が使えるんですけども、これってどうやって作ってるんだろうと思って、文字起こしだけでいいし、AIに聞いてちょっとやってみようかと思ってちょっと挑戦したんですけども。
まだ途中でですね、最後の方までいって、あとはウィスパーとかいうのを無料でやりたかったので、その辺を使って文字起こしするだけまでいってると思うんですけども、最初は何をやっているかわからなかった。
AIが言っていることもわからなくて、Macを使っているんですけども、MacとWindowsだったらまたちょっと違うみたいで、Macにはですね、ターミナルというのがあって、言語ですかね、コードみたいなのがずらずらと並べるというか、指示ができるようなウィンドウみたいなのがあってですね、検索からターミナルってずっと出てくるんですけども、
そこを使って作るということで、何のことだと、その中にですね、言われたことを英語のアルファベットですね、アルファベットのコードで、Pythonというやつですかね、Pythonとかいうやつで、最初から僕の使っているMacに入っていたので、
その言語で打ち込んでですね、それでBotを作る、文字起こし用のBot、ディス構造に使うためのBotを作るみたいな感じですかね、Pythonの言語というのが難しい言語ではなくて、人間のある程度言葉に近づいているような言語らしくてですね、
その中で文字起こしの指示を出してBotを作るみたいなことができたんですね。なので、Pythonの言語を使って、ターミナルの中で料理するみたいな感じで、Botのアプリというか文字起こしの機能をBotとして作るという感じですかね。
それとは別に、ディスコード側でもですね、Botというものの存在をですね、自分のサーバー、もしディスコードを使われたら分かると思うんですけども、自分のサーバーってあるじゃないですか。
その中に、ディスコードディベロッパーポータルって言うんですかね。で、Botを作って、Botというのを、存在を作り出すというかね、用意する感じですね。
トークンを取得したりですね、そしてサーバーに招待したりとかですね、手順も思い出せないくらいなんですけども、AIに聞きながらやってたんですけども、それがその存在を作ったことで、このPythonでBotを動かせるようになるという感じですね。
で、ターミナルからディスコード用のBotをですね、起動してですね、Pythonでですね、そして、起動している間は動いているんですけども、パソコンを止めちゃうと止まっちゃうんですね。
そういう仕様だからこそ無料になるのかな、そういう仕様なんですけども、Pythonで動かして、連動するような感じになるんですよね。
AIの活用と今後の展望
それで、その次ですね、テキスト、こうディスコードってテキストコミュニケーションあるじゃないですか、テキストで入出しますとか、退出しますとかいうコマンドを作って、
僕が命令するとBotが動くような感じの、もうターミナルを通してですね、ディスコードで使えるように追記しました。
あとは、ボイスチャンネルに僕が入った時に、そのBotもボイスチャンネルに入るようにする、2人いるような感じですよね。
Botがもう1人の人みたいな感じになるんですかね。それで権限とかを与えたりですね、また新しいPyNACLとかいうのをインストールしたりしてたんですけども。
これもAIに聞いてればなんとかできるような、僕でもできるので、ちょっと知ってる人だったら簡単にできると思うんですけども、こういう簡単なアプリというか機能もですね、聞きながらだったらなんとかなるなというのを体感したんですよね。
その話をしているわけなんですけども、これは本当になんとかなるレベル、こういうテクニカルというか技術的なことも聞けばなんとかなるレベルのことが多くなったんじゃないかと思うんですね。
もちろん複雑なことはできないとしても、こういう単純なことから始めていくとですね、ターミナルの原理とか、Pythonというのがなぜあるかとかですね、そういうことが分かるだけでもその次の課題が見えて、じゃあこの後どうやって文字起こしができるのとかですね。
iPhoneとかですね、Androidとかスマホで文字起こし、声をDiscordに入れると文字起こしするにはどうしたらいいのとかですね、その次のステップが見えてくるので、自分でもAIに聞けば結構深掘りできてるんだなということを実感したんですね。
セットアップ的にはほとんどできてるらしいので、あとは本当に使えるようになるようにするだけなので、最後までやってみたいんですけども、また何回もやりとりしながらAIとですね、AIは我慢してないんでしょうけども、AIちょっと頑張ってもらってですね、文字起こしができるようになればなと思っています。
こういうアンチグラビティもそうですけども、自分の人間的な言語を入れてるだけでもこういうアプリとか機能が追加できるということで、そうやってるとやっぱり裏で実は何が起きてたのかみたいなのが分かるので、そういう意味では僕にとってはすごく嬉しいことだなと思ってます。
平たく知っていれば細かいことも作れるという感覚ですかね。
ビジネスでも経営者さんだったら深く知らなくてもいろんなことをまんべんなく知ってた方がビジネスオーナーとしてはですね、発展しやすいというか経営しやすいということなので、一つのことを深掘りするよりもいろんなことを知っている中で、そう支えできればいいので、
このAIの力を借りながらこういうのを地味にやっていくと何か生まれてくるかもしれないと思って、思いついたことは試してみるとか続けてみるとかしています。
今後もこういうAIを活用したものを自分の中にですね、体に染み込むというか慣れるようにしていきたいなと思ってますので、あなたもぜひですね、
チャットGPTとかですね、ジェンミニとかですね、好きなAIを選んでそれとお付き合いをしながら、自分の興味のあるところを深掘りしてAIと仲良く付き合っていただければと思います。
また文字起こしって使ってみてどうだったかみたいなのができればいいなと思ってますので、またその時は配信してみたいと思います。
この番組では会社員を辞めた僕が在宅ワークをしながら、これはいいなと感じることをゆるっとお届けします。
今回も最後まで聞いていただいてありがとうございました。
よろしければフォローの方、まだしてないよという方はポチッとお願いします。
ではまたお会いしましょう。バイバイ。
11:12

コメント

スクロール