1. ウミノの40歳からのAI活用塾
  2. #043 スタエフを文字起こしす..
2023-05-30 07:44

#043 スタエフを文字起こしするアプリほしい方いますか?

▼今日の元ツイート(文字起こしアプリ)
https://twitter.com/chibinftcom/status/1660126266412916737

▼知らないとだまされる!NFT詐欺対策セミナーアーカイブはこちら
https://nftsecurityseminar0423archive.peatix.com/view

▼ひとりでジェネるもんDiscordサーバー
https://discord.gg/FCDqbk53PG

▼チビ画伯ママのブログ
https://chibinft.com/

▼チビ画伯ママのプロフィール
NFTクリエイター向けのコミュニティ【ひとりでジェネるもん】を運営しています。
2021年から9歳の娘のNFTも販売中!
NFTに関する情報発信を続け、Twitterフォロワーは1.4万人。
このラジオはNFTについてゆるーくお話していきます。

#NFT #Web3 #毎日配信 #スタエフ毎日配信 #クリエイター #NFTクリエイター #Python #プログラミング初心者
---
stand.fmでは、この放送にいいね・コメント・レター送信ができます。
https://stand.fm/channels/5fba3d73c64654659098efa4
00:06
皆さん、こんにちは。このヒトジェネラジオは、NFTクリエイターが楽しく創作活動を続けるためのコミュニティ。
一人でジェネル門を運営するちびがはくままが、NFTについてゆるくお話しするチャンネルです。
さて、今日は、あ、NFTあんま関係ないんですけれども、
えっとーですね、あのー、西野さん、金婚の西野さんがね、お話しされていたことをちょっと真似してみたんです。
金婚西野さんがおっしゃっていたのは、ボイシーを毎日撮ってると。
そのボイシーを撮るというエネルギーを、なんか別のことにも使えないかみたいな感じのことをおっしゃったのかな。
それで、金婚西野さんがやったのは、そのボイシーを文字起こしして、それを長文ツイートにして流すということをしたら、フォロワーさんがすごい増えましたっていうふうにおっしゃってたんですね。
あ、それ確かにそうだなーって思ったんです。
私こうやって毎日ね、朝6時、ちょっとこれから朝4時に変えようかと思ってるんですけども、
あのー、えっと、ボイシーじゃないや、これはスタイフですね。
スタイフで毎日収録していますけれども、これね、撮ってもやっぱりそこまでたくさんの方には届いていなくて、
あのー、ツイッターの方が届くやすいんだろうなーって思ってるんですね。
かといって、スタイフのリンクを貼ると、ちょっとあんまり外部リンクをね、貼り続けると、なんかバンされるとかっていう噂もあるので、
毎日はちょっと投稿するの怖いなーと思っているので、ここぞっていう時だけしかツイートはしていないんですよ、スタイフのツイートっていうのは。
なので、そしたら、スタイフを聞いてもらうっていうのがゴールではなくて、話したことが少しでも多くの人に伝わればいいなというのがゴールなので、
ツイートという形で文字起こしをして、スタイフの内容をね、文字起こしして、それをツイートするっていうのもアリだなって思ったんです。
それでね、どういう風にやるのかっていうのを色々調べてみたら、意外とね、無料で、無制限で文字起こししてくれるっていうサービスが全然ない。全然ないんです。
そして、一応ね、Googleドキュメントとかで音声入力ができるので、それも試したんです。
でもね、私の滑舌が悪かったりとかっていうのもあると思うんですけれども、もう精度が低すぎて使い物になりませんでした。
色々試したんです。多分ね、大体無料でできることは全部試したし、有料でも良さそうなもの、無料期間、毎月何分まで無料とかっていうのをね、試しました。
例えば毎月10分までとかだと、10分だと2本分ぐらいで私終わっちゃうので、それだと意味ないなって思いましたし、
あとは60分までっていうのもあったのかな。でもそれだとね、ちょっと若干使いづらい感じだったんですよね。
それだと、じゃあ自分で作っちゃえと思って、オープンAIのですね、オープンAIっていうのはJATGPTの使っているAPIのことだと思うんですけれども、
03:01
オープンAIが出しているウィスパー1だったかな、とかっていうね、音声入力の機能っていうのかな、ちょっとあんまり正しい表現じゃないかもしれません。
とりあえずね、ウィスパーなんとかっていうAPIがあるんです。そのAPIを使うと結構な精度で話を拾ってくれるんですね、文字化してくれるんです。
これはなんでわかってたかっていうと、JATGPTのアプリが日本でも今使えるようになってますけれども、あれって音声入力できるんですね。
すごい精度がめちゃめちゃいいんですよ。ただあれは確か1分以内とかしか聞いてくれないんですけれども、あれ使えればいいなと思ったので、
オープンAIのドキュメントを見てみました。そこでウィスパーとかって検索してみたら出てきたので、これ使えるんだと思ってですね、
それをJATGPTにこれを使って音声ファイルを文字起こしするアプリを作りたいみたいなことをJATGPTに投げかけて、
Pythonというプログラミング言語でそういったアプリを作りました。実際に作ったんです。
このスタイルの概要欄にそのアプリどんなふうに動いているのかというのをお見せします。
これはどんなものかというと、一応もうめんどくさいというか簡単に使えるようにしたかったので、
デスクトップ画面にアプリのショートカットを置いてそれをグリグリっとダブルクリックするとフォームが開いて、
そこでファイルを選択するとファイルが選ぶようになると。
私はこの音声は最初にサウンドレコーダーというWindowsの備え付けのデフォルトのアプリで取っているので、
そのサウンドレコーダーで収録したM4Aという拡張子の音声ファイルがたくさんあるので、
それを選択して実行するとちょっと時間かかるんですよ。1分くらいかかるんです。
なので皆さん本当に長く待ってもらえればいいんですけど、長く待ってもらえれば、進歩を強く待ってもらえれば音声が文字化されるんですよね。
ちょっと開業とかが入らなくて、これも本当に入れたかったんですけどどうしてもうまく入れられなくてですね。
開業なくずらーっとなってるんですが、割といい音声認識じゃないかなと。
精度はなかなかいいんじゃないかなと思ってます。
そんな感じでそういうファイルを、ファイルというかそういうプログラムを作りました。
06:02
もしもこのスタイフとかをやってらっしゃる方でこのアプリを使ってみたいなという方がいたら、
これ全然無料でお渡しします。
ただね、これエグゼファイルなんです。
エグゼファイルってね、変なウイルスとかを仕込めるタイプのファイルなんです。
なのでちょっとね、心配な方はやめといてください。
一応もちろん私はそんなものは全然仕込んではいないんですけども、心配な方はそういうのは実行しない方がいいと思います。
エグゼファイルなのでオーディオトゥーテキスト.エグゼというファイルになっています。
これ結構ファイルが重いんですよ。
しかも376MB。
何らかの形でお送りすることはできると思うので、
もしご希望の方がいらっしゃったら全然ここのコメント欄とかで送ってくださいとか言っていただければ、
例えばツイッターのDMとかで、
ギガファイル便とかかな、そういうのありましたよね。
そういうので送れると思いますので、よかったら声かけてください。
どんな感じで動くのかっていうのはこの概要欄にツイートを貼っておきますので見てみてください。
では今日もひとじねラジオを最後までお聞きくださりありがとうございました。
NFTについて学ぶならひとじねコミュニティにも遊びに来てくださいね。
毎日夜10時15分からスペースもやっています。
それでは今日も素敵な一日をお過ごしください。
失礼します。
07:44

コメント

スクロール