1. rel.ax
  2. #31 ChatGPTがさらに手軽に!..
2024-04-05 12:17

#31 ChatGPTがさらに手軽に!サインアップ不要で利用開始

bbz
bbz
Host

ポッドキャスト第31回目の紹介 ## ChatGPTのサインアップ不要化
- オープンAIのChatGPTがサインアップ不要で利用可能になった
- よりアクセスしやすくなった## 音声合成AIの発表
- オープンAIから音声合成AIの発表があった
- 15秒程度のサンプルを渡すと、その声を模したクローンを作成できる
- 一般公開はされていないが、精度が高いと話題になっている## AIによる長時間音楽作成ツールの登場
- AIによって3分程度の長時間音楽が作成できるツールが登場
- 高音質でクオリティが高いと評判## 著作権侵害の防止技術の搭載
- AIの音楽生成において著作権侵害の防止技術が搭載されている
- アーティストの懸念もあるが、共存できる方法を模索している## 新しいAIモデルの登場
- DBiとJambaという新しいAIモデルが登場
- Jambaは従来のアーキテクチャーとは異なるハイブリッドモデルを採用
- メモリの消費が少なく、高速で品質も良いと評価されている

※ タイトルや概要は AI にて生成させています。

放送で紹介されたニュースへのリンク

https://ainewsdev.substack.com/weekly-ai-news-37


放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。


サマリー

AI関連の話題がピックアップされ、AIの進化や音声合成AI、音楽生成AIなどについて話されているポッドキャストです。チャットGPTがサインアップ不要で利用可能になり、音声合成AIのクローン作成や長時間音楽生成AIの登場についても取り上げられています。新しいAIモデル「Jamba」の特徴や論文なども紹介されています。

AI関連ニュースとチャットGPT
この放送リラックスは、1週間でよくネットに流れているAI関連の話題を
AIが自動でピックアップし、bbzこと私、ババゾノートセコンことタテノが
つらつらと話すポッドキャストです。AXで暮らしにひらめきをOBジョンに
サービス体験や組織作りを行っている、工夫AIスタジオの提供で行っています。
ということで、今週も1週間分のニュースまとめをしゃべっていきたいと思います。
よろしくお願いします。
よろしくお願いします。
今日も改めてニュースなんですけど、1週間、ネット上によく流れているもの、
AI関連のニュースですね。これをAIがまとめてリストアップしているので、
それをしゃべっていくという内容になっております。
なので、週によっては多かったり少なかったりするんですが、
今日はやや少ないかもしれませんので、あしかわらずということで、
早速進めていきたいと思うんですが、まず1つ大きなトピックですね。
AIといえばオープンAI、チャットGPTみたいなところがあるんですが、
今まで逆にそうだったんだという感じではあるんですけど、
チャットGPTがサインアップ不要で利用可能になったというのが
ちょっとお話になっておりましたね。
そうですね。今まではどうしてもサインインしないと使えないというところが、
サイトにアクセスするだけで誰でも使えるみたいなところで公開されて、
音声合成AIと長時間音楽生成AI
よりチャットGPTを触ってみたいっていう人でもすごくアクセスしやすい感じになった感じですね。
そうですね。チャットGPT以外にもいろいろサービスあるんですけど、
オープンログインしないとなかなか使えないものが多い中で、
誰でも使える。一応国に制限は多少あったと思うんですが、
ほぼほぼどこの誰でも使えると。使える機能の制限もあったりはするんですが、
まずは試してみたいっていうところが本当に容易になったなっていう感じですよね。
Google検索と同じような感じでブラウザを開いて使えるという感じですね。
これが一つ大きな内容ではあるんですが、
オープンAIさんは今週というかこの1週間でいくつか大きなのがあったんですが、
その中の一つとして音声合成AIっていうものがオープンAIから発表というか、
公開はされてないんですがアナウンスがあったと。
多言語対応でしゃべることができて15秒程度のサンプルを渡すと、
その声を模したクローンみたいな形ですね。
抑揚だとか音程だとか本人に似たような音声モデルが作れる。
ただ一般公開はされてないんですがかなりの精度が出そうだぞということで話題となっておりましたね。
そうですね。15秒ぐらいの音声データでその人の音声を再現まではいかなくても
かなり似てるところを作れるっていうところで、
やっぱりこういうのをやるとフェイクなんちゃらじゃないですけど、
本人を悪用しやすい形でしかもほんの短いようなデータから悪用ができてしまうっていうのは非常にまずかったりするので、
本当に発表という形で公開はされてないんですけど、
こういう技術に取り組んでます。実際使ってますみたいなところの発表なので、
今後その辺の部分がどういうふうに変わっていくのかっていうところはちょっと興味深いですよね。
そうですね。まさに今も触れられてましたけど、選挙以外もそうなんですけど、
フェイク音声による被害っていうのを今後利用が簡単になるにつれてより容易になってくるので、
そこの対策も踏まえながら徐々に徐々に対策を講じてリリースされてくるのかなと。
ただ技術としてはすごく面白くて、サンプルの音声っていうのがOpenAIのブログかな、公式ウェブとかで見れたりするんですが、
新しいAIモデル「Jamba」の特徴
実際に本人の声を再現するっていうのもありますし、しゃべった音声を翻訳するみたいな使い方もできるんですよね。
もともと去年のワイルドアプリのOpenAIのGPTとかだと音声でしゃべってくれる機能とかがあって、
読み上げ自体はもともと使えたりしていて、その時も結構精度高いなとは思っていたんですが、
実際に公開された短いサンプルですけど、かなり優秀な精度を誇っているなと確認できるので、
興味ある方は見てもらうといいのかなと。
ただ実際まだわかんないんですけど、日本語はちょっと難しいなっていうのはあったりしましたね。
読み方とか漢字とか入ってくるとなかなか難しいのであれなんですけど、
ちょっとこの辺は要チェックというか、期待して見ていきたいなというところですね。
そのOpenAIが音声系のものがあったので、もう一つ音声系の話をすると、
これStable Audioっていう2.0か、AIによって3分ぐらい、今までと比較するとかなり長い時間の音楽が作成できるような
ものが登場したというのもなかなか興味深いニュースでしたね。
そうですね。この辺は結構ババドノさんはいろいろ音楽作成を、割とAIを使ってやってみてると思うんですけど、
これは使ってみたりしましたか?
これそうですね。実はログイン登録は確か必要なんですけど、無料で10曲作ることが可能なんですね。
実際に僕も作ってみたんですが、なかなか高音質というか、高音質というかあまり違和感が少ないというか、
どうしても本物かと言われると何とも言えないところはあるんですが、
ここまでのクオリティのものがこんだけ長時間できるんだ。
しかも3分という時間の中で、最初のイントロから盛り上げのパートで閉じていく部分みたいなところもしっかりできていて、
すごいなという感じに思うレベルにはできていた感じですね。
結構、割と十分なクオリティに達しているということなんですね。
そうですね。これもともと音声を生成する元となっているサイトが商用オッケーになったかな。
ライセンスフリーの音源を学習元として使っていたりするので、そこの影響にもよるんでしょうけど、
割と得意な音楽、そうじゃないのも多少ありそうだなというのもありつつも、なかなか使えそうだなという感じですね。
ただ、単純な音楽の質、音質というかクオリティ的な話でいくと、
先週しゃべったのかな、SU-AIという音声のほうがクオリティとしては高いかなという感じですけど、
十分な音質は保たれているかなという感じですね。
なるほど。また今回は、著作権侵害の防止技術も搭載してきているみたいなところがあって、
どうしても生成AIの場合そういう場所が気になるみたいなところはあって、
そういう技術もイタチごっこかもしれないんですけど、どんどん取り入れながら、
より良い権利的には問題ない、かつAIがクリエイティブなものを作ったりサポートするみたいなところにも、
どんどん問題ないAIを作成するというところにも、
徐々に力がいろいろな会社がしてきているなというところを感じさせられるようなプレスリリースでしたね。
そうですね。実際、他のニュースとしても取り上げる内容ではあるんですけど、
音楽の生成ツール、AIの学習に自分たちの声だったり曲が使われることに対して、
なかなか懸念を示すというようなアーティストの署名とかいうのも実際されていてですね、
そこがないと多分開発していく側もなかなか取り組みが認められないとか、
訴訟問題とか発展してきたりすると思うので、先ほど言われた通りイタチごっこになるとは思うんですが、
ちゃんとクリアに共存できるというか、という形でAIの発展というのが促されていかざるを得ないのかなというような感じだと思ったりしてますね。
ニュースとしては大体その辺が大きなところで、残り2つはですね、先週もちょっと話題にだけ出したんですが、
新しいAIのモデルが出てきたよっていう話ではあるんですが、
DBRXのデータブリックスっていうところが出したモデルと、読み方多分Jambaであってると思うんですけど、
というモデルが出てきましたよっていうのは引き続き今週も取り上げられておりましたと。
せっかくなのであんまり技術的なところは普段話せないんですが、Jambaの方はちょっと変わっているので、
軽くだけ触れておくと、いわゆる一番有名なJabとGPTとか、LLMってTransformerっていうアーキテクチャを基本使っているんですが、
このJambaっていうものに関して言うと、別のハイブリッドモデルっていうんですかね、
今までとは違うアーキテクチャを採用することによって、たくさんの文字、トークンが処理できるとか、
メモリの消費が少なかったりだとか、品質も良かったりだとか、速さもなかなか良かったりとか、
いろいろと今までとは根本のところが結構異なっているというので、なかなか取り出されているというような感じですね。
なるほど。僕はあんまり根本のところそんな変わってないのかなとは思ったりはしてるんですけど、
いろいろそのところは話題になってきたってところですかね。
そうですね。論文とかで出てきたものを実装してっていうような感じなので、
知られてはいるんだけれども、そういったものを活用して初めてできたっていうところで、なかなか盛り上がっていたという感じですね。
細かいところは本当に細かいので、実際の興味ある方はブログとか論文とか読んでみてもらえるといいかなと思います。
では今日はというか今週はそんなところでニュースは全部読み終えたかなと思いますので、
今週はこれにて終わりたいと思います。また来週もまとめて発表していく予定ですので、
よければまたご視聴ください。では締めの挨拶を入れて終わります。
それでは次回の放送をお楽しみに。バイバイ。
12:17

コメント

スクロール