1. rel.ax
  2. #12 Adobeの画像革命、Google..
2023-10-13 17:42

#12 Adobeの画像革命、Googleの教育プレイ、そして言語の壁を超える11Lab

bbz
bbz
Host

ポッドキャスト第12回目の紹介 1. AmazonのAWSが提供しているBedrockというサービスに関する話題が続いている。 2. GoogleのアシスタントウィズバードがAndroidとiOS向けにリリースされ、機能が統合されている。 3. Adobe Illustratorに生成AIが組み込まれ、ベクター画像の修正が容易になった。 4. Googleが無料の機械学習教材を提供しており、ゲーム感覚で学習が進められる。 5. オープンAIが独自のAIチップの開発を検討している。 6. オープンAIがAPIコストの削減やGPT-4Vの提供を予告している。 7. 11Labが音声を別の言語に翻訳するサービスを提供しており、言語の壁をなくすことができる。

その他

OpenAIが2023年11月に開発者向けの大規模なアップデートを実施か https://gigazine.net/news/20231012-openai-major-updates/ ElevenLabs Launches Voice Translation Tool to Break Down Language Barriers for Content https://elevenlabs.io/blog/elevenlabs-launches-voice-translation-tool-to-break-down-language-barriers-for-content/


※ タイトルや概要は AI にて生成させています。

放送で紹介されたニュースへのリンク

https://ainewsdev.substack.com/weekly-ai-news-12


放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。

サマリー

今回のエピソードでは、AIが日本語のメッセージを英語に変換する11Labsのサービスや、Googleの教育プレイゲーム、そしてAdobe IllustratorのベクターグラフィックへのAI生成機能の追加についてお話ししています。また、オープンAIはAPIコストを下げるアップデートを予告し、GPT-4VのAPI提供も話題です。さらに、11Labは音声翻訳サービスを提供し、言語の壁をなくす取り組みを行っています。

言語の変換サービス11Labs
はい、というわけで、ちょっと何言ってるかわからないかもしれないですけれども、
12回目のリラックス始めたいと思います。よろしくお願いします。
今回はまた、babazonさんのこの声を英語で発音させるみたいなAIで、冒頭のメッセージは伝えた感じですかね。
いやー、そうなんですよ。ちょっと時間があれば、最後にまたお話ししようと思うんですけど、今週かな?
11Labsっていう、最近結構使っているところがですね、言語の変換をしてくれるっていうサービスがありまして、今回しゃべったメッセージはですね、先週流した日本語のメッセージを英語に変換してってお願いして、変換してもらったんですよね。
なので、なんていうか、僕は一切英語をしゃべっていないのに、英語の文章が発音されてしまったっていう、個人的には結構すごいことなので、時間があったら後でしゃべろうと思います。
面白いですね。この辺の夢を膨らませていくとね、もう1人がしゃべるだけで同時通訳して、その人の音声でリアルタイムでみたいな未来も必ず来るだろうな、みたいな夢が広がってきそうですね。
そうですね。ちょっとSFに近づいたなっていうところで。
じゃあ、本題に入っていきますか。
そうですね。じゃあ、今週の1週間分のニュースをまたしゃべっていきたいと思います。ちょっとお待ちくださいね。
はい、ではまずはですね、先週に引き続きではあるんですけれども、Amazon、AWSが提供しているRedRockっていうサービス、これについての話題ニュースが結構多く引き続き出ていましたねっていうところが1つですね。
そうですね。結構その大きいというか、AWSでいろいろSAI、LLMが動くっていうところで、実際今週はそれを使って何かをやってみたとか、こういうものを作ってみたよっていう関連の記事が多かったので、また引き続き話題を賑わせてたなという感じですね。この辺は先週も話したんで、次に行きますか。
そうですね。不興味あればPodcastのリンクとかにも概要がありますんでっていうところで、次に行きたいと思います。
はい。で、次はですね、先週もこれちょろっと話してはいたんですけど、主にはAssistant with Birdっていう、Googleが出しているBirdっていうAIですね。これがAndroidとiOS向けに出されて、いろんな機能を統合してアシスタントとして活用できるようになったよっていうのがニュースとしては結構出てましたねっていうところですね。
そうですね。これも結構先週に引き続きみたいな話題だったので、ちょっとさらっと流していきますか。
そうですね。この機能を使うのに最適と言われているPixelの新しいAndroidですね、スマートフォン。今週発売されたので、また引き続き見ようかなと思いますので。
それは出たら出たで、またお話ししたいと思います。
次が多分今週の本命かと思うんですけど、Adobeですね。AdobeといえばあのAdobeなんですけど、イラストレーターに新しい機能ができましたよっていうのがかなり大きな話かなと思っております。
レキストから画像を生成するっていうところで、僕個人としてはそんなに他の画像生成と違わないのかなって思ってたんですけど、Adobeを使っている人にはすごく刺さる内容なのかなと思って見てたんですけど、セコンさんとか結構使われてたりするんですかね。
そうですね、僕は全然そうですねと言ったんですけど使ってはいないんですけど、今回そのAdobe MAX2023というイベントが発表された中で、Adobeは結構生成系AIの機能、例えばGenerics塗りつぶしみたいな、なんかこう塗りつぶしたところに指摘したプロンプトでパッと絵が現れるとか、いろんなもう機能をPhotoshop内部等々に入れていったんですけど、今回はこのAdobe Illustratorっていういわゆるベクターを使ってそのイラストを書くっていうツールに関して、
生成AIが乗るぞっていうところがすごく衝撃的で、それがすごく大きな話題でしたと。これ何がとりわけすごいかっていうと、今までのイラストってもう1枚の画像がポンって出来上がる、もしくはその画像を使って何かが保管されるみたいなのが多かったんですけど、
このベクターグラフィックっていうのは、いわゆるその生成されたものが自分自身で簡単に修正が可能なんですよね。ベクターっていういわゆる点と点を結んだような線データで構成されていたりするので、そうすると、例えば人の顔がパンとその生成AIが生成してくれたよっていったときに、顔の輪郭をもうちょっとシュッとさせたいみたいなときに、もちろんプロンプトに命令することでシュッとさせることもできるんですけど、
自分自身で簡単にそのベクターの点とかを少しいじるだけで思い通りに修正できるとか、その生成したベクターって主に点で構成されているので、そこをコピペすると本当に人の顔が生成されたんだけど、この人のイヤリングめちゃくちゃいいから、このイヤリングの部分のデータだけ使いたいなって思ったら、そこを範囲選択して他にコピーするみたいなものも非常に簡単にできたりですとか、本当にそういうところで使い勝手がすごく今回の生成っていうのは、
いわゆる二次、普通のJPEGとかPNGとかに出力されるようなイラストデータと、また違ったものを各形式で出力されるようになったので、これは非常に使い勝手が高いなみたいなところを感じましたね。
Adobe IllustratorへのAI生成機能の追加
何かしらの素材とかにいうような機能なのかなって思ったんですけど、適当なプロンプトを入れて、ちょっとした小物っていうんですかね、オブジェクトを作って、生成もさらに容易、しかもイラストデータから使える、これはすごく便利っていうようなイメージですかね。
そうですね、イラストデータは引き続き積極的にこのベクター画像、ベクトル画像を作るときにはずっと利用されてきたものなので、そこがすごく生成AIによって強化されたっていうのはすごいなというところがあったりですとか、あとはやはりこういうものって普段使い勝手のツールに乗ってくる生成AIが何か機能を拡張するっていうと、いきなり使い勝手が上がったりするんですよね。
こういうアプローチをしている会社さんってたくさんあったりはするんですけど、やっぱりそれ用のブラウザーでログインして、それ用のアプリで使わなくてはならないとなると、やっぱりひと手間、二手間かかったりするんですけど、このイラストデータに乗ると、じゃあ今までイラストデータを使っていた方も本当にほぼ何もしなくてもツール上ですぐに利用ができるっていうのは、やっぱり生成AIを活用するっていうところでは、自分たちが日々触れてるものから利用できるようになると、グッと使い勝手も高いよなと思わせるような出来のデモでした。
実際に僕はまだ使ってないですけど、デザイナーさんとかよく多分使われると思うので、ちょっと感想を楽しみにしたいと思っておりますっていうのが、このAdobeについてなんですが、表題としてはイラストデータに機能追加されたよっていうのもあるんですけど、以前から画像生成でサービスとして提供されていたFireflyというバージョンがあって、生成される画像の質も上がったよっていうのも合わせてアナウンスされてましたね。
そうですね。どんどんどんどんAdobeも生成AI、本当にこの辺の分野の進化って日進月歩なんで、どんどんどんどん素早く進化していってるなという感じですよね。
そうですね。ちょっと本当に目が離せないというか、やっぱりさすがAdobeさんっていう感じで引き続き見ていきたいなと思っております。
次のニュースなんですが、これさほど騒がれたかというと何とも言えないところではあるんですが、Googleさんがですね、無料の機械学習というより生成系AIなのかな、AIツールの学習ができるゲームっぽい要素のある教材を出したっていうのがちょっと話題になってましたね。
そうですね。なんかこの辺はやっぱりどういうふうに教育にゲームエミュレーションを取り入れていくかっていうところで、いろいろなチュートリアルだとかドキュメント動画ってたくさん出てるんですけど、いろんなアプローチの一つとして、
ゲームっぽい感じでどんどんどんどん学んでいく楽しさっていうのが加わることで、それがモチベーションになって学習ができるっていうところもできると思うので、
そういうところをGoogleが出しているゲームエミュレーションも含めた、いろいろゲーム感覚でどんどん学習が進んでいくっていうアプローチはまたこれすごい新しいなと思って見てた感じですね。
ちなみにこれ実際体験してみたんですけど、この記事って割と開いてみるとシューティングゲームっぽい画面が出てきて、なんか本当にゲームするのかなみたいな、そんな期待を抱かされる画像なんですけど、
実際入ってみると割と普通のドキュメントとポチポチ答えていくみたいな内容だったので、そこまでゲーム性はないんですけど、内容はすごいしっかりしていて、
Googleが持っているサービスについてこういうふうに使うと、こういうふうなAIを使った生成物ができますよっていうのも実際に手を動かしながら体験できる。
正解していくとポイントが溜まるっていうのは本当によくできたのだなと思っているので、興味のある方はぜひ無料なので触っていただけるといいかなと思います。
ゲーミケーションの部分はポイントが溜まっていくよみたいなところであって、教材自体は結構テキストベースのしっかりとした教材みたいな感じなんですね。
そうですそうです。
ご本家書的っていうとちょっとあれですけど、読みやすくはなっているんですけど、そこまでゲーム感覚ではないですね。
なるほどなるほど。
次の話題に行きましょうか。
そうですね。次に関しては、チャットGPっておなじみオープンAIさんですね。こちらが独自のAIチップの開発を検討しているっていうところがお題になったかなっていうところですね。
そうですね。
関しては、オープンAIに限らずっていうところではあると思うんですけど、やっぱり積極AIというかAIを主軸においている会社さんは各社独自で進めていて、オープンAIもそうだよねっていう流れになってるのかなという感じですかね。
そうですね。この辺のところはチップの中でもこういうのって学習に特化しているのか推論に特化しているのかみたいなところも結構興味深かったりはするんですけど、その推論に特化していると実際学習っていうのは1回やってしまえば終わり。もちろんその学習にも非常にそのいろいろなその半導体が必要になってくる半導体パワーが必要になってくるんですけど、1回やれば終わりっていうところで結構推論に向けて特化して作っているのかなと個人的には思ったりしていますね。
他社ですとGoogleとかがTPUって呼ばれるエンサープロセッサーユニットみたいなところの半導体はもう早くから作っているみたいなところが各社独自に先に作っているっていうところがあったりしていたりするんで、オープンAIもそこら辺どういうアプローチでやってくるのかなっていうのは非常に関心があったり、そのエンドユーザー、自分がオープンAIを使う側としては、そのより安価にその電力消費が少ない半導体が出回っていくと、じゃあ実際にGPT4のその利用価格が下がったりみたいなところがあったりするんですね。
上がったりみたいなところでもずっとその自分たちのところに影響が出ると思うので、いい形でどんどん進んでいくと嬉しいですよね。
そうですね、やっぱり今だとNVIDIAさんとかがかなり一挙みたいな、一挙はいずれかな、ところがあるので、そこが今後いろんなところが競争して、よりいいものがより安く提供されるようになってくるといいなっていうところですよね。
そうですね、ちょっと補足すると機械学習の視点だとNVIDIAが作っているGPUだとCUDAっていうGPUをプログラマから扱いやすくするライブラリっていうのが、すごくそのいろんな機械学習のコアになっているっていうところもあって、実質割と未だに一挙状態ではあるっていうところがどんどん変わっていくと、それはそれで利用者態度としても嬉しかったりするので、どんどんこういう分野での進化が楽しみなところですね。
そうですね、そこにはちょっと時間がかかると思いますけど、すごく期待を持てるなっていうところで落ち着いていきたいと思います。
ここまでがですね、AIが1週間分のネット記事とかを集めてピックアップしたニュースなんですが、それ以外にもいくつか興味深いのがあったので紹介していきたいと思います。
オープンAIのアップデート
まず1つ、これはかなり出回っていてにぎわっていたニュースなんですが、オープンAIさんですね。もともと11月に何かしらアップデートあるよっていうアナウンス自体はしてたんですけど、内容は全然まだ明かされていなくて、一部の筋の話ではおそらくAPIコストが下がったりだとか、
最近出た画像を認識するGPT-4VっていうのをAPIが提供されるとか、その辺になるんじゃないかなということで結構にぎわってたっていうのがニュースですね。
そうですね、基本なんかこうね、自分たちが利用者サイドとしては基本嬉しい発表にはなると思うので、どんなものがつくか楽しみですね。
そうですね、もう今月だけでも新しい機能提供でお祭り状態だったので、来月にまた出てきて一体どうなるんだみたいな感じですごく期待もありつつも、なんか今こうちょっとGPTのワークショップとかしてる人は結構大変そうだなって思いながら見てますね。
そうですね、あとはエンジニアサイドからするとAPIでできることが広がると本当にGPT-4VとかもAPIから叩けるだけでまた利用用途ってグーッと広がると思うので、そういうところもいつ来るんだ、いつ来るんだと待ち望んでたりするんで、発表に含まれるといいなと思ってたりしてます。
はい、あと1ヶ月ほどなのでちょっと期待しながら待ちたいと思いますというところで。
あと次はですね、今日冒頭のメッセージですね、AIに喋らせた音声でもちょっと触れたんですけど、11Labっていうところがですね、音声を別の言語に翻訳、変換して喋ってくれるサービスを出したというのがありまして、個人的に非常に衝撃だったのでちょっと取り上げさせてもらいますと。
何がすごいかっていうと、単純にその音声の変換っていうだけでもすごいんですけど、結構手軽に使えるようになってまして、どういうことかっていうと、既存の動画、手持ちの動画をアップロードして、それをもう単純に他の言語に翻訳することもできるんですけど、
YouTubeとかTwitterという動画の連携先のURLを指定すると、そこから翻訳して別の言語で出してくれる、そんな機能を提供していてですね、言語の壁をなくすみたいなことも歌っているだけあってですね、今まで結構英語の動画とか見たいんだけどなかなか理解するのが難しいみたいなところがですね、
だんだんと境界性がなくなってきているなっていうのを実感できる機能で、すごく個人的にはエキサイティングしているような内容なんですね。
この辺もやっぱりこういう使い勝手の良さのセットみたいなところもすごくあるなと思っていて、難しい技術を難しい方法しないと使えないっていうより、本当に簡単に手軽に自分の動画をアップロードするだけで、それで学習してくれてみたいなところの、いろいろそのユースケースにあった手軽さみたいなところもすごい良さそうですね。
そうですね。これに関して言うと、ひょっとすると無料プランじゃできなかったかもしれないんですが、最小プランだと月額、今なら1ドルでできるので、もしよかったらお試しいただければなと思ったりしております。
ということで、大体20分ぐらいしゃべったかなというところで、ニュースも大体出てきたので、私はこれぐらいで終わろうかなと思っております。また来週も同じようにですね、週刊分のニュースをお届けできればなと思いますので、またご期待いただければと思います。
では、いつも通りまた最後の締めの音声をしゃべってもらって終わりたいと思います。
はい。
それでは次回の放送お楽しみに。バイバイ。
17:42

コメント

スクロール