#25 Hugging FaceとGoogle Cloudの提携、電力消費問題、マイクロソフトのAI画像騒動
ポッドキャスト第25回目の紹介 まず、先週に引き続き、Chat GPTのアップデートについて話しました。特に注目されたのは、エンベティングスモデルという検索に関連する新しいモデルです。このモデルは、文章が特定の質問に似ているかどうかを判定するために使用されます。また、チャットGPTの問いかけに対して過去の会話履歴から似たものを探し、回答を提案することもできます。このモデルは、性能が向上し、価格も安くなったため、話題となりました。次に、Google ChromeにAI機能が追加されることを紹介しました。これにより、タブの整理やメールの作成などが自動化されます。また、AIの開発プラットフォームとクラウドサービスがパートナーシップを結び、Hugging FaceとGoogle Cloudが連携することで、AIモデルの利用が容易になりました。Hugging Faceは、機械学習モデルを公開しているプラットフォームであり、Google Cloudとの連携により、AI用のコンピューティングリソースが利用しやすくなりました。さらに、データセンターの電力消費量が増加することが予測されており、AIの普及による電力需要の増加が問題となっています。そのため、電力の生産方法や消費の抑制が注目されています。また、マイクロソフトの画像生成AIであるマイクロソフトデザイナーがリリースされ、有名人のフェイク画像が出回るなどの問題が発生しました。さらに、AIを活用したゲームのリリースが増えており、既に150以上のタイトルが存在します。最後に、Googleの提供するBirdというサービスが日本語に対応し、情報の信憑性を確認する機能が追加されました。 タイトルや要約は AI で生成しています。 放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
#24 ChromeのAI革新からザッカーバーグのAGI計画まで:AI業界の最前線
ポッドキャスト第24回目の紹介 ## Google ChromeのAI機能- GoogleがAI機能を搭載したブラウザ「Chrome」を発表した。- AI機能には、タブのグループ化や背景画像の作成、メールのドラフト作成などが含まれる。- AI機能はまだ日本では利用できないが、注目を集めている。## AIの品質向上と画像学習の保護策- AIの品質向上に関する取り組みが行われている。- AIが意図しない画像を学習することを防ぐための技術サービスが登場している。- これにより、個人のデータが学習に使用されることを防ぐことができる。## AGIの開発とオープンソース化- マーク・ザッカー・バーグ氏がAGIの開発とオープンソース化を発表した。- 新しいAIモデルの登場により、2024年頃にはより使いやすく、無料で利用できるAIが登場する可能性がある。## AI開発に必要なリソース- AI開発には計算リソースが必要である。- 効果力ファインなどの計算リソースを提供するサービスが登場している。- さくらインターネットが提供するサービスは、月額料金がかかるが、使いやすいと評判である。 放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
#23 マイクロソフト365の個人使用、数学オリンピック問題の解決、そして芥川賞受賞作品
ポッドキャスト第23回目の紹介 1. マイクロソフトの365サービスが個人利用可能になったこと2. AIの進化が雇用に与える影響についてのIMFの発表3. AIが国際数学オリンピックレベルの問題を解けるようになったこと4. Googleアシスタントの不人気な機能の配信5. AIを活用した作品が芥川賞を受賞したこと6. オープンAI社のチャットGPTの利用ポリシーの変更7. 東京で新しいAI企業が誕生し、資金調達に成功したこと ※ タイトルや概要は AI にて生成させています。 放送で紹介されたニュースへのリンク https://ainewsdev.substack.com/weekly-ai-news-26 その他 https://www.itmedia.co.jp/news/articles/2401/18/news090.html 放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
#22 AIが加速するゲーム開発の未来:素材生成からサイクル短縮への期待
ポッドキャスト第22回目の紹介 - AIの学習用の記事に対するライセンス料が話題になっている - ニューヨークタイムスがマイクロソフトやオープンAIを訴える訴訟が起きている - SteamがAI技術を使ったゲームの配信を開始した - AIを使ってゲームの素材を作ることが可能になり、開発のサイクルが早くなることが期待されている - AIが生成したものの著作権や問題性についての議論が起きている - 2024年のテック業界やAIの変化についての予想が多く出ている - オープンAIがGPTストアを開設し、新しい仕組みやチームプランを提供している - マイクロソフトがパソコンの標準キーボードにパイロットボタンを付ける可能性があるという話題がある - 大規模言語モデルを活用して数理科学問題に挑戦する取り組みが行われている。 - 数学者とのコラボレーションにより、問題の解決方法を導き出すことができる。 4. AIの学習データに関する問題 - AIの学習データには、自動虐待の疑いの画像など、問題のあるデータが含まれている可能性がある。 - 大量のデータをフィルタリングすることは難しく、AIの安全性に関する課題が浮き彫りになっている。 5. AIの著作権問題に関する話題 - 文化庁がAIの著作権問題についての案を提示し、検討が進んでいる。 - AIの学習データの利用には、ガイドラインや法律に沿った形で権利を守りつつ、発展に寄与する必要がある。 6. AIの制御に関する話題 - オープンAIが弱いAIモデルで強力なAIを制御するプロジェクトを進めている。 - AIが人間を超える場合、その制御方法についてのシミュレーションが行われている。 7. オープンAIの安全性向上に関する話題 - オープンAIがセキュリティに関する諮問グループを設立し、安全性の向上に取り組んでいる。 ※ タイトルや概要は AI にて生成させています。 放送で紹介されたニュースへのリンク https://ainewsdev.substack.com/weekly-ai-news-25 放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
#21 弱いAIが強いAIを制御?オープンAIが進める未来のシミュレーション
ポッドキャスト第21回目の紹介 1. GoogleのAIモデル「Bird」の話題 - 先週、Googleが新しいAIモデル「Bird」を発表し、その関連ニュースが続いている。 - Birdは日本語対応で、GoogleワークスペースやGmailと連携することができるようになった。 2. 音楽の生成AIの話題 - マイクロソフトのCopilotと連携するAIが、音楽の作曲などに活用されている。 3. 大規模言語モデルに関する話題 - 大規模言語モデルを活用して数理科学問題に挑戦する取り組みが行われている。 - 数学者とのコラボレーションにより、問題の解決方法を導き出すことができる。 4. AIの学習データに関する問題 - AIの学習データには、自動虐待の疑いの画像など、問題のあるデータが含まれている可能性がある。 - 大量のデータをフィルタリングすることは難しく、AIの安全性に関する課題が浮き彫りになっている。 5. AIの著作権問題に関する話題 - 文化庁がAIの著作権問題についての案を提示し、検討が進んでいる。 - AIの学習データの利用には、ガイドラインや法律に沿った形で権利を守りつつ、発展に寄与する必要がある。 6. AIの制御に関する話題 - オープンAIが弱いAIモデルで強力なAIを制御するプロジェクトを進めている。 - AIが人間を超える場合、その制御方法についてのシミュレーションが行われている。 7. オープンAIの安全性向上に関する話題 - オープンAIがセキュリティに関する諮問グループを設立し、安全性の向上に取り組んでいる。 ※ タイトルや概要は AI にて生成させています。 放送で紹介されたニュースへのリンク https://ainewsdev.substack.com/weekly-ai-news-22 放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
#20 AI作曲の新境地:SUNOのバージョンアップと日本語歌詞の可能性
ポッドキャスト第20回目の紹介 1. Googleの新しいモデル「ジェミニ」についての話題 - 先週にも取り上げられたが、今週も話題となっている。 - バードというGoogleのモデルについても触れられている。 - プレビュー版がリリースされ、APIから呼び出せるようになったことがニュースとして取り上げられている。2. AIの作曲サービス「SUNO」についての話題 - SUNOは以前から存在していたが、最近バージョンが上がり、より高精度なものが作れるようになった。 - 特に日本語の歌詞を含めた曲作りが可能で、人気がある。3. フランスのスタートアップ「ミストラルAI」についての話題 - ミストラルAIはフランスに拠点を置くスタートアップであり、AIのモデル「ミクストラル8X7B」が話題となっている。 - ミクストラル8X7BはGPT 3.5を超える性能を持っており、実力が評価されている。4. EUのAI規制法についての話題 - EUではAIの規制法が検討されており、AIの進化と悪用の防止、企業の独占を防ぐためのガイドラインが設けられる予定である。5. 脳細胞を使ったAIのシステムについての話題 - 人間の脳の細胞を使ってAIを動かすシステムが提案され、成功例が報告されている。 - まだ課題はあるが、今後の進展に期待が寄せられている。6. 自動化ツールによるパワーポイント作成サービスについての話題 - ユーザーローカルという企業が提供する自動化ツールにより、簡単にパワーポイントが作成できるようになった。 - テンプレートを埋めるだけで作成できるため、便利なツールとして注目されている。7. AWSのサービスに関する話題 - AWSのTranscribeとBedrockというサービスを組み合わせることで、音声の要約や自動生成が可能になった。 - クラウドのAIベンダーが自社のサービスを活用する方法を提案しており、AWSの例が紹介されている。 ※ タイトルや概要は AI にて生成させています。 放送で紹介されたニュースへのリンク https://ainewsdev.substack.com/weekly-ai-news-21 放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
#19 oogleが開くAIの新時代:情報収集のBird、高性能Gemini、そしてPixel 8への搭載
ポッドキャスト第19回目の紹介 - グーグルが提供しているAIのBirdというサービスについてのニュースが話題になっている。- Birdは情報収集に役立つとされており、ChatGPTとは異なる特徴を持っている。- Googleが新しいAIモデルGeminiを発表した。- Geminiは画像の読み込みや日本語の識別能力が高いとされている。- Geminiは将来的にさらに高性能なモデルが出る予定である。- GoogleのスマートフォンPixel 8にはGeminiの小さいモデルが搭載される予定であり、スマートフォンのユーザー体験が変わる可能性がある。- AIアライアンスというコミュニティが設立され、IBMやメタ社などが参加している。- AIアライアンスはAIの安全性に関するガイドラインを策定することを目指している。- マイクロソフトのAIシリーズであるコパイロットとオープンAIのGPT-4 Turboが統合される予定である。- オープンAIのサム・アルトマン氏の移動の騒動が話題になっている。- これらのニュースについては今後の動向に注目が集まっている。 ※ タイトルや概要は AI にて生成させています。 放送で紹介されたニュースへのリンク https://ainewsdev.substack.com/weekly-ai-news-20 放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
#18 AIの新たな星、Q-Starの登場とテクノロジー企業の最新動向
ポッドキャスト第18回目の紹介 - オープンAIが新しいQ-Starというものを開発しているとのニュースが話題になっている - マイクロソフトがCopilotというシリーズを公開し、Windowsでの使用が可能になった - AWSがAIの学習に特化した新しいプロセッサを作成し、学習コストの削減が期待されている - AWSが企業向けのAIチャットボット「Q」を発表し、簡単に作成できるサービスが提供される - GoogleのBirdサービスがYouTubeの動画を理解し、質問に答える機能が追加された - 画像生成技術が進化し、AIによるアニメーションや動画の作成が高品質かつ高速に行えるようになった - Stability AIがStable Diffusionという高速な画像生成モデルをリリースし、画像生成の速度と品質が向上した ※ タイトルや概要は AI にて生成させています。 放送で紹介されたニュースへのリンク https://ainewsdev.substack.com/weekly-ai-news-19 放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
#17 サム・アルトマンの激動の週末:解任から復帰までのオープンAI内部の戦い
ポッドキャスト第17回目の紹介 ## オープンAIのサム・アルトマンCEOの解任と復帰の騒動 - 2023年11月18日、オープンAIはサム・アルトマンCEOの解任と新たな算定CEOの任命を発表 - 同社の共同創業者兼社長のグレッグ・ブロックマン氏も退陣することに - 11月19日、アルトマン氏は復帰の話し合いを行ったが、結局うまくいかず - マイクロソフトがアルトマン氏とブロックマン氏をヘッドハントし、入社することをサティア・ナデラCEOがSNSに投稿 - 11月22日、オープンAIの社員たちがアルトマン氏が復帰しなければ退社する可能性があるとする署名した - 最終的にアルトマン氏がオープンAIに復帰 ## オープンAIの動向とAIの進化と安全性の関係 - オープンAIは非営利企業であり、AIの進化を追求している - 最近は他の企業がAIを取り扱うことが増えており、オープンAIは資金を投入してAIの進化を追いかけなければならない状況にある - その結果、AIの安全性よりもAIの進化が重視されるようになった可能性がある - オープンAIの委員会の役員たちは、アルトマン氏にAIの進化だけを急がせることで安全性がおろそかになるのではないかと懸念し、解任に至ったと言われている ## 日本っぽい画像を生成するジャパニーズスタイルディフュージョンモデルの登場 - 日本の言葉や文化に特化した画像生成AIモデルが登場 - これまでの画像生成モデルとは異なり、日本独自のスタイルや日本人の好みに合った画像を生成することができる - 商用利用も可能であり、日本系の何かを生成したい場合に活用できる ## テキストから動画を生成するモデルの登場 - テキストから動画を生成するモデルが開発された - Stable Video Diffusionと呼ばれるこのモデルは、テキストから自然な動画を作成することができる - これまでの試みとは異なり、Stability AI社の開発元が影響を与え、話題となっている ## 音楽生成モデルの進化 - マイクロソフトのAIモデルにより、高品質で自然な音楽が生成できるようになった - ユーザーがクリエイティビティを発揮し、AIがそれをより良い形にアレンジすることが可能になった ※ タイトルや概要は AI にて生成させています。 放送で紹介されたニュースへのリンク https://ainewsdev.substack.com/weekly-ai-news-18 放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
#16 MS Ignite 2023が描く未来:AIで変わる働き方と企業向けテクノロジーの最前線
ポッドキャスト第16回目の紹介 ## 天気予測プログラムについて - AIが10日間の天気を1分以内で予測できるモデルが開発された。 - ニュース記事を元に猫の声で喋るように変換され、音声に起こされている。 - 気象情報は非常に複雑で予測が難しいが、ニューラルネットワークを使用して過去の気象データを学習させることで、現在の状況と6時間前の状況を入力するだけで予測できるようになった。 - モデルの精度や信頼性にはまだ課題があるが、今後の進化が期待される。 ## 商用利用可能な日本語の言語モデルについて - 日本語の言語モデル「Eliza Japanese Code Llama」が開発された。 - 日本語のデータを学習させたバージョンで、プログラムのコードの生成や保管が可能になった。 - 日本語に特化したモデルの開発が進んでおり、日本独自のニーズに対応できるようになっている。 ## YouTubeの新しいルールについて - YouTubeがAIで作られた動画が本物に見える場合、クリエーターは視聴者にそのことを明示する必要がある。 - クリエーターが明示しない場合、動画が削除されたり、YouTubeのパートナープログラムから外される可能性がある。 - 自分の顔や声が勝手に使われた場合は、削除を要求することができる。 - すべての動画が消えるわけではなく、個別に審査される。 ## マイクロソフトのイベント「MS Ignite 2023」について - マイクロソフトが開催したイベントで、AIの進化によって働き方が変わることが紹介された。 - マイクロソフトのテクノロジーを活用して、仕事のやり方を変える最新の進歩が紹介された。 - エンタープライズ向けのプラットフォームが提供され、AIを活用したさまざまなことが可能になった。 ※ タイトルや概要は AI にて生成させています。 放送で紹介されたニュースへのリンク https://ainewsdev.substack.com/weekly-ai-news-17 放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。 途中の音声は OpenAI の Text to speech API で作成しています。 https://platform.openai.com/docs/guides/text-to-speech