なぜSuno AIは凄いのか?作曲AI60年の歴史を遡り、仕組みから著作権まで徹底解説 (ep.8)
Suno AIをはじめとする音楽生成AIは、どうやって人間が作ったような自然な曲を生み出しているのでしょうか?実は、AIによる作曲の試みは1960年代から続く長い歴史があります。現役AIエンジニアのしぶちょーが、音楽生成技術の進化の道のりを徹底解説。音楽理論を教え込む「ルールベース」から、生物の進化を真似た「遺伝的アルゴリズム」、そして現代のAI技術の根幹をなす「トランスフォーマー」や「拡散モデル」まで、その仕組みを分かりやすく紐解きます。特に、複雑な音楽データを効率的に扱う「潜在拡散モデル」の考え方は目からウロコ。最近話題の画像・動画生成AIとも共通する技術の核心を知れば、AIニュースの裏側がもっと面白く見えてくるはずです。【目次】(00:00) オープニング(00:37) 今回のテーマは「誰でも音楽クリエイター?音楽生成の仕組み」(03:32) Suno AIだけじゃない!最近流行りの音楽生成AIツールたち(05:09) なぜAIは曲を作れるの?作曲技術の進化の歴史を深掘り!(06:03) AI作曲の原点!1960年代の「ルールベース」時代とは?(09:06) 犬と猫を見分けるAI?ルールベースと機械学習の根本的な違い(13:32) 生物の進化を応用!?「遺伝的アルゴリズム」を使った作曲法(18:14) 次の音を予測するAIへ。「再帰型ニューラルネットワーク」の登場(23:31) 長い曲は作れない?短期記憶しかできないAIの限界(25:17) 救世主「トランスフォーマー」登場!AIの記憶力が劇的に向上(29:35) 2年前はこんなレベルだった?AIミュージックバトル「弁財天」(34:37) なぜ急に進化した?画像生成と同じ「拡散モデル」の衝撃(36:38) 音楽生成は画像より難しい?AIを賢くする「濃縮還元ジュース」理論(41:31) 現代の音楽生成AIを支える「潜在拡散モデル」とは(44:02) 今回のオチ:全てのAI進化は「2つの技術」につながっている(46:23) AIの脳みそは1つになる?「基盤モデル」とサービスの未来(50:46) Suno AIは訴訟中!?音楽生成AIの著作権と法的な問題(53:31) AIが作った曲は誰のもの?「創作」の定義と曖昧な線引き(58:15) 安心して使える!日本発のクリーンな音楽生成AI「Soundraw」(1:01:31) AI時代、人間の役割は?生成AIの使い手を超えるものは作れない(1:06:01) AIが優等生だからこそ、人間に「ぶっ飛んだ発想」が求められる(1:08:04) 人間とは何か?AIの進化が私たちに問いかける哲学的なテーマ(1:13:34) AIに魂を入れるということ。コピペで満足する人にならないために(1:16:16) エンディングトーク:腰を据えて学んで、魂を込めてこそ落ち着ける【今回の放送回に関連するリンク】(1)SunoAIhttps://suno.com/home(2)Stable Audio 2.5https://stableaudio.com/(3)SOUNDRAWhttps://soundraw.io/ja(4)AIミュージックバトル!『弁財天』https://benzaiten.studio.site/—----------------------------【番組の概要】日々のAIトピックを、現役のAIエンジニアがやさしく解説する対談番組。AIニュースに驚き疲れたあなたに、おちつきを提供します。AIニュースの、驚くポイント、驚かなくても良いポイントがわかります。★ご感想やコメントは、番組公式ハッシュタグをつけてX(旧Twitter)でポストしていただけるとありがたいです。【番組公式ハッシュタグ】#おちつきAI【番組公式X】https://x.com/ochitsuki_AI【パーソナリティ(MC)】▼しぶちょー・AIエンジニア・技術士(機械部門) 「大手機械メーカーでAI開発の最前線を担う現役エンジニア。AI(ディープラーニング)の実装スキルを証明する「E資格」を保有。機械(ハードウェア)への高度な知見も有し、双方の専門性を掛け合わせ『AIの社会実装』に貢献する。情報発信活動にも精力的に取り組み、ブログ・音声配信(Podcast/Voicy)・SNSなどで幅広く活躍。単なる技術解説でなく、行動変容を伴う情報発信を信条とする。その姿勢が評価され、2025年UJA科学広報賞 審査員特別賞を受賞。著書に『集まれ設計1年生 はじめての締結設計』(日刊工業新聞社)。岐阜県テクノプラザものづくり支援センター広報大使、生成AI EXPO in 東海 共同代表も務める。」https://x.com/sibucho_labohttps://voicy.jp/channel/3963▼かねりん(金田勇太)・KANERIN Podcast Studios 代表・一般社団法人 地方WEB3連携協会 理事「刑事司法実務の最前線で多数の犯罪捜査を指揮。2017年から暗号資産業界へ参入。数々のグローバルプロジェクトに参画しコンサルティング、情報分析・アドバイザリー業務を提供。コンサートライブ配信業、音声配信業、テックメディア創業等を経て、ポッドキャストレーベル兼プロダクション「KANERIN Podcast Studios」を創業。多様なパートナーと共に、未来へつなぐ声の原典を共創している。」https://x.com/kanerinxhttps://voicy.jp/channel/2534【プロデューサー】かねりん https://x.com/kanerinx【サウンド・アーキテクト】Aviv Haruta https://x.com/oji_pal【カバーアートデザイン】UTA https://x.com/uta_dib【制作/著作】KANERIN Podcast Studios--------------------------------------------------※画像引用元:【各種ポッドキャストスタンドへのリンク】Spotifyhttps://open.spotify.com/show/6iGk39bSta5KZ1QD7jvK2oApple Podcasthttps://podcasts.apple.com/us/podcast/id1841316430Amazon Musichttps://music.amazon.co.jp/podcasts/aba8e9a4-aefb-404a-b366-4b7a11b3f7cb/YouTubehttps://www.youtube.com/playlist?list=PLNQiF7XIko7QOIlyFMiI_aDdk1eJzNiCDLISTENhttps://listen.style/p/ochitsukiai
[10月14日:速報回]OpenAI DevDay/Gemini at Work/Opal/MCP開発入門/フィジカルAI(ep.7)
※収録日:10月13日深夜★今回の配信は、生成AIの最新トレンドをライトに紹介する『速報回』です。通常の『深掘り回』では1テーマをじっくり掘り下げていますが、速報回では即時性の高いネタをサラっと扱います。【目次】(00:00) 最新AIトレンドを速報でお届け!(01:17) 【速報1】OpenAI DevDay開催!何が発表された?(02:52) ChatGPT上でアプリが動く!SpotifyもAmazonも連携可能に(05:11) AIが秘書になる時代へ。エージェントAIがもたらす生活の変化(09:36) 【速報2】Gemini at Work開催!Googleの企業向け新戦略(12:41) 企業向けAIの覇権争い!Microsoft(OpenAI) vs Google(19:06) AI時代、自分のデータはどう蓄積すべき?Notionかポッドキャストか(22:44) 体重や血圧もAIの餌に?健康データをChatGPTで分析してみた話(28:02) 【速報1の続き】AIエージェントを自作できる「エージェントキット」(29:26) プロンプト攻撃を防ぐ「ガードレール」機能とは?おばあちゃん構文のハック事例(38:31) 【速報3】新刊『PythonではじめるMCP開発入門』が話題(39:21) AI界のUSB Type-C?重要概念「MCP」をやさしく解説(44:09) 【速報4】バズワード「フィジカルAI」って、落ち着いて聞いていいやつ?(45:49) 過度な期待は禁物?フィジカルAIに感じる「ブロックチェーン味」(49:15) Sora 2は物理法則を理解している?世界モデルとフィジカルAIの関係(57:02) エンディングトーク|MCPとフィジカルAIは要チェック!【今回取り上げたトピックまとめ】(1) OpenAI DevDay 2025 開催https://openai.com/devday/(2)Gemini at Work 2025 開催https://www.youtube.com/live/uLHF9T1SLrU(3)プログラミング不要のAIミニアプリ開発ツール「Opal」https://www.youtube.com/watch?v=g9RBGnz-vqk(4)書籍「PythonではじめるMCP開発入門」販売開始https://amzn.to/48sty3l(5)フィジカルAIというトレンドワードについてhttps://www.itmedia.co.jp/aiplus/articles/2510/01/news013.html—----------------------------【番組の概要】日々のAIトピックを、現役のAIエンジニアがやさしく解説する対談番組。AIニュースに驚き疲れたあなたに、おちつきを提供します。AIニュースの、驚くポイント、驚かなくても良いポイントがわかります。★ご感想やコメントは、番組公式ハッシュタグをつけてX(旧Twitter)でポストしていただけるとありがたいです。【番組公式ハッシュタグ】#おちつきAI【番組公式X】https://x.com/ochitsuki_AI【パーソナリティ(MC)】▼しぶちょー・AIエンジニア・技術士(機械部門) 「大手機械メーカーでAI開発の最前線を担う現役エンジニア。AI(ディープラーニング)の実装スキルを証明する「E資格」を保有。機械(ハードウェア)への高度な知見も有し、双方の専門性を掛け合わせ『AIの社会実装』に貢献する。情報発信活動にも精力的に取り組み、ブログ・音声配信(Podcast/Voicy)・SNSなどで幅広く活躍。単なる技術解説でなく、行動変容を伴う情報発信を信条とする。その姿勢が評価され、2025年UJA科学広報賞 審査員特別賞を受賞。著書に『集まれ設計1年生 はじめての締結設計』(日刊工業新聞社)。岐阜県テクノプラザものづくり支援センター広報大使、生成AI EXPO in 東海 共同代表も務める。」https://x.com/sibucho_labohttps://voicy.jp/channel/3963▼かねりん(金田勇太)・KANERIN Podcast Studios 代表・一般社団法人 地方WEB3連携協会 理事「刑事司法実務の最前線で多数の犯罪捜査を指揮。2017年から暗号資産業界へ参入。数々のグローバルプロジェクトに参画しコンサルティング、情報分析・アドバイザリー業務を提供。コンサートライブ配信業、音声配信業、テックメディア創業等を経て、ポッドキャストレーベル兼プロダクション「KANERIN Podcast Studios」を創業。多様なパートナーと共に、未来へつなぐ声の原典を共創している。」https://x.com/kanerinxhttps://voicy.jp/channel/2534【プロデューサー】かねりん https://x.com/kanerinx【サウンド・アーキテクト】Aviv Haruta https://x.com/oji_pal【カバーアートデザイン】UTA https://x.com/uta_dib【制作/著作】KANERIN Podcast Studios--------------------------------------------------※画像引用元:https://cloudonair.withgoogle.com/gemini-at-work-25-dach【各種ポッドキャストスタンドへのリンク】Spotifyhttps://open.spotify.com/show/6iGk39bSta5KZ1QD7jvK2oApple Podcasthttps://podcasts.apple.com/us/podcast/id1841316430Amazon Musichttps://music.amazon.co.jp/podcasts/aba8e9a4-aefb-404a-b366-4b7a11b3f7cb/YouTubehttps://www.youtube.com/playlist?list=PLNQiF7XIko7QOIlyFMiI_aDdk1eJzNiCDLISTENhttps://listen.style/p/ochitsukiai
Nano Banana超え?Seedream4.0で驚くべきポイントは言語間距離。(ep.6)
「Nano Bananaの次はこのAIだ!!」そんな驚き熱狂の渦中にある画像生成AI「Seedream4.0(シードリーム)」。でも本当にNano Bananaを超えるほど革新的なのかなぁ?実際に使ってみたかねりんは「正直、よく分からなかった…」とぶっちゃけます。しかししぶちょーは「ある理由で、Nano Bananaよりも断然使いやすい!」と語ります。その使いやすさの秘密は、開発元であるTikTok運営会社と、日本語と中国語の「言語間距離」という意外な関係に隠されていたのです。さらに今回は、画像生成AIの仕組みそのものにも迫ります。なぜ、意味不明なノイズから鮮明な画像が生まれるのか?その魔法の正体「拡散モデル」についても徹底解説。最新AIへの驚きに疲れたあなたへ。Seedream4.0の本当のすごさと、その技術的背景を理解して、確かな「おちつき」を手にしてください。【目次】(00:00) オープニング(00:37) 今回のテーマ「Nano Bananaを超えた?Seedream4.0」(01:31) AI業界で繰り返される「逆張り驚き」という現象とは?(03:07) AI素人かねりんの正直な感想「使ってみたけどよく分からなかった」(05:43) 実はNano Bananaより素直?Seedream4.0が持つ"使いやすさ"の特性(10:35) 開発元はTikTok運営会社!Seedream4.0の歴史を振り返る(13:13) 中国語ネイティブAIの強みとバージョンアップによる進化の過程(18:55) 日本人が使いやすい秘密は「言語間距離」に隠されていた?(21:30) 漢字がカギ?日本語と中国語の意外な関係性とAIの言語理解(28:07) 日本のAI開発の未来は?国産LLMの現在地と期待(34:03) 【AIの仕組み】画像生成AIの魔法の正体「拡散モデル」とは?(39:34) 画像を"壊しながら"学習する?拡散モデルの不思議なプロセス(43:35) 思い通りの画像を作るカギ「条件付き拡散モデル」を解説(47:08) Stable Diffusionが世界を変えた「潜在拡散モデル」の革新性(51:08) 学びのまとめと、知識がもたらす本当の「おちつき」(53:46) エンディング【今回の放送回に関連するリンク】・Seedreamhttps://seed.bytedance.com/en/seedream4_0・言語間距離https://www.mamelingual.com/2019/10/23/linguistic-distance/—----------------------------【番組の概要】日々のAIトピックを、現役のAIエンジニアがやさしく解説する対談番組。AIニュースに驚き疲れたあなたに、おちつきを提供します。AIニュースの、驚くポイント、驚かなくても良いポイントがわかります。★ご感想やコメントは、番組公式ハッシュタグをつけてX(旧Twitter)でポストしていただけるとありがたいです。【番組公式ハッシュタグ】#おちつきAI【番組公式X】https://x.com/ochitsuki_AI【パーソナリティ(MC)】▼しぶちょー・AIエンジニア・技術士(機械部門) 「大手機械メーカーでAI開発の最前線を担う現役エンジニア。AI(ディープラーニング)の実装スキルを証明する「E資格」を保有。機械(ハードウェア)への高度な知見も有し、双方の専門性を掛け合わせ『AIの社会実装』に貢献する。情報発信活動にも精力的に取り組み、ブログ・音声配信(Podcast/Voicy)・SNSなどで幅広く活躍。単なる技術解説でなく、行動変容を伴う情報発信を信条とする。その姿勢が評価され、2025年UJA科学広報賞 審査員特別賞を受賞。著書に『集まれ設計1年生 はじめての締結設計』(日刊工業新聞社)。岐阜県テクノプラザものづくり支援センター広報大使、生成AI EXPO in 東海 共同代表も務める。」https://x.com/sibucho_labohttps://voicy.jp/channel/3963▼かねりん(金田勇太)・KANERIN Podcast Studios 代表・一般社団法人 地方WEB3連携協会 理事「刑事司法実務の最前線で多数の犯罪捜査を指揮。2017年から暗号資産業界へ参入。数々のグローバルプロジェクトに参画しコンサルティング、情報分析・アドバイザリー業務を提供。コンサートライブ配信業、音声配信業、テックメディア創業等を経て、ポッドキャストレーベル兼プロダクション「KANERIN Podcast Studios」を創業。多様なパートナーと共に、未来へつなぐ声の原典を共創している。」https://x.com/kanerinxhttps://voicy.jp/channel/2534【プロデューサー】かねりん https://x.com/kanerinx【サウンド・アーキテクト】Aviv Haruta https://x.com/oji_pal【カバーアートデザイン】UTA https://x.com/uta_dib【制作/著作】KANERIN Podcast Studios--------------------------------------------------※画像引用元:https://seed.bytedance.com/en/seedream4_0【各種ポッドキャストスタンドへのリンク】Spotifyhttps://open.spotify.com/show/6iGk39bSta5KZ1QD7jvK2oApple Podcashttps://podcasts.apple.com/us/podcast/id1841316430Amazon Musichttps://music.amazon.co.jp/podcasts/aba8e9a4-aefb-404a-b366-4b7a11b3f7cb/YouTubehttps://www.youtube.com/playlist?list=PLNQiF7XIko7QOIlyFMiI_aDdk1eJzNiCDLISTENhttps://listen.style/p/ochitsukiai
[10月7日:速報回]動画生成Sora2の現状/AIブラウザCometの危険性/ハイプサイクル2025年版/Grok4ドスケベ/Claude Sonet4.5でゲーム作成(ep.5)
※収録日:2025.10.7★今回の配信は、生成AIの最新トレンドをライトに紹介する『速報回』です。通常の『深掘り回』では1テーマをじっくり掘り下げていますが、速報回では即時性の高いネタをサラっと扱います。【今回取り上げたトピック】(1) OpenAI 動画・音声生成モデル「Sora2」リリースhttps://openai.com/index/sora-2/(2)PerplexityのAIブラウザ「Comet」、全ユーザーが利用可能にhttps://www.itmedia.co.jp/news/articles/2510/03/news053.html(3)Gartner、2025年の日本における未来志向型インフラ・テクノロジのハイプ・サイクルを発表https://japan.zdnet.com/article/35238640/(4)Grok4のドスケベ動画生成が流石にヤバい件【生成AI】 - しぶちょーnotehttps://note.com/sibucho_labo/n/nb639084b46a9(5)しぶちょーがClaude Sonet 4.5で作った旋盤ゲームhttps://claude.ai/public/artifacts/82c8a8b6-fdad-4f41-8ace-6b2f98139c32(6)VPN使えば国制限関係なくなります(web3民かねりんの愛用はSurfshark)https://surfshark.club/friend/qM2zqxSR—----------------------------【番組の概要】日々のAIトピックを、現役のAIエンジニアがやさしく解説する対談番組。AIニュースに驚き疲れたあなたに、おちつきを提供します。AIニュースの、驚くポイント、驚かなくても良いポイントがわかります。★ご感想やコメントは、番組公式ハッシュタグをつけてX(旧Twitter)でポストしていただけるとありがたいです。【番組公式ハッシュタグ】#おちつきAI【番組公式X】https://x.com/ochitsuki_AI【パーソナリティ(MC)】▼しぶちょー・AIエンジニア・技術士(機械部門) 「大手機械メーカーでAI開発の最前線を担う現役エンジニア。AI(ディープラーニング)の実装スキルを証明する「E資格」を保有。機械(ハードウェア)への高度な知見も有し、双方の専門性を掛け合わせ『AIの社会実装』に貢献する。情報発信活動にも精力的に取り組み、ブログ・音声配信(Podcast/Voicy)・SNSなどで幅広く活躍。単なる技術解説でなく、行動変容を伴う情報発信を信条とする。その姿勢が評価され、2025年UJA科学広報賞 審査員特別賞を受賞。著書に『集まれ設計1年生 はじめての締結設計』(日刊工業新聞社)。岐阜県テクノプラザものづくり支援センター広報大使、生成AI EXPO in 東海 共同代表も務める。」https://x.com/sibucho_labohttps://voicy.jp/channel/3963▼かねりん(金田勇太)・KANERIN Podcast Studios 代表・一般社団法人 地方WEB3連携協会 理事「刑事司法実務の最前線で多数の犯罪捜査を指揮。2017年から暗号資産業界へ参入。数々のグローバルプロジェクトに参画しコンサルティング、情報分析・アドバイザリー業務を提供。コンサートライブ配信業、音声配信業、テックメディア創業等を経て、ポッドキャストレーベル兼プロダクション「KANERIN Podcast Studios」を創業。多様なパートナーと共に、未来へつなぐ声の原典を共創している。」https://x.com/kanerinxhttps://voicy.jp/channel/2534【プロデューサー】かねりん https://x.com/kanerinx【サウンド・アーキテクト】Aviv Haruta https://x.com/oji_pal【カバーアートデザイン】UTA https://x.com/uta_dib【制作/著作】KANERIN Podcast Studios--------------------------------------------------※画像引用元:https://aibreaking.org/blog/sora-2-openai-video/【各種ポッドキャストスタンドへのリンク】Spotifyhttps://open.spotify.com/show/6iGk39bSta5KZ1QD7jvK2oApple Podcasthttps://podcasts.apple.com/us/podcast/id1841316430Amazon Musichttps://music.amazon.co.jp/podcasts/aba8e9a4-aefb-404a-b366-4b7a11b3f7cb/YouTubehttps://www.youtube.com/playlist?list=PLNQiF7XIko7QOIlyFMiI_aDdk1eJzNiCDLISTENhttps://listen.style/p/ochitsukiai
[10月1日:速報回]Claude Sonnet 4.5/ChatGPT Pulse/音楽SunoAI/Dify協会設立/まじん式プロンプト凄い(ep.4)
※収録日:2025.9.30★今回の配信は、生成AIの最新トレンド軽くご紹介する、「ライト配信回」です。メインの配信では、1テーマをじっくり掘り下げる「ディープ配信回」であるのに対し、ライト配信回では最新トピックを速報的に軽くご紹介させていただく、というコンセプトの違いがあります。【今回取り上げたトピック】(1) Anthropic AIモデルの最新版「Claude Sonnet 4.5」を発表https://japan.zdnet.com/article/35238588/(2)音楽生成AI SunoAI MIDI出力に対応 https://www.techno-edge.net/article/2025/09/26/4614.html(3)ChatGPT新機能 Pulse(パルス)追加https://www.bloomberg.co.jp/news/articles/2025-09-29/T36C8BGP493B00(4)一般社団法人 Dify協会 設立発表https://prtimes.jp/main/html/rd/p/000000010.000166429.html(5)まじん式プロンプトが凄いhttps://note.com/majin_108/n/n11fc2f2190e9—----------------------------【番組の概要】日々のAIトピックを、現役のAIエンジニアがやさしく解説する対談番組。AIニュースに驚き疲れたあなたに、おちつきを提供します。AIニュースの、驚くポイント、驚かなくても良いポイントがわかります。★ご感想やコメントは、番組公式ハッシュタグをつけてX(旧Twitter)でポストしていただけるとありがたいです。【番組公式ハッシュタグ】#おちつきAI【番組公式X】https://x.com/ochitsuki_AI【パーソナリティ(MC)】▼しぶちょー・AIエンジニア・技術士(機械部門) 「大手機械メーカーでAI開発の最前線を担う現役エンジニア。AI(ディープラーニング)の実装スキルを証明する「E資格」を保有。機械(ハードウェア)への高度な知見も有し、双方の専門性を掛け合わせ『AIの社会実装』に貢献する。情報発信活動にも精力的に取り組み、ブログ・音声配信(Podcast/Voicy)・SNSなどで幅広く活躍。単なる技術解説でなく、行動変容を伴う情報発信を信条とする。その姿勢が評価され、2025年UJA科学広報賞 審査員特別賞を受賞。著書に『集まれ設計1年生 はじめての締結設計』(日刊工業新聞社)。岐阜県テクノプラザものづくり支援センター広報大使、生成AI EXPO in 東海 共同代表も務める。」https://x.com/sibucho_labohttps://voicy.jp/channel/3963▼かねりん(金田勇太)・KANERIN Podcast Studios 代表・一般社団法人 地方WEB3連携協会 理事「刑事司法実務の最前線で多数の犯罪捜査を指揮。2017年から暗号資産業界へ参入。数々のグローバルプロジェクトに参画しコンサルティング、情報分析・アドバイザリー業務を提供。コンサートライブ配信業、音声配信業、テックメディア創業等を経て、ポッドキャストレーベル兼プロダクション「KANERIN Podcast Studios」を創業。多様なパートナーと共に、未来へつなぐ声の原典を共創している。」https://x.com/kanerinxhttps://voicy.jp/channel/2534【プロデューサー】かねりん https://x.com/kanerinx【サウンド・アーキテクト】Aviv Haruta https://x.com/oji_pal【カバーアートデザイン】UTA https://x.com/uta_dib【制作/著作】KANERIN Podcast Studios--------------------------------------------------※画像引用元:https://japan.zdnet.com/article/35238588/【各種ポッドキャストスタンドへのリンク】Spotifyhttps://open.spotify.com/show/6iGk39bSta5KZ1QD7jvK2oApple Podcasthttps://podcasts.apple.com/us/podcast/id1841316430Amazon Musichttps://music.amazon.co.jp/podcasts/aba8e9a4-aefb-404a-b366-4b7a11b3f7cb/YouTubehttps://www.youtube.com/playlist?list=PLNQiF7XIko7QOIlyFMiI_aDdk1eJzNiCD
[9月30日]3Dモデルの民主化”Hitem3D” すごさの核心はAI自体じゃないんです(ep.3)
AIが3Dモデルを作る――その裏には、10年以上にわたる開発者たちの試行錯誤の物語がありました。今回のテーマは、話題の3D生成AI「Hitem3D」。このツールを支えるコア技術「Sparc3D」のすごさを、AIエンジニアしぶちょーが歴史を遡って解説します。すべては、立体をマインクラフトのようなブロックの塊で表現する「ボクセル」から始まりました。しかし、データ量が爆発する壁にぶつかり、次は形でなく「設計図(数式)」で表現する「インプリシット表現」が発明されます。それでも残った課題を乗り越えるため、開発者たちは再び原点に戻り…。まるで映画のような技術の進化のストーリーを知ると、AIニュースの見方がガラリと変わるはず。驚きの裏にある、ものづくりのロマンに触れるひとときをお届けします。【目次】(00:00) オープニング|なぜ画像から3Dモデルが生成できるのか?(00:56) 最近話題のAIツール「Hitem3D」とは?(02:35) 驚くべきクオリティ向上!過去の3D生成AIとの違い(04:12) 複数視点の画像で精度アップ!「nano banana」との最強コンボ(07:35) その驚き方、間違ってる?Hitem3Dの本当のすごさ(09:37) すごいのはAIじゃない!コア技術「Sparc3D」の正体(11:50) AIは3Dをどう理解する?マインクラフトみたいな「ボクセル」表現(19:34) データ量問題を解決した「インプリシット表現」という発明(24:23) 「伝言ゲーム」の限界。なぜ変換すると情報が劣化するのか?(26:08) 原点回帰と革新!「Sparc3D」のハイブリッドな発想(29:19) 必要なのは表面だけ?データ量を削減するスパースな考え方(35:08) 情報劣化を防ぐ専用パイプ!3DデータをAIに伝える仕組み(38:39) 結論:革新はAIの脳みそではなく「パイプライン」にあった(44:14) なぜ顔がゾンビに?かねりんがHitem3Dを実践レビュー(50:54) 3Dモデル生成技術の未来と「ものづくりの民主化」とは?(52:37) しぶちょーによる3Dプリンターの熱烈セールストーク(59:47) AIの進化を正しく理解すれば、もっと面白くなる!【今回の放送回に関連するリンク】Hitem3Dhttps://hitem3d.ai/Sparc3D論文https://arxiv.org/pdf/2505.14521—----------------------------【番組の概要】日々のAIトピックを、現役のAIエンジニアがやさしく解説する対談番組。AIニュースに驚き疲れたあなたに、おちつきを提供します。AIニュースの、驚くポイント、驚かなくても良いポイントがわかります。★ご感想やコメントは、番組公式ハッシュタグをつけてX(旧Twitter)でポストしていただけるとありがたいです。★【番組公式ハッシュタグ】#おちつきAI【番組公式X】https://x.com/ochitsuki_AI【パーソナリティ(MC)】▼しぶちょー・AIエンジニア・技術士(機械部門) 「大手機械メーカーでAI開発の最前線を担う現役エンジニア。AI(ディープラーニング)の実装スキルを証明する「E資格」を保有。機械(ハードウェア)への高度な知見も有し、双方の専門性を掛け合わせ『AIの社会実装』に貢献する。情報発信活動にも精力的に取り組み、ブログ・音声配信(Podcast/Voicy)・SNSなどで幅広く活躍。単なる技術解説でなく、行動変容を伴う情報発信を信条とする。その姿勢が評価され、2025年UJA科学広報賞 審査員特別賞を受賞。著書に『集まれ設計1年生 はじめての締結設計』(日刊工業新聞社)。岐阜県テクノプラザものづくり支援センター広報大使、生成AI EXPO in 東海 共同代表も務める。」https://x.com/sibucho_labohttps://voicy.jp/channel/3963▼かねりん(金田勇太)・KANERIN Podcast Studios 代表・一般社団法人 地方WEB3連携協会 理事「刑事司法実務の最前線で多数の犯罪捜査を指揮。2017年から暗号資産業界へ参入。数々のグローバルプロジェクトに参画しコンサルティング、情報分析・アドバイザリー業務を提供。コンサートライブ配信業、音声配信業、テックメディア創業等を経て、ポッドキャストレーベル兼プロダクション『KANERIN Podcast Studios』を創業。多様なパートナーと共に、未来へつなぐ声の原典を共創している。」https://x.com/kanerinxhttps://voicy.jp/channel/2534【プロデューサー】かねりん https://x.com/kanerinx【サウンド・アーキテクト】Aviv Haruta https://x.com/oji_pal【カバーアートデザイン】UTA https://x.com/uta_dib【制作/著作】KANERIN Podcast Studios--------------------------------------------------※画像引用元:https://hitem3d.ai/【各種ポッドキャストスタンドへのリンク】Spotifyhttps://open.spotify.com/show/6iGk39bSta5KZ1QD7jvK2oApple Podcasthttps://podcasts.apple.com/us/podcast/id1841316430Amazon Musichttps://music.amazon.co.jp/podcasts/aba8e9a4-aefb-404a-b366-4b7a11b3f7cb/YouTubehttps://www.youtube.com/playlist?list=PLNQiF7XIko7QOIlyFMiI_aDdk1eJzNiCD
[9月23日]AIの嘘「ハルシネーション」の原因が判明。現役AIエンジニアが最新論文を徹底解説 (ep.2)
ChatGPTはどのようにして賢い文章を生み出しているのでしょう?その秘密の鍵は「事前学習」と「事後学習」という2段階のプロセスにあります。今回は、AIが嘘をつく「ハルシネーション」の原因を解き明かしたOpenAIの最新論文を元に、このAIの学習メカニズムを基礎からやさしく解説します。特に、ChatGPTを世界的なブームに押し上げた画期的な手法「RLHF」とは何なのか?そして、その「RLHF」がなぜハルシネーションを助長してしまうのか?技術的な背景を知ることで、AIニュースの解像度が格段に上がります。あなたの知的好奇心を満たし、深い落ち着きを提供する教養コンテンツです。【目次】(00:00) オープニングトーク(00:50) 今回のテーマはAIが嘘をつく「ハルシネーション」(02:08) ハルシネーションは「嘘」ではなく「もっともらしい誤り」(04:56) 原因解明!OpenAIの最新論文をわかりやすく解説(09:37) 抜き打ちクイズ!ChatGPTの「P」って何の略?(11:33) AIの学習法①:言葉を覚える赤ちゃんと同じ「事前学習」(16:37) AIの学習法②:人間に媚びる?モラルを学ぶ「事後学習」(20:22) ChatGPT3.5が世界を変えた秘密は、RLHF(34:43) ハルシネーションを引き起こす2つの根本原因(40:27) 衝撃!AIが嘘をつくのは人間社会の歪みが原因だった(46:15) これからのAIには「わからない」と言える勇気が必要(51:28) エンディング【今回の放送回に関連するリンク】・OpenAI 言語モデルでハルシネーションがおきる理由https://openai.com/ja-JP/index/why-language-models-hallucinate/・論文https://cdn.openai.com/pdf/d04913be-3f6f-4d2b-b283-ff432ef4aaa5/why-language-models-hallucinate.pdf【番組の概要】日々のAIトピックを、現役のAIエンジニアがやさしく解説する対談番組。AIニュースに驚き疲れたあなたに、おちつきを提供します。AIニュースの、驚くポイント、驚かなくても良いポイントがわかります。【お便りフォーム】https://forms.gle/yHoq9rgT9MhFGywn9【番組公式ハッシュタグ】#おちつきAI【パーソナリティ(MC)】▼しぶちょー・AIエンジニア・技術士(機械部門) 「大手機械メーカーでAI開発の最前線を担う現役エンジニア。AI(ディープラーニング)の実装スキルを証明する「E資格」を保有。機械(ハードウェア)への高度な知見も有し、双方の専門性を掛け合わせ『AIの社会実装』に貢献する。情報発信活動にも精力的に取り組み、ブログ・音声配信(Podcast/Voicy)・SNSなどで幅広く活躍。単なる技術解説でなく、行動変容を伴う情報発信を信条とする。その姿勢が評価され、2025年UJA科学広報賞 審査員特別賞を受賞。著書に『集まれ設計1年生 はじめての締結設計』(日刊工業新聞社)。岐阜県テクノプラザものづくり支援センター広報大使、生成AI EXPO in 東海 共同代表も務める。」https://x.com/sibucho_labohttps://voicy.jp/channel/3963▼かねりん(金田勇太)・KANERIN Podcast Studios 代表・一般社団法人 地方WEB3連携協会 理事「刑事司法実務の最前線で多数の犯罪捜査を指揮。2017年から暗号資産業界へ参入。数々のグローバルプロジェクトに参画しコンサルティング、情報分析・アドバイザリー業務を提供。犯罪捜査の最前線で培った知見を、リスク回避や資産防衛に活かすCrypto Security Evangelistとして活動。コンサートライブ配信業、音声配信業、テックメディア創業等を経て、ポッドキャストレーベル兼プロダクション「KANERIN Podcast Studios」を創業。」https://x.com/kanerinxhttps://voicy.jp/channel/2534【プロデューサー】かねりん https://x.com/kanerinx【サウンド・アーキテクト】Aviv Haruta https://x.com/oji_pal【カバーデザイン】準備中【制作/著作】KANERIN Podcast Studios--------------------------------------------------※画像引用:https://cdn.openai.com/pdf/d04913be-3f6f-4d2b-b283-ff432ef4aaa5/why-language-models-hallucinate.pdf【各種ポッドキャストスタンドへのリンク】🟢Spotifyhttps://open.spotify.com/show/6iGk39bSta5KZ1QD7jvK2o🟣Apple Podcasthttps://podcasts.apple.com/us/podcast/id1841316430🔵Amazon Musichttps://music.amazon.co.jp/podcasts/aba8e9a4-aefb-404a-b366-4b7a11b3f7cb/🔴YouTubehttps://www.youtube.com/playlist?list=PLNQiF7XIko7QOIlyFMiI_aDdk1eJzNiCD
[9月23日]🍌Nano Bananaは何がスゴい?現役AIエンジニアが解説 (ep.1)
SNSで「本物みたいなフィギュアが作れる!」と話題の画像生成AI「Nano Banana🍌」、もう試しましたか?ある日突然GoogleのGeminiに現れたバナナのマークの正体は、実は驚異的な進化を遂げたAIでした。今回は、AIエンジニアのしぶちょーが、なぜNano Bananaがこれほどまでにリアルで一貫性のある画像を生成できるのか?その技術的な背景を「マルチモーダル」というキーワードで優しく解説します。かねりんの素朴な疑問を通して、誰もがAIの進化の最前線を楽しく理解できる内容です。ただすごい!と驚くだけでなく、その仕組みを知ることで、もっとAIが面白くなるはず。この放送を聞けば、あなたも落ち着いてAIニュースを楽しめるようになります。【目次】(00:00) オープニング&パーソナリティ自己紹介(02:49) 番組コンセプト:AIニュースの裏側を落ち着いて見る(04:32) 今日のテーマ:世間を賑わす「nano-banana」とは?(06:09) SNSでバズったフィギュア画像の正体はAIだった話(07:54) nano-bananaの本当に驚くべきポイントは「一貫性」(10:51) なぜバナナ?愛称「nano-banana」が生まれた意外な経緯(17:39) 【技術解説】画像生成AIが劇的に進化した本当の理由(20:46) 鍵は「マルチモーダル化」、AIの脳の仕組みの変化(26:22) 落ち着きポイント①:その画像、入力して大丈夫?(31:07) 落ち着きポイント②:まず公式の説明書を読もう(37:38) エンディング|落ち着いてAIと向き合うために【今回の放送回に関連するリンク】・How to prompt Gemini 2.5 Flash Image Generation for the best resultshttps://developers.googleblog.com/en/how-to-prompt-gemini-2-5-flash-image-generation-for-the-best-results/?utm_source=chatgpt.com・LM Arenahttps://lmarena.ai/【番組の概要】日々のAIトピックを、現役のAIエンジニアがやさしく解説する対談番組。AIニュースに驚き疲れたあなたに、おちつきを提供します。AIニュースの、驚くポイント、驚かなくても良いポイントがわかります。【お便りフォーム】https://forms.gle/yHoq9rgT9MhFGywn9【番組公式ハッシュタグ】#おちつきAI【パーソナリティ(MC)】▼しぶちょー・AIエンジニア・技術士(機械部門) 「大手機械メーカーでAI開発の最前線を担う現役エンジニア。AI(ディープラーニング)の実装スキルを証明する「E資格」を保有。機械(ハードウェア)への高度な知見も有し、双方の専門性を掛け合わせ『AIの社会実装』に貢献する。情報発信活動にも精力的に取り組み、ブログ・音声配信(Podcast/Voicy)・SNSなどで幅広く活躍。単なる技術解説でなく、行動変容を伴う情報発信を信条とする。その姿勢が評価され、2025年UJA科学広報賞 審査員特別賞を受賞。著書に『集まれ設計1年生 はじめての締結設計』(日刊工業新聞社)。岐阜県テクノプラザものづくり支援センター広報大使、生成AI EXPO in 東海 共同代表も務める。」https://x.com/sibucho_labohttps://voicy.jp/channel/3963▼かねりん(金田勇太)・KANERIN Podcast Studios 代表・一般社団法人 地方WEB3連携協会 理事「刑事司法実務の最前線で多数の犯罪捜査を指揮。2017年から暗号資産業界へ参入。数々のグローバルプロジェクトに参画しコンサルティング、情報分析・アドバイザリー業務を提供。犯罪捜査の最前線で培った知見を、リスク回避や資産防衛に活かすCrypto Security Evangelistとして活動。コンサートライブ配信業、音声配信業、テックメディア創業等を経て、ポッドキャストレーベル兼プロダクション「KANERIN Podcast Studios」を創業。」https://x.com/kanerinxhttps://voicy.jp/channel/2534【プロデューサー】かねりん https://x.com/kanerinx【サウンド・アーキテクト】Aviv Haruta https://x.com/oji_pal【カバーデザイン】準備中【制作/著作】KANERIN Podcast Studios--------------------------------------------------※画像引用:https://aiflowchat.com/blog/articles/what-is-google-nano-banana-and-where-to-try-it【各種ポッドキャストスタンドへのリンク】🟢Spotifyhttps://open.spotify.com/show/6iGk39bSta5KZ1QD7jvK2o🟣Apple Podcasthttps://podcasts.apple.com/us/podcast/id1841316430🔵Amazon Musichttps://music.amazon.co.jp/podcasts/aba8e9a4-aefb-404a-b366-4b7a11b3f7cb/🔴YouTubehttps://www.youtube.com/playlist?list=PLNQiF7XIko7QOIlyFMiI_aDdk1eJzNiCD