「わく枠べんきょ会」、この番組は、元同僚のエンジニア二人が枠だけ決めてその時やりたい技術トピックをゆるゆる学んでいく勉強会番組です
https://podcasters.spotify.com/pod/show/mossan-hoshi7#13 「Molmoええやん」
Agenda: 「News Check」 【AI】 The Intelligence Age https://ia.samaltman.com/ サム・アルトマンは、AIが人類の能力を劇的に向上させる未来を描き、個人向けAIチームや医療、教育の革新、そして世界的な繁栄の実現を強調しています。しかし、労働市場の変化や富の集中といった課題にも言及し、公平な分配が必要であると主張しています Intel launches Xeon 6 and Gaudi 3 AI chips to boost AI and HPC performance https://venturebeat.com/ai/intel-launches-xeon-6-and-gaudi-3-ai-chips-to-boost-ai-and-hpc-performance/ インテルが新たに発表したXeon 6とGaudi 3チップは、AIおよび高性能コンピューティング(HPC)の性能を向上させることを目的としています。これらのチップは、エネルギー効率の向上やスケーラビリティに優れ、ディープラーニング向けに最適化されています Googleがチップ設計AI「AlphaChip」を発表、すでにスマホ向けチップやAI特化チップの設計で活躍 https://gigazine.net/news/20240927-google-computer-chip-design-ai-alphachip/ Googleは、スマートフォン向けチップやAI特化チップの設計に活用されているAI「AlphaChip」を発表しました。このツールは設計時間を短縮し、チップの性能を向上させる画期的な技術です Google brings Gemini AI chat app to Workspace, boosting productivity for millions of enterprise users https://www.itmedia.co.jp/news/articles/2409/25/news093.html https://venturebeat.com/ai/google-adding-gemini-chat-app-to-workspace/ Googleは、企業向けにGemini AIチャットアプリをWorkspaceで無料提供開始しました。SOC 2とISO 27001を取得し、安全な環境でAIを活用し、生産性を向上させることが可能です 小型ながらOpenAIやGoogleのAIに匹敵する性能を持つマルチモーダルAI「Molmo」がオープンソースで公開される、ブラウザ版のデモページも https://gigazine.net/news/20240926-ai2s-molmo-open-source-multimodal-models/ https://venturebeat.com/ai/ai2s-new-molmo-open-source-ai-models-beat-gpt-4o-claude-on-some-benchmarks/ AI2が、OpenAIやGoogleのツールに匹敵する性能を持つマルチモーダルAI「Molmo」をオープンソースで公開しました。このモデルは、様々なベンチマークで高い性能を発揮し、AI技術の幅広い応用が期待されています 「アバター」「タイタニック」のジェームズ・キャメロン監督が画像生成AIのStable Diffusionを開発するStability AIの取締役に就任 https://gigazine.net/news/20240925-james-cameron-stability-ai/ 映画監督のジェームズ・キャメロンが、画像生成AI「Stable Diffusion」を開発するStability AIの取締役に就任しました。彼のクリエイティブな視点が、AIの物語性強化やクリエイティブ分野での応用に寄与すると期待されています 【Metaverse】 Metaが視野角70度の全部入りARグラス「Orion」を発表 同社の技術の結晶となる製品プロトタイプ https://www.moguravr.com/meta-orion/ Metaは、最新のARグラス「Orion」を発表しました。このグラスは、視野角70度という広範囲の表示が可能で、ハンドトラッキングやアイトラッキング、音声認識などの高度な操作機能を備えています。また、AIアシスタント「Meta AI」を搭載しており、手を使わずに通話やメッセージ確認ができるなど、日常的な使用を視野に入れた設計となっています。さらに、Orionは軽量でありながら高い光学性能を持ち、従来のARデバイスと比較してコンパクトなデザインを実現しています。現在はプロトタイプ段階ですが、今後の製品化に向けた開発が進められています 【Gaming】 Sony's PS5 Pro is available to pre-order today https://www.engadget.com/gaming/playstation/sonys-ps5-pro-is-available-to-pre-order-today-115549437.html?src=rss SonyのPS5 Proが本日より予約可能となりました。価格は$700で、11月7日に発売予定です。この新型コンソールは、従来のPS5よりも67%多い計算ユニットを備えたGPUや、AI技術を活用した「PlayStation Spectral Super Resolution」を搭載しており、より高度なグラフィック性能を実現しています。内部ストレージは2TBに増強され、Wi-Fi 7や8K解像度にも対応しています 【Cloud】 日本ではKubernetesやCI/CDなどが幻滅期に、インダストリクラウドやインフラ自動化は過度な期待。「日本におけるクラウド・プラットフォームのハイプ・サイクル」2024年版発表 https://www.publickey1.jp/blog/24/kubernetescicd2024.html この記事では、ガートナーの「日本におけるクラウド・プラットフォームのハイプ・サイクル」2024年版について解説しています。KubernetesやCI/CDといった技術は現在「幻滅期」に入り、過度な期待が寄せられていたことが指摘されています。一方で、インダストリクラウドやインフラ自動化も高い期待を受けていますが、これもまた実用化において課題が残っているとされています。 「啓発期」に進む技術にはサーバレスやハイパーコンバージドインフラが含まれており、これらは徐々に市場に受け入れられつつあります。一方、クラウドコンピューティングとクラウドIaaSは「生産性の安定期」に到達し、成熟した技術としての地位を確立しています 【Misc】 The Morning After: Elon blocks blocking https://www.engadget.com/general/the-morning-after-engadget-newsletter-111548974.html?src=rss Elon MuskのSNSプラットフォーム「X」(旧Twitter)は、ユーザーが他のユーザーをブロックする機能を終了させる方針を発表しました。ブロックされているユーザーは投稿を閲覧できるものの、コメントや直接のやり取りはできません。Muskはブロック機能を不要とし、代わりにミュート機能を推奨していますが、この変更はAppleやGoogleのアプリストアポリシーに違反する可能性があるため、実際に導入されるかどうかはまだ不透明です presentor - taniguchi - sakamoto (mossan-hoshi) https://x.com/mossan_hoshi #molmo #orion #llm 0:00 イントロ 0:40 サムアルトマン、プライベートブログでAGIについて言及 2:08 Google 半導体開発用AI開発 7:14 Google WorspaceでAIチャットがデフォルトで利用可能に 7:44 軽量マルチモーダルモデル「Molmo」 11:10 ジェームズ・キャメロンがStability AIの取締役に 12:16 Metaの新ARデバイス「Orion」 14:12 PS5 Pro 17:08 日本のWeb技術ハイプサイクル 18:57 Xでブロックがブロック 19:26 感想 22:41 ending
#12 「俺たちのComfyUIはまだ始まっちゃいない」
Agenda:「習慣ふりかえり/ComfuUI入門# 2」 習慣ボード · wakuwaku-benkyo-kai (github.com) https://github.com/users/mossan-hoshi/projects/3/views/7 ComfyUIの初心者向けガイド - Stable Diffusion Art (stable-diffusion-art.com) https://stable-diffusion-art.com/comfyui/#What_is_ComfyUI KSampler ノード - ComfyUI 解説 (wiki ではない) (creamlab.net) https://comfyui.creamlab.net/nodes/KSampler VAE Decode - ComfyUI Community Manual (blenderneko.github.io) https://blenderneko.github.io/ComfyUI-docs/Core%20Nodes/Latent/VAEDecode/ Variational Autoencoder徹底解説 #Python - Qiita https://qiita.com/kenmatsu4/items/b029d697e9995d93aa24 presentor - taniguchi - sakamoto (mossan-hoshi) https://x.com/mossan_hoshi 0:00 習慣ふりかえり 4:40 なにやる? 5:45 ComfyUI入門# 2 6:40 ComfuUI うごかしてみよう 9:05 各ノード理解 - Load Checkpoint 10:00 各ノード理解 - KSampler 11:37 各ノード理解 - VAE 15:45 改めて処理の流れ 20:27 image-to-image workflow
#11 「ゼロからはじまれComfyUI」
Agenda: 「CUDAの勉強について相談 / ゼロからはじまれComfyUI」 ディープラーニング オンライン コース | NVIDIA https://www.nvidia.com/ja-jp/training/online/ comfyanonymous/ComfyUI: The most powerful and modular diffusion model GUI, api and backend with a graph/nodes interface. (github.com) https://github.com/comfyanonymous/ComfyUI ComfyUI Examples | ComfyUI_examples (comfyanonymous.github.io) https://comfyanonymous.github.io/ComfyUI_examples/ ComfyUIの初心者向けガイド - Stable Diffusion Art (stable-diffusion-art.com) https://stable-diffusion-art.com/comfyui/#What_is_ComfyUI presentor - taniguchi - sakamoto (mossan-hoshi) https://x.com/mossan_hoshi #comfyui #cuda #nvidia #study 0:00 なにする? 0:40 CUDAの勉強何から始めればいい? 8:30 ゼロからはじまれComfyUI
#10「OpenAI o1-preview SUGEEEEEE」
Agenda:「習慣ふりかえり・ニュースチェック」 Introducing OpenAI o1-preview - https://openai.com/index/introducing-openai-o1-preview/ - https://www.youtube.com/openai NotebookLM | Note Taking & Research Assistant Powered by AI - https://notebooklm.google/ システムプロンプト - Anthropic - https://docs.anthropic.com/en/release-notes/system-prompts#sept-9th-2024 Community input drives the new draft of the Open Source AI Definition - https://opeSystem Prompts - Anthropicnsource.org/blog/community-input-drives-the-new-draft-of-the-open-source-ai-definition Whisper-Medusa - https://github.com/aiola-lab/whisper-medusa modern unix tool list - llimllib notes (billmill.org) - https://notes.billmill.org/computer_usage/cli_tips_and_tools/modern_unix_tool_list.html ゼロから作るDeep Learning ❺ ―生成モデル編 - https://learning.oreilly.com/library/view/zerokarazuo-rudeep-learning/9784814400591/ Flappy Bird is finally returning, 10 years after its demise - https://www.engadget.com/gaming/flappy-bird-is-finally-returning-10-years-after-its-demise-142756765.html?src=rss presentor - taniguchi - sakamoto (mossan-hoshi) https://x.com/mossan_hoshi #openai #claude #whisper 0:00 習慣ふりかえり 7:34 Introducing OpenAI o1-preview 11:29 OpenAI o1-previewお試し 17:33 Notebook LM 19:06 システムプロンプト - Anthropic 22:05 Community input drives the new draft of the Open Source AI Definition 23:10 Whisper-Medusa 23:53 modern unix tool list - llimllib notes (billmill.org) 24:38 ゼロから作るDeep Learning ❺ ―生成モデル編 25:13 Flappy Bird is finally returning, 10 years after its demise 26:28 closing
#9「二次元プログラミングの世界」
Agenda:LT(sakamoto) 「二次元プログラミングについて」 - テトリスでパソコンを作る (zenn.dev) https://zenn.dev/mossan_hoshi/books/989aa282a55469 - Tetris is Capable of Universal Computation https://meatfighter.com/tetromino-computer/ - Turnstyle (jaspervdj.be) https://jaspervdj.be/turnstyle/ ※ # 7, # 8 は実施したのですが録音忘れ・内輪話だったためアップロードしていません presentor - taniguchi - sakamoto (mossan-hoshi) https://x.com/mossan_hoshi #tetris #programminglanguage #computerarchitecture 0:49 テトリスでパソコンを作る 8:47 Tetris is Capable of Universal Computation 25:51 Turnstyle (jaspervdj.be)
#6 【ニュースチェック】大規模言語モデル (LLM) の技術と最新動向、他4点
2024年9月9日(月) Agenda:ニュースチェック スーパーマリオのプレイ映像を学習してテキストからゲーム動画を自動生成するAIモデル「MarioVGG」 https://gigazine.net/news/20240906-mariovgg-super-mario-bros-generative-ai/ LLM Visualization https://bbycroft.net/llm RAG vs Long LLM VisualizationContext LLM https://x.com/omarsar0/status/1831389521839267888 🤯 ComfyUI Advanced Live Portrait 🔥 https://x.com/camenduru/status/1830997475974389834 「メタバース大規模調査」2023年度分析レポート https://prtimes.jp/main/html/rd/p/000000001.000148662.html presentor - taniguchi - sakamoto (mossan-hoshi) https://x.com/mossan_hoshi 0:00 スーパーマリオのプレイ映像を学習してテキストからゲーム動画を自動生成するAIモデル「MarioVGG」 04:00 LLM Visualization 06:16 RAG vs Long LLM VisualizationContext LLM 11:08 🤯 ComfyUI Advanced Live Portrait 🔥 12:59 「メタバース大規模調査」2023年度分析レポート
#5 習慣ふりかえり・なんでもふりかえり
習慣化したい事を定期的に振り返ってモチベを高める「習慣ふりかえり」 最近ふりかえってない事をなんでもふりかえってみる「なんでもふりかえり」 昔やっていたイベントを久しぶりにやってみました ※ ふりかえりで話している内容自体は比較的内輪ネタなので、イベント自体のやり方等に注目していただければと思います ● ポッドキャストでも聴けます https://podcasters.spotify.com/pod/show/mossan-hoshi7 - # 4以前はポッドキャストのみ配信しています 【本動画字幕作成用プロンプト】 ※本動画の字幕は自動文字起こし結果に対してGemini 1.5 Flashで以下のプロンプトでSRT化したものを少し手直ししたものです ```text 動画の自動文字起こし結果(タイムスタンプ付き)が入力されます。 Youtube用の字幕用SRTとして書き直してください 【制約】 - 行っている内容を全てそのまま出力するのではなく、その時話している内容を適切に表す内容に適宜置き換える事 - 同時に表示する文字数は最大2行(1行あたり16文字目安)にすること - パース可能なSRT形式で出力する事 ``` presentor - taniguchi - sakamoto (mossan-hoshi) https://x.com/mossan_hoshi 00:02 習慣ふりかえり 07:09 なんでもふりかえり 17:45 文字起こしからLLMに要約・ブログをつくってもらう
#4 [気になるスライド] LangChainの現在とv0.3にむけて
LangChainの現在とv0.3にむけて https://speakerdeck.com/os1ma/langchainnoxian-zai-tov0-dot-3nimukete 以下、詳しくは読まなかったコンテンツ(今後どこかで読むかもです) Membership Options (acm.org) https://www.acm.org/membership/membership-options State of JavaScript2023 https://2023.stateofjs.com/ja-JP/ 「メタバース大規模調査」2023年度分析レポート https://prtimes.jp/main/html/rd/p/000000001.000148662.html 大規模言語モデル (LLM) の技術と最新動向 - Speaker Deck https://speakerdeck.com/ikuyamada/da-gui-mo-yan-yu-moderu-llm-noji-shu-tozui-xin-dong-xiang presentor - taniguchi - sakamoto (mossan-hoshi) https://x.com/mossan_hoshi
#3 [News Check] Xiaomi新商品/Pixelズーム/ゲームプレイAI/安野さん
今日はニュースチェックの日。この1週間で気になった記事を持ち寄ります - 谷口 - Pixelの「あとから写真をズームできる機能」を使ってみた - https://gigazine.net/news/20240830-pixel-zoom-quality/ - Googleの研究チームがゲームエンジンとして機能するAIモデル「GameNGen」を発表、入力に合わせて20fpsでDOOMを描画可能で実際のプレイムービーもあり - https://gigazine.net/news/20240829-google-gamengen-ai-model/ - 坂本 - NVIDIA他、長い動画を理解する視覚言語モデル『LongVILA』開発・画像とテキストを1つのモデルで統一する『Show-o』など生成AI技術5つを解説(生成AIウィークリー) - https://www.techno-edge.net/article/2024/09/01/3626.html - オードリー・タンと安野たかひろが語るデジタル戦略と社会課題の解決策|WebX2024 - https://coinpost.jp/?p=554922 - OpenAIがアメリカ当局者に対し「Strawberry」と呼ばれる画期的な成果をデモ、コード名「Orion」という主力LLMのトレーニングデータを作成することでGPT-4越えの性能を目指す - https://gigazine.net/news/20240828-openai-strawberry-orion-chatbot/ - 絵で見てわかるLinuxカーネルの仕組み(市川 正美 大岩 尚弘 島本 裕志 武内 覚 田中 隆久 丸山 翔平)|翔泳社の本 (shoeisha.co.jp) - https://www.shoeisha.co.jp/book/detail/9784798177847 - xiaomi 新製品発売8月 - https://event.mi.com/jp/lifetstyle-colloection-202408 - 本編で扱わなかった記事 - ASCII.jp:「リアルすぎる」と話題 グーグル画像生成AI「ImageFX」の使い方 - 2024.08.30Gemini の応答が高速に - 話題のFLUX.1をComfyUIで画像生成してみる!基本系とControlNetのWorkflow(json)公開 - 「オープンソースAI」問題ついに決着、OSIが定義を発表 - OpenAI・Amazon・Microsoftなどの大手IT企業が「AI生成コンテンツへのラベル付与を義務付ける法案」に賛同 - Raspberry Pi PicoとRaspberry Pi Pico 2の性能比較 - A/Bテストよりすごい?はじめてのインターリービング - Gunosyデータ分析ブログ - Amazonは生成AIアシスタントで開発者4500人年の工数を節約し、年間2億6000万ドルもの効率向上を実現したって? - YAMDAS現更新履歴 presentor - taniguchi - sakamoto (mossan-hoshi) https://x.com/mossan_hoshi
#2 いい感じに習慣化したい
かつてできていた勉強・家事・運動などの様々な習慣、時間が経つにつれていつの間にかやらなくなってしまいました。あの頃のようにいい感じの習慣を復活させるべく二人が立ち上がる。。。 📗「ジェームズ・クリアー式 複利で伸びる1つの習慣(Atomic Habits)」https://www.panrolling.com/books/ph/ph91.html📗「ゲーム制作者になるための3Dグラフィックス技術 改訂3版」https://tatsu-zine.com/books/3d-graphics-for-game-creators 🎤「mutalk2」https://ja.shiftall.net/products/mutalk2 習慣管理カンバンボード(今後利用予定) https://github.com/users/mossan-hoshi/projects/3/views/7 ※ マイクの都合でsakamotoの声が鼻声になってます🙏 presentor- taniguchi- sakamoto (mossan-hoshi) https://x.com/mossan_hoshi
#1 [読書会] 1/n 「AIアートの新時代:CLIPとStable Diffusionを活用した画像生成技術とその応用」
画像系AIの同人誌でおなじみのこしあん氏の著作「AIアートの新時代」の読書会をこれから不定期で何回かにわけて実施します。1年前の本で少し古くなっている内容もありそうなので適度に読み飛ばして進めます じゅ~しぃ~すくりぷと「AIアートの新時代:CLIPとStable Diffusionを活用した画像生成技術とその応用」 https://booth.pm/ja/items/4820110 [1706.03762] Attention Is All You Need (arxiv.org) https://arxiv.org/abs/1706.03762 presentor - taniguchi - sakamoto (mossan-hoshi) https://x.com/mossan_hoshi
こちらもおすすめ
オカンの話なんて誰が聞くん?
これがオカンの日常
近藤淳也のアンノウンラジオ
株式会社はてな創業者であり現在もITの第一線で働く近藤淳也が、京都の宿UNKNOWN KYOTOにやって来る「好きなことを仕事にしている人」を深堀りすることで、世の中の多様な仕事やキャリア、生き方・働き方を「リアルな実例」として紐解いていきます。 . 【ホスト:近藤淳也】 株式会社OND代表取締役社長、株式会社はてな取締役、UNKNOWN KYOTO支配人、NPO法人滋賀一周トレイル代表理事、トレイルランナー。 2001年に「はてなブログ」「はてなブックマーク」などを運営する株式会社はてなを創業、2011年にマザーズにて上場。その後2017年に株式会社ONDを設立し、現在もITの第一線で働く。 株式会社OND: https://ond-inc.com/ . 【UNKNOWN KYOTO】 築100年を超える元遊郭建築を改装し、仕事もできて暮らせる宿に。コワーキングやオフィスを併設することで、宿泊として来られる方と京都を拠点に働く方が交わる場所になっています。 1泊の観光目的の利用だけではなく、中長期滞在される方にも好評いただいています。 web: https://unknown.kyoto/ . こちらから本文を読んだりコメントが書けます! https://listen.style/p/unknownradio
一日一配
声の日記。自分の声で日記を書く、LISTENならではのポッドキャスト。
@narumi のつぶやき
声低おじさんの独り言 お便り募集中 https://forms.gle/mFNwFusdE6eszbMU6
思ったら即アウトプットするプログラマー
この番組はエンジニアの「もっさん」が日々思ったことを1トピック1エピソードでコンパクトに話す番組です。 ※ 2024/6/27に「みるみる積もる!積読術」からタイトル変更しました ●【Twitter @mossan_hoshi】 ●【Youtube @mossanhoshi7158】 ●【オライリー本サブスクについて】 https://zenn.dev/mossan_hoshi/articles/20230128_oreilly_learning ●【積読本リスト】 https://1drv.ms/x/s!AqxcPJT01sLlgdsJJ2-wA9mRn1dimA?e=uvyGdD ●【Zenn @mossan_hoshi】 ●【Qiita @mossan_hoshi】
楽しいラジオ「ドングリFM」
ブロガーとして人気の2人が話すポッドキャスト番組です。最近話題のニュース、日常に役立つ面白ネタなどを話します。国内・海外のIT事情に興味ある人にオススメの内容になっています。 ・お便りは https://goo.gl/p38JVb まで ・詳しいリンクはこちら https://linktr.ee/dongurifm ・リスナーコミュニティ「裏ドングリ」は以下からどうぞ https://community.camp-fire.jp/projects/view/206637 https://donguri.fm/membership/join BGMと最後の締めの曲はフリーBGM・音楽素材「 http://musmus.main.jp 」より。