まるごとAIニュースBIZ

まるごとAIニュースBIZ

3 Episodes

AIに関する最新ニュースをまるごとお届けするポッドキャスト

https://i4u.jp/podcast
まるごとAIニュースBIZ - 2025-01-15

まるごとAIニュースBIZ - 2025-01-15

Jan 15, 2025 30:00

# Show Notes ## 参考記事 - [Ask HN: Teams using AI – how do you prevent it from breaking your codebase?](https://news.ycombinator.com/item?id=42701745) - [Don't use cosine similarity carelessly](https://p.migdal.pl/blog/2025/01/dont-use-cosine-similarity/) - [Introducing ambient agents](https://blog.langchain.dev/introducing-ambient-agents/) - [Singapore is turning to AI to care for its rapidly aging population](https://restofworld.org/2025/singapore-ai-eldercare-tools/) - [voyage-code-3: more accurate code retrieval with lower dimensional, quantized embeddings](https://blog.voyageai.com/2024/12/04/voyage-code-3/) - [生成AIでフェイク論文 実在する日本人研究者3人の名前かたり | 毎日新聞](https://mainichi.jp/articles/20250111/k00/00m/040/146000c) - [【決定版】2025年1月中旬時点でのGeminiとClaudeとOpenAIの使い分け|erukiti](https://note.com/erukiti/n/n73ba47fe4518) - [Browser UseのWeb UIを使いながらAIエージェントの業務システムへの適用を考える | DevelopersIO](https://dev.classmethod.jp/articles/browser-use-web-ui/) - [AI開発者にも特許権、発明に利用なら対価 政府検討 - 日本経済新聞](https://www.nikkei.com/article/DGXZQOUA27CSC0X21C24A1000000/) - [米バイデン政権、AI半導体輸出の新規則発表 NVIDIAは「全く役立たない」と批判](https://www.itmedia.co.jp/news/articles/2501/14/news093.html) - [RAGで動画検索。「VideoRAG」の解説](https://zenn.dev/knowledgesense/articles/9616c810383b53) - [note、Googleから5億円調達 資本業務提携で「Gemini」導入](https://www.itmedia.co.jp/aiplus/articles/2501/14/news157.html) - [Unlocking complex problem-solving with multi-agent collaboration on Amazon Bedrock | Amazon Web Services](https://aws.amazon.com/blogs/machine-learning/unlocking-complex-problem-solving-with-multi-agent-collaboration-on-amazon-bedrock/) - [Implement RAG while meeting data residency requirements using AWS hybrid and edge services | Amazon Web Services](https://aws.amazon.com/blogs/machine-learning/implement-rag-while-meeting-data-residency-requirements-using-aws-hybrid-and-edge-services/) - [AIを使って俳優の顔にプーチン大統領の顔を重ね合わせた映画「プーチン」がAI利用の倫理的影響に関する議論を巻き起こす](https://gigazine.net/news/20250114-putin-ai-film/) - [アクセンチュアCEOがCESで講演、AIエージェントで「仕事のやり方変えた」](https://xtech.nikkei.com/atcl/nxt/column/18/03031/011000024/) - [フリー画像がどれもピンとこない……カンタンに使える画像生成AI「Adobe Firefly」活用法:その悩み、生成AIが解決(1/2 ページ)](https://www.itmedia.co.jp/business/articles/2501/14/news009.html) - [宮崎駿、神山健治…"手描きアニメ"は廃れるのか「コスト10分の1の2025年生成AI元年」業界大激変の予兆 ローカル局がオリジナルアニメに挑戦できるようになる](https://president.jp/articles/-/90277) - [Training AI models might not need enormous data centres](https://www.economist.com/science-and-technology/2025/01/08/training-ai-models-might-not-need-enormous-data-centres) - [「VLC media player」にAI字幕生成・翻訳機能が搭載へ、ローカル動作・日本語にも対応!](https://forest.watch.impress.co.jp/docs/serial/yajiuma/1654033.html) - [AI翻訳が壊すもの、作り上げるもの](https://blog.tinect.jp/?p=88731) - [note、Googleと資本業務提携。生成AIを活用し、創作活動をより一層サポート|note株式会社](https://note.jp/n/nb8722ab54ada) - [AI agents may soon surpass people as primary application users](https://www.zdnet.com/article/ai-agents-may-soon-surpass-people-as-primary-application-users/) - [米ロス山火事で無力だった「AI火災検知ツール」、1100台のカメラで稼働 | Forbes JAPAN 公式サイト(フォーブス ジャパン)](https://forbesjapan.com/articles/detail/76424) - [「あれ?自分の名だ」 生成AIで偽論文、削除も応じず 対策は? | 毎日新聞](https://mainichi.jp/articles/20250111/k00/00m/040/176000c) - [2025年はAIと働く年になりそうですが一番大事なことってここだよね|けんすう](https://kensuu.com/n/ndf6abb260dc6) - [「完全自律型」AIエージェント至高論への違和感〜ワークフロー構築という現実解](https://zenn.dev/pharmax/articles/d1d3695e4114c0) - [AIが生成した素晴らしい提案書、プロジェクトを開始して分かること](https://xtech.nikkei.com/atcl/nxt/column/18/01111/010900062/) - [structured-logprobs](https://arena-ai.github.io/structured-logprobs/) - [ゼロからLLMプロンプトエンジニアリング(2) 世界中のライターに贈る「生成AIで文章校正しないともったいない!」](https://news.mynavi.jp/techplus/article/zeroprompt-2/) - [GenAI Acceleration for PyTorch 2.5 on Intel® Xeon®Processors](https://pytorch.org/blog/genai-acceleration-intel-xeon/) - [AIでフリーランスの収入が「減る職種」と「増える職種」。その境目にある“変曲点”とは?(生成AIクローズアップ)](https://www.techno-edge.net/article/2025/01/14/4012.html) - [「コロプラは画像生成AIを導入します」公表の背景は 同社の意図と実用のいま、CIOに聞いた(1/4 ページ)](https://www.itmedia.co.jp/aiplus/articles/2501/14/news033.html) - [Agents](https://huyenchip.com/2025/01/07/agents.html) - [OpenAI、米政府へのAIの“青写真”を提示 「中国に勝つために」](https://www.itmedia.co.jp/news/articles/2501/14/news094.html) - [Clineっておいしいの?おいしいです!](https://zenn.dev/acntechjp/articles/4ee8b08fa6ed5f) ## 要約 ## 記事1: タイトル: AIコーディング支援でコードが壊れるのを防ぐには? 要約: AIコーディング支援ツール利用時、コードの複雑化に伴い、AIが既存のパターンを無視したり、不要なコードを生成したりする問題が指摘されています。対策として、AIに一度に多くのコードを書かせない、コードレビューを徹底する、チームのコーディング規約をAIに学習させる、などが提案されています。AIを新人プログラマーのように扱い、テストとレビューを怠らないことが重要です。また、AIはテストコード作成や、複雑なコードの説明に役立つという意見もあり、適切な使い方が求められています。 ## 記事2: タイトル:安易なコサイン類似度の使用は危険 要約: AIで重要な役割を果たすベクトルですが、コサイン類似度を安易に使うと、期待と異なる結果を招くことがあります。 コサイン類似度は、ベクトルの類似度を測る便利なツールですが、意味の類似性を正しく捉えられない場合も。 特に、モデルがコサイン類似度で学習していない場合や、求める類似性の種類が異なる場合に問題が起こりやすいです。 より良い結果を得るためには、タスクに合わせた学習、プロンプトの工夫、テキストの前処理が重要です。 闇雲にコサイン類似度に頼るのではなく、目的に合ったベクトル比較を心がけましょう。 ## 記事3: タイトル: 新しいAIの形「アンビエントエージェント」 要約: 従来のAIチャットは、ユーザーが毎回メッセージを送る必要があり、効率が悪く、同時進行も苦手でした。そこで、新しいAI「アンビエントエージェント」が登場。これは、イベントを監視し、必要な時だけユーザーに通知や質問をします。重要な判断は人間が承認する「ヒューマンインザループ」も搭載。これにより、AIは安心して使え、人間との協調もスムーズになります。この技術を使い、メールアシスタントを開発。さらに、開発を容易にする「LangGraph」というツールも公開されました。 ## 記事4: タイトル: シンガポール、高齢化社会のケアにAIを活用 要約: シンガポールでは、高齢化が急速に進む中、AIが高齢者ケアの重要な役割を担い始めています。介護施設では、ロボットが体操やレクリエーションをサポートし、高齢者の孤独感の軽減に貢献しています。また、AIは音声分析を通じて高齢者のうつ病の早期発見にも活用が期待されています。シンガポール政府はAI技術開発に多額の投資を行い、高齢者ケアの課題解決を目指しています。一方で、ロボットとの過度な関わりが人間関係を希薄にする可能性も指摘され、慎重な利用が求められています。 ## 記事5: タイトル: voyage-code-3: より高精度なコード検索と低次元・量子化埋め込み 要約: AI開発企業のVoyage AI社は、コード検索に特化した新モデル「voyage-code-3」を発表しました。このモデルは、OpenAIやCodeSageのモデルを大幅に上回る検索精度を持ち、32のデータセットで平均13.8%から16.81%高い性能を示しました。特徴は、Matryoshka学習と量子化技術により、埋め込みベクトルの次元を小さくしたり、データ量を削減できる点です。これにより、ストレージや検索コストを大幅に削減できます。また、様々なデータ形式に対応し、32Kトークンという長い文脈を扱える点も優れています。AI初心者の方でも、より効率的にコード検索ができるようになるでしょう。 ## 記事6: はい、承知いたしました。以下に要約を作成します。 タイトル: 【決定版】2025年1月中旬時点でのGeminiとClaudeとOpenAIの使い分け|erukiti 要約: AIをフル活用中の筆者が、最新モデルを徹底比較!Gemini Advanced、ChatGPT Pro、Claude Professionalなど、複数契約して使い倒した結果をシェアします。大賢者レベルの相談にはGeminiとo1、大量質問にはo1-pro。日常の相談や日本語操作はClaude 3.5 Sonnetが最適。図や画面作成も得意です。幅広い意見収集には、複数モデルへの同時質問が有効。検索はPerplexity一択。コーディングはSonnetと自作ツール併用がおすすめ。OpenAIの最新モデルは指示追従能力が低い一方、Gemini 2.0は高速で賢く、契約価値あり。大賢者活用で知的活動をレベルアップしましょう。 ## 記事7: はい、承知いたしました。以下に要約を作成します。 --- **タイトル: Browser UseのWeb UIを使いながらAIエージェントの業務システムへの適用を考える | DevelopersIO** **要約:** AIでブラウザ操作を自動化する「Browser-Use」に、Web UIが登場しました。これにより、AI初心者でも簡単にWebサイト操作が可能に。セットアップは簡単で、様々なAIモデルも利用できます。 Web UIでは、AIエージェントや言語モデル、ブラウザの設定が細かくでき、実行結果や操作履歴も確認可能。実際に、ログイン済みのブラウザで業務システムを操作することも可能です。 AIエージェントは便利な一方、曖昧な指示には弱い側面も。具体的な指示や出力形式の指定が重要です。業務利用では、ドメインを絞り、明確な手順を示すことで、より正確な結果を得られるでしょう。 この技術を通じて、人間同士のコミュニケーションでも、背景や目的を明確に伝えることの大切さを再認識できます。 --- ## 記事8: タイトル:AI開発者にも特許権、発明に利用なら対価 政府検討 要約: 政府は、AIを使って生まれた発明について、AI開発者も「共同発明者」として特許権を認める検討を始めました。これにより、AI開発者は特許使用料などの対価を受け取れるようになります。これは、AI研究への資金を増やし、技術革新とAI産業の発展を促す狙いがあります。現在、AIは法律上発明者として認められていませんが、この制度が変わるかもしれません。AIがより社会に貢献する未来が期待されます。 ## 記事9: タイトル: 米バイデン政権、AI半導体輸出の新規則発表 NVIDIAは「全く役立たない」と批判 要約: アメリカのバイデン政権が、AI技術の海外流出を防ぐための新しい規制を発表しました。この規制では、AI開発に使われる半導体の輸出が制限されます。特に、中国やロシアのような「懸念国」への輸出が厳しくなる見込みです。しかし、半導体大手のNVIDIAは、この規制がイノベーションを妨げ、アメリカの安全保障にも役立たないと批判しています。NVIDIAは、トランプ前政権の政策への回帰を期待していると述べています。 ## 記事10: はい、承知いたしました。以下に要約を作成します。 ## タイトル: RAGで動画検索。「VideoRAG」の解説 要約: AI初心者にも分かりやすく、動画を情報源として活用する「VideoRAG」を解説します。従来のRAGはテキスト中心でしたが、VideoRAGは動画を解析できる点が特徴です。動画を4秒ごとに区切り、音声から字幕を生成。動画と字幕を「LVLM」というAIで解析し、質問内容に関連性の高い動画を検索します。これにより、例えば「車のダッシュボードでクッキーを焼く方法」のような具体的な質問にも、動画から手順を抽出して回答できます。まだ課題はあるものの、今後のAI技術発展で、動画をより活用したRAGが期待されます。 ## 記事11: タイトル: note、Googleから5億円調達 資本業務提携で「Gemini」導入 要約: ニュースです。テキスト投稿サイト「note」が、Googleと提携し、5億円の資金を調達しました。このお金は、AIを使ってnoteをより便利にしたり、新しいAIサービスの研究開発に使われます。具体的には、GoogleのAI「Gemini」をnoteの記事作成画面に導入する予定です。また、クリエイターがAI学習に自分の作品を使うことを許可した場合、その対価を還元する仕組みも作られる見込みです。この提携は、2024年4月ごろから話し合われていたそうです。 ## 記事12: はい、承知いたしました。以下に要約を示します。 タイトル:Amazon Bedrockで実現するマルチエージェント連携による複雑な問題解決 要約: AIの進化により、複数AIエージェントが連携する「マルチエージェントシステム」が注目されています。これは、複雑なタスクを分担し、各エージェントが専門知識を活かすことで、より効率的かつ高度な問題解決を目指すものです。Amazon Bedrockでは、このシステムを構築するためのフレームワークを提供しています。このフレームワークでは、監督エージェントがタスクを分割し、専門エージェントに指示を出すことで、旅行計画やソフトウェア開発など、様々な分野で高い成果を上げています。従来の単一エージェントと比較して、マルチエージェントシステムはより高い成功率を達成し、その有効性が実証されています。 ## 記事13: はい、承知いたしました。以下に要約を作成しました。 タイトル:AWSハイブリッド&エッジサービスでデータ所在地要件を満たしつつRAGを実装 要約: Amazon Bedrock Agentsを拡張し、AWS OutpostsやLocal Zonesといったハイブリッド環境で生成AIアプリを構築する方法をご紹介します。データ保護規制が厳しい環境でも、オンプレミスデータを活用したRAG(検索拡張生成)アプリが可能です。 完全ローカルRAGでは、基盤モデル(LLM)とデータソースをオンプレミスに配置し、機密性の高いデータも安全に処理します。ハイブリッドRAGでは、Bedrock AgentsがクラウドとエッジのLLMを連携させ、データ所在地要件を満たしつつ、最適なモデルを自動選択します。これにより、データ所在地規制に準拠しながら、生成AIの恩恵を最大限に活用できます。AWSワークショップでは、これらの実装を体験できます。 ## 記事14: タイトル: AIを使って俳優の顔にプーチン大統領の顔を重ね合わせた映画「プーチン」がAI利用の倫理的影響に関する議論を巻き起こす 要約: ポーランドで公開された映画「プーチン」は、AI技術で俳優の顔にプーチン大統領の顔を重ねて話題です。監督は、AIによって本物そっくりの表現が可能になったと語る一方、この技術利用には倫理的な問題があるとの声も上がっています。映画関係者の中には、ロシアからの報復を恐れる人もいるようですが、監督は全く恐れていないとのことです。この映画は、AIの可能性を示すと同時に、その利用に関する議論を活発化させています。 ## 記事15: タイトル: アクセンチュアCEOがCESで講演、AIエージェントで「仕事のやり方変えた」 要約: アクセンチュアのCEOがCESで講演し、AIエージェント導入で仕事のやり方が大きく変わったと語りました。同社は業界特化型AIエージェントサービスを提供開始し、社内での利用でアイデア出しから提案までの時間が半減したそうです。AIエージェントは、競合情報と比較してフィードバックを行うなど、業務効率化に貢献。今後は100種類以上のAIエージェント提供を目指すとしています。AI活用による業務変革が加速しそうですね。 ## 記事16: タイトル: フリー画像がどれもピンとこない……カンタンに使える画像生成AI「Adobe Firefly」活用法:その悩み、生成AIが解決(1/2 ページ) 要約: フリー画像に満足できない?そんな時は画像生成AI「Adobe Firefly」が便利です。ビジネスシーンでも使いやすいのが特徴で、著作権トラブルも比較的少ないため安心です。使い方は簡単!作りたいイメージをテキストで入力するだけで、AIが画像を生成してくれます。さらに、生成後の画像のスタイルや色味の調整、部分的な修正も可能です。プレゼン資料やSNS投稿など、様々な場面で活用できます。 ## 記事17: タイトル: 宮崎駿、神山健治…"手描きアニメ"は廃れるのか「コスト10分の1の2025年生成AI元年」業界大激変の予兆 ローカル局がオリジナルアニメに挑戦できるようになる 要約: アニメ業界に大きな変化の波が来ています。なんと、生成AIを活用することで、アニメ制作コストが従来の10分の1にまで削減できる可能性があるんです。関西テレビでは、世界初のフルAIアニメを制作し、話題となっています。これにより、地方のテレビ局でもオリジナルアニメが作りやすくなり、新たなクリエイターの登場も期待されています。AIがアニメ制作の現場を大きく変えようとしているんですね。 ## 記事18: タイトル:AIモデルの学習に巨大データセンターは不要になる? 要約: かつて富豪たちが競ったのはヨットやプライベートジェットでしたが、今はAI学習用GPUの数です。OpenAIがGPT-4を学習させた時、25,000個のGPUを使いましたが、イーロン・マスク氏やマーク・ザッカーバーグ氏は、それぞれ数十万個単位でのGPU保有を競っています。しかし、AIモデルの学習には必ずしも巨大なデータセンターが必要ではなく、将来的には専用のハードウェアなしで学習できるようになる可能性も出てきています。 ## 記事19: タイトル: 「VLC media player」にAI字幕生成・翻訳機能が搭載へ、ローカル動作・日本語にも対応! 要約: 定番メディアプレイヤー「VLC media player」に、AIによる字幕生成・翻訳機能が追加されます。この機能はオフラインで動作し、オープンソースのAIモデルを使用。動画の内容が外部に漏れる心配がありません。さらに、日本語を含む多くの言語に対応し、ライブ配信動画にも対応予定。生成した字幕はファイル保存も可能です。AI初心者でも簡単に使え、動画視聴がより便利になります。 ## 記事20: タイトル: AI翻訳が壊すもの、作り上げるもの 要約: 筆者は、生成AIを仕事や遊びで積極的に活用しています。特に文章作成や翻訳で、AIは発想を広げたり、人力では難しい作業をこなしたりするのに役立っています。しかし、AI翻訳の普及により、人間の翻訳の価値が下がる可能性も指摘しています。完璧でなくても「だいたい合っている」で済ませる風潮が、人間の翻訳の仕事を奪っていると警鐘を鳴らします。一方で、AI翻訳が言葉の壁を越え、プアな人間同士がコミュニケーションする新たな可能性も感じています。 ## 記事21: タイトル: note、Googleと資本業務提携。生成AIを活用し、創作活動をより一層サポート|note株式会社 要約: noteがGoogleと提携し、生成AIを活用したサービス開発を加速します。noteはこれまでもAI技術を創作支援に活用してきましたが、今回の提携でさらに強化。クリエイターの創作活動をより強力にバックアップしていく方針です。AI初心者の方にもわかりやすく言うと、AIが皆さんの創作活動をサポートしてくれる、そんな未来が近づいています。 ## 記事22: はい、承知いたしました。以下に要約を作成します。 タイトル: AIエージェントがアプリの主要ユーザーになる未来 要約: AI技術の進化により、2030年頃には、人間ではなくAIエージェントが企業のシステムを主に利用するようになると予測されています。AIエージェントは、自然言語を理解し、複雑なタスクをこなせるようになり、ソフトウェア開発やデータ分析の分野で活躍すると期待されています。また、AIが生成するユーザーインターフェースも登場し、よりパーソナライズされた体験が可能になるでしょう。企業は、AIエージェントを導入する際、安全性と信頼性を確保するための監視体制を構築することが重要になります。 ## 記事23: タイトル: 米ロス山火事で無力だった「AI火災検知ツール」、1100台のカメラで稼働 | Forbes JAPAN 公式サイト 要約: アメリカ・ロサンゼルスで発生した大規模な山火事では、AIを活用した火災検知システムが期待されたほどの効果を発揮できませんでした。カリフォルニア州では1100台以上のカメラでAIが火災を監視していましたが、強風と乾燥した気候により火災が急速に拡大。AIが火災を検知しても、対応が間に合わない状況でした。AIは火災の早期発見に役立つものの、自然の猛威には限界があることが示されました。 ## 記事24: タイトル: 「あれ?自分の名だ」 生成AIで偽論文、削除も応じず 対策は? | 毎日新聞 要約: 研究者の皆さん、大変です!AIが作った偽の論文に、あなたの名前が使われているかもしれません。毎日新聞によると、実際に複数の研究者が、身に覚えのない論文に自分の名前が使われているのを発見しました。しかも、論文の削除を求めても、出版社は応じないケースもあるようです。AIを使って簡単に論文が作れてしまう今、このような問題はさらに深刻化する恐れがあります。専門家は「極めて憂慮すべき事態」と警鐘を鳴らしています。AI初心者の皆さんも、他人事ではありません。 ## 記事25: タイトル: 2025年はAIと働く年になりそうですが一番大事なことってここだよね|けんすう 要約: 2025年、AIエージェントが普及し、AIと働く時代が来ると筆者は予測しています。AIエージェントとは、自律的にタスクを実行するAIシステムのこと。まるで優秀な新卒社員のように、自分で考え、調査し、問題を解決します。重要なのは、AIへの指示の出し方です。指示が上手い人とそうでない人で成果に大きな差が生まれるでしょう。これからは、AIを効果的にマネジメントする能力が求められます。 ## 記事26: ## タイトル: 「完全自律型」AIエージェント至高論への違和感〜ワークフロー構築という現実解 要約: AIエージェントの議論が活発ですが、「完全自律型」こそが素晴らしいという風潮に疑問を感じます。複雑な業務を安定させるには、人間がワークフローを定義する方が現実的です。ユーザーから見て「ほぼ放っておいても結果が出る」なら、内部がどう作られていようと良いのではないでしょうか。自律性の議論は、ユーザー目線か開発者目線かで意見が分かれますが、実際にはグラデーションがあります。また、完全自律型を目指すとしても、業務を学習させるには人間によるフィードバックが不可欠で、結果的にワークフローを学習することになるでしょう。ユーザーに価値を提供することを最優先に考え、必要ならワークフローを構築すべきです。 ## 記事27: タイトル: AIが生成した素晴らしい提案書、プロジェクトを開始して分かること 要約: 日経クロステックの記事から、AIが作成した提案書に関する興味深い議論が展開されています。AIは提案書の作成を効率化しますが、内容までAIに任せきりだと、実際のプロジェクト遂行時に問題が生じる可能性があると指摘しています。特に、AIが生成した提案内容を理解せず、丸投げしてしまうと、プロジェクトがスムーズに進まない恐れがあります。AIツールはあくまでサポートとして活用し、提案内容の本質を理解することが重要であると述べています。 ## 記事28: タイトル: structured-logprobs 要約: AIの応答をより深く理解するためのPythonライブラリ「structured-logprobs」が登場しました。このライブラリは、OpenAIの構造化出力機能と連携し、AIが生成したテキストの各単語(トークン)の信頼度を数値で示します。これにより、AIの応答の確からしさを詳細に分析できます。使い方は簡単で、pipでインストール後、わずかなコードを追加するだけ。応答に信頼度情報を付与したり、テキスト内に直接埋め込んだりできます。AI初心者の方も、このライブラリを使えば、AIの応答をより安心して活用できるようになるでしょう。 ## 記事29: はい、承知いたしました。以下に要約を記載します。 タイトル: ゼロからLLMプロンプトエンジニアリング(2) 世界中のライターに贈る「生成AIで文章校正しないともったいない!」 要約: この記事では、生成AIを活用した文章校正の便利さを紹介しています。AIは大量の文章データから文脈を理解し、誤字脱字だけでなく、文法や表現の改善も提案してくれます。無料のChatGPTやGeminiでも手軽に試せます。機密情報を扱う際は、AIの学習設定に注意が必要です。より実践的なプロンプトを使うことで、AIによる校正精度をさらに高めることができます。文章作成に関わる全ての人にとって、AI校正は強力なツールとなるでしょう。 ## 記事30: ## タイトル: GenAI Acceleration for PyTorch 2.5 on Intel® Xeon®Processors 要約: AIモデルの高速化に焦点を当てた、PyTorchとIntel Xeonプロセッサーに関する最新情報です。今回は、テキスト生成の「GPTFast」、画像認識の「Segment Anything Fast」、画像生成の「Diffusion Fast」という3つのモデルを、CPU環境で高速化する取り組みを紹介します。 これらのモデルは、従来GPUでしか使えなかった処理をCPUで実現し、さらに「torch.compile」や「BFloat16」といった技術を駆使することで、大幅な高速化を達成しました。 特に「GPTFast」では、メモリ効率を高める「重みのみ量子化」も導入し、CPUでのAI処理をより身近にしました。これらの技術により、最大で約4倍の高速化が実現しています。 ## 記事31: タイトル: AIでフリーランスの収入が「減る職種」と「増える職種」。その境目にある“変曲点”とは?(生成AIクローズアップ) 要約: AIの進化が、フリーランスの仕事に大きな変化をもたらしています。翻訳などの分野では、AIが仕事を代替し、収入が減少。一方で、ウェブ開発ではAIが生産性を向上させ、仕事と収入が増加しています。この違いは、AIの能力に関する「変曲点」が職種ごとに異なるためです。AIが変曲点を超えると、人間にとって有益な道具には戻らない可能性も指摘されています。文章作成は代替されやすく、プログラミングも将来的には同様の可能性が。しかし、コミュニケーションや創造性を必要とする仕事は、当面AIが支援ツールとして活躍するでしょう。 ## 記事32: タイトル: 「コロプラは画像生成AIを導入します」公表の背景は 同社の意図と実用のいま、CIOに聞いた(1/4 ページ) 要約: ゲーム会社のコロプラが、画像生成AIを導入し、その活用方針を公表しました。これは業界でも珍しい動きです。コロプラでは、ゲームのアイデア出しやコンセプトアート作成にAIを活用、外部への発注もスムーズに。利用には機密レベルを設定し、申請制度や生成画像の記録も徹底しています。著作権侵害を防ぐガイドラインも策定。AIの進化に対応し、ゲーム体験の向上と生産性アップを目指すとのことです。 ## 記事33: ## タイトル: AIエージェント入門 要約: AIエージェントは、まるで人間のアシスタントのように、環境を認識し、ツールを使って行動する自律的なプログラムです。AI研究の目標とされ、Web検索、コード実行、画像生成など、様々なタスクをこなします。エージェントは、環境と利用可能なツールによって能力が決まり、与えられたタスクを達成するために、計画を立て、実行し、反省します。計画が適切か、ツールの使い方が正しいかなど、様々な失敗モードがあり、評価が重要です。 より強力なAIモデル、適切なツール、そして高度な計画能力が、エージェントの性能を大きく左右します。AIエージェントは、私たちの仕事を効率化し、生活をより豊かにする可能性を秘めているのです。 ## 記事34: タイトル: OpenAI、米政府へのAIの“青写真”を提示 「中国に勝つために」 要約: OpenAIがアメリカ政府に対し、AI分野で中国に勝つための政策提言を発表しました。AIの発展を最大限に活かし、アメリカの経済成長を促すため、データセンターへの電力供給を増やし、太陽光などの新エネルギー源を積極的に構築することを提案。また、同盟国へのAIモデル輸出を自由化し、アメリカ主導のAIエコシステムを作るべきだと訴えています。さらに、AI投資を呼び込み、アメリカが世界のAI競争で優位に立つべきと強調しています。 ## 記事35: タイトル: Clineっておいしいの?おいしいです! 要約: プログラミングを助けるAIツール「Cline」は、従来のコード提案型から進化し、コードの作成、修正、動作確認までをAIが主体的に行う「AIエージェント」です。Visual Studio Codeの拡張機能として提供され、複数の大規模言語モデルを使い分けられます。特に「DeepSeek-V3」はコストを抑えつつ高い性能を発揮。ただし、機密情報の扱いに注意が必要です。Clineは開発効率を向上させる一方、セキュリティ面も考慮して導入しましょう。 ## 本文 みなさん、こんにちは!まるごとAIニュースBIZパーソナリティのれいです。01月15日のAI関連のニュースをお届けします。今日は35本の記事を紹介します。 AIコーディング支援ツール利用時、コードの複雑化に伴い、AIが既存のパターンを無視したり、不要なコードを生成したりする問題が指摘されています。対策として、AIに一度に多くのコードを書かせない、コードレビューを徹底する、チームのコーディング規約をAIに学習させる、などが提案されています。AIを新人プログラマーのように扱い、テストとレビューを怠らないことが重要です。また、AIはテストコード作成や、複雑なコードの説明に役立つという意見もあり、適切な使い方が求められています。 。... AIで重要な役割を果たすベクトルですが、コサイン類似度を安易に使うと、期待と異なる結果を招くことがあります。 コサイン類似度は、ベクトルの類似度を測る便利なツールですが、意味の類似性を正しく捉えられない場合も。 特に、モデルがコサイン類似度で学習していない場合や、求める類似性の種類が異なる場合に問題が起こりやすいです。 より良い結果を得るためには、タスクに合わせた学習、プロンプトの工夫、テキストの前処理が重要です。 闇雲にコサイン類似度に頼るのではなく、目的に合ったベクトル比較を心がけましょう。 。... 従来のAIチャットは、ユーザーが毎回メッセージを送る必要があり、効率が悪く、同時進行も苦手でした。そこで、新しいAI「アンビエントエージェント」が登場。これは、イベントを監視し、必要な時だけユーザーに通知や質問をします。重要な判断は人間が承認する「ヒューマンインザループ」も搭載。これにより、AIは安心して使え、人間との協調もスムーズになります。この技術を使い、メールアシスタントを開発。さらに、開発を容易にする「LangGraph」というツールも公開されました。 。... シンガポールでは、高齢化が急速に進む中、AIが高齢者ケアの重要な役割を担い始めています。介護施設では、ロボットが体操やレクリエーションをサポートし、高齢者の孤独感の軽減に貢献しています。また、AIは音声分析を通じて高齢者のうつ病の早期発見にも活用が期待されています。シンガポール政府はAI技術開発に多額の投資を行い、高齢者ケアの課題解決を目指しています。一方で、ロボットとの過度な関わりが人間関係を希薄にする可能性も指摘され、慎重な利用が求められています。 。... AI開発企業のVoyage AI社は、コード検索に特化した新モデル「voyage-code-3」を発表しました。このモデルは、OpenAIやCodeSageのモデルを大幅に上回る検索精度を持ち、32のデータセットで平均13.8%から16.81%高い性能を示しました。特徴は、Matryoshka学習と量子化技術により、埋め込みベクトルの次元を小さくしたり、データ量を削減できる点です。これにより、ストレージや検索コストを大幅に削減できます。また、様々なデータ形式に対応し、32Kトークンという長い文脈を扱える点も優れています。AI初心者の方でも、より効率的にコード検索ができるようになるでしょう。 。... AIをフル活用中の筆者が、最新モデルを徹底比較!Gemini Advanced、ChatGPT Pro、Claude Professionalなど、複数契約して使い倒した結果をシェアします。大賢者レベルの相談にはGeminiとo1、大量質問にはo1-pro。日常の相談や日本語操作はClaude 3.5 Sonnetが最適。図や画面作成も得意です。幅広い意見収集には、複数モデルへの同時質問が有効。検索はPerplexity一択。コーディングはSonnetと自作ツール併用がおすすめ。OpenAIの最新モデルは指示追従能力が低い一方、Gemini 2.0は高速で賢く、契約価値あり。大賢者活用で知的活動をレベルアップしましょう。 。... AIでブラウザ操作を自動化する「Browser-Use」に、Web UIが登場しました。これにより、AI初心者でも簡単にWebサイト操作が可能に。セットアップは簡単で、様々なAIモデルも利用できます。 Web UIでは、AIエージェントや言語モデル、ブラウザの設定が細かくでき、実行結果や操作履歴も確認可能。実際に、ログイン済みのブラウザで業務システムを操作することも可能です。 AIエージェントは便利な一方、曖昧な指示には弱い側面も。具体的な指示や出力形式の指定が重要です。業務利用では、ドメインを絞り、明確な手順を示すことで、より正確な結果を得られるでしょう。 この技術を通じて、人間同士のコミュニケーションでも、背景や目的を明確に伝えることの大切さを再認識できます。 。... 政府は、AIを使って生まれた発明について、AI開発者も「共同発明者」として特許権を認める検討を始めました。これにより、AI開発者は特許使用料などの対価を受け取れるようになります。これは、AI研究への資金を増やし、技術革新とAI産業の発展を促す狙いがあります。現在、AIは法律上発明者として認められていませんが、この制度が変わるかもしれません。AIがより社会に貢献する未来が期待されます。 。... アメリカのバイデン政権が、AI技術の海外流出を防ぐための新しい規制を発表しました。この規制では、AI開発に使われる半導体の輸出が制限されます。特に、中国やロシアのような「懸念国」への輸出が厳しくなる見込みです。しかし、半導体大手のNVIDIAは、この規制がイノベーションを妨げ、アメリカの安全保障にも役立たないと批判しています。NVIDIAは、トランプ前政権の政策への回帰を期待していると述べています。 。... AI初心者にも分かりやすく、動画を情報源として活用する「VideoRAG」を解説します。従来のRAGはテキスト中心でしたが、VideoRAGは動画を解析できる点が特徴です。動画を4秒ごとに区切り、音声から字幕を生成。動画と字幕を「LVLM」というAIで解析し、質問内容に関連性の高い動画を検索します。これにより、例えば「車のダッシュボードでクッキーを焼く方法」のような具体的な質問にも、動画から手順を抽出して回答できます。まだ課題はあるものの、今後のAI技術発展で、動画をより活用したRAGが期待されます。 。... ニュースです。テキスト投稿サイト「note」が、Googleと提携し、5億円の資金を調達しました。このお金は、AIを使ってnoteをより便利にしたり、新しいAIサービスの研究開発に使われます。具体的には、GoogleのAI「Gemini」をnoteの記事作成画面に導入する予定です。また、クリエイターがAI学習に自分の作品を使うことを許可した場合、その対価を還元する仕組みも作られる見込みです。この提携は、2024年4月ごろから話し合われていたそうです。 。... AIの進化により、複数AIエージェントが連携する「マルチエージェントシステム」が注目されています。これは、複雑なタスクを分担し、各エージェントが専門知識を活かすことで、より効率的かつ高度な問題解決を目指すものです。Amazon Bedrockでは、このシステムを構築するためのフレームワークを提供しています。このフレームワークでは、監督エージェントがタスクを分割し、専門エージェントに指示を出すことで、旅行計画やソフトウェア開発など、様々な分野で高い成果を上げています。従来の単一エージェントと比較して、マルチエージェントシステムはより高い成功率を達成し、その有効性が実証されています。 。... Amazon Bedrock Agentsを拡張し、AWS OutpostsやLocal Zonesといったハイブリッド環境で生成AIアプリを構築する方法をご紹介します。データ保護規制が厳しい環境でも、オンプレミスデータを活用したRAG(検索拡張生成)アプリが可能です。 完全ローカルRAGでは、基盤モデル(LLM)とデータソースをオンプレミスに配置し、機密性の高いデータも安全に処理します。ハイブリッドRAGでは、Bedrock AgentsがクラウドとエッジのLLMを連携させ、データ所在地要件を満たしつつ、最適なモデルを自動選択します。これにより、データ所在地規制に準拠しながら、生成AIの恩恵を最大限に活用できます。AWSワークショップでは、これらの実装を体験できます。 。... ポーランドで公開された映画「プーチン」は、AI技術で俳優の顔にプーチン大統領の顔を重ねて話題です。監督は、AIによって本物そっくりの表現が可能になったと語る一方、この技術利用には倫理的な問題があるとの声も上がっています。映画関係者の中には、ロシアからの報復を恐れる人もいるようですが、監督は全く恐れていないとのことです。この映画は、AIの可能性を示すと同時に、その利用に関する議論を活発化させています。 。... アクセンチュアのCEOがCESで講演し、AIエージェント導入で仕事のやり方が大きく変わったと語りました。同社は業界特化型AIエージェントサービスを提供開始し、社内での利用でアイデア出しから提案までの時間が半減したそうです。AIエージェントは、競合情報と比較してフィードバックを行うなど、業務効率化に貢献。今後は100種類以上のAIエージェント提供を目指すとしています。AI活用による業務変革が加速しそうですね。 。... フリー画像に満足できない?そんな時は画像生成AI「Adobe Firefly」が便利です。ビジネスシーンでも使いやすいのが特徴で、著作権トラブルも比較的少ないため安心です。使い方は簡単!作りたいイメージをテキストで入力するだけで、AIが画像を生成してくれます。さらに、生成後の画像のスタイルや色味の調整、部分的な修正も可能です。プレゼン資料やSNS投稿など、様々な場面で活用できます。 。... アニメ業界に大きな変化の波が来ています。なんと、生成AIを活用することで、アニメ制作コストが従来の10分の1にまで削減できる可能性があるんです。関西テレビでは、世界初のフルAIアニメを制作し、話題となっています。これにより、地方のテレビ局でもオリジナルアニメが作りやすくなり、新たなクリエイターの登場も期待されています。AIがアニメ制作の現場を大きく変えようとしているんですね。 。... かつて富豪たちが競ったのはヨットやプライベートジェットでしたが、今はAI学習用GPUの数です。OpenAIがGPT-4を学習させた時、25,000個のGPUを使いましたが、イーロン・マスク氏やマーク・ザッカーバーグ氏は、それぞれ数十万個単位でのGPU保有を競っています。しかし、AIモデルの学習には必ずしも巨大なデータセンターが必要ではなく、将来的には専用のハードウェアなしで学習できるようになる可能性も出てきています。 。... 定番メディアプレイヤー「VLC media player」に、AIによる字幕生成・翻訳機能が追加されます。この機能はオフラインで動作し、オープンソースのAIモデルを使用。動画の内容が外部に漏れる心配がありません。さらに、日本語を含む多くの言語に対応し、ライブ配信動画にも対応予定。生成した字幕はファイル保存も可能です。AI初心者でも簡単に使え、動画視聴がより便利になります。 。... 筆者は、生成AIを仕事や遊びで積極的に活用しています。特に文章作成や翻訳で、AIは発想を広げたり、人力では難しい作業をこなしたりするのに役立っています。しかし、AI翻訳の普及により、人間の翻訳の価値が下がる可能性も指摘しています。完璧でなくても「だいたい合っている」で済ませる風潮が、人間の翻訳の仕事を奪っていると警鐘を鳴らします。一方で、AI翻訳が言葉の壁を越え、プアな人間同士がコミュニケーションする新たな可能性も感じています。 。... noteがGoogleと提携し、生成AIを活用したサービス開発を加速します。noteはこれまでもAI技術を創作支援に活用してきましたが、今回の提携でさらに強化。クリエイターの創作活動をより強力にバックアップしていく方針です。AI初心者の方にもわかりやすく言うと、AIが皆さんの創作活動をサポートしてくれる、そんな未来が近づいています。 。... AI技術の進化により、2030年頃には、人間ではなくAIエージェントが企業のシステムを主に利用するようになると予測されています。AIエージェントは、自然言語を理解し、複雑なタスクをこなせるようになり、ソフトウェア開発やデータ分析の分野で活躍すると期待されています。また、AIが生成するユーザーインターフェースも登場し、よりパーソナライズされた体験が可能になるでしょう。企業は、AIエージェントを導入する際、安全性と信頼性を確保するための監視体制を構築することが重要になります。 。... アメリカ・ロサンゼルスで発生した大規模な山火事では、AIを活用した火災検知システムが期待されたほどの効果を発揮できませんでした。カリフォルニア州では1100台以上のカメラでAIが火災を監視していましたが、強風と乾燥した気候により火災が急速に拡大。AIが火災を検知しても、対応が間に合わない状況でした。AIは火災の早期発見に役立つものの、自然の猛威には限界があることが示されました。 。... 研究者の皆さん、大変です!AIが作った偽の論文に、あなたの名前が使われているかもしれません。毎日新聞によると、実際に複数の研究者が、身に覚えのない論文に自分の名前が使われているのを発見しました。しかも、論文の削除を求めても、出版社は応じないケースもあるようです。AIを使って簡単に論文が作れてしまう今、このような問題はさらに深刻化する恐れがあります。専門家は「極めて憂慮すべき事態」と警鐘を鳴らしています。AI初心者の皆さんも、他人事ではありません。 。... 2025年、AIエージェントが普及し、AIと働く時代が来ると筆者は予測しています。AIエージェントとは、自律的にタスクを実行するAIシステムのこと。まるで優秀な新卒社員のように、自分で考え、調査し、問題を解決します。重要なのは、AIへの指示の出し方です。指示が上手い人とそうでない人で成果に大きな差が生まれるでしょう。これからは、AIを効果的にマネジメントする能力が求められます。 。... AIエージェントの議論が活発ですが、「完全自律型」こそが素晴らしいという風潮に疑問を感じます。複雑な業務を安定させるには、人間がワークフローを定義する方が現実的です。ユーザーから見て「ほぼ放っておいても結果が出る」なら、内部がどう作られていようと良いのではないでしょうか。自律性の議論は、ユーザー目線か開発者目線かで意見が分かれますが、実際にはグラデーションがあります。また、完全自律型を目指すとしても、業務を学習させるには人間によるフィードバックが不可欠で、結果的にワークフローを学習することになるでしょう。ユーザーに価値を提供することを最優先に考え、必要ならワークフローを構築すべきです。 。... 日経クロステックの記事から、AIが作成した提案書に関する興味深い議論が展開されています。AIは提案書の作成を効率化しますが、内容までAIに任せきりだと、実際のプロジェクト遂行時に問題が生じる可能性があると指摘しています。特に、AIが生成した提案内容を理解せず、丸投げしてしまうと、プロジェクトがスムーズに進まない恐れがあります。AIツールはあくまでサポートとして活用し、提案内容の本質を理解することが重要であると述べています。 。... AIの応答をより深く理解するためのPythonライブラリ「structured-logprobs」が登場しました。このライブラリは、OpenAIの構造化出力機能と連携し、AIが生成したテキストの各単語(トークン)の信頼度を数値で示します。これにより、AIの応答の確からしさを詳細に分析できます。使い方は簡単で、pipでインストール後、わずかなコードを追加するだけ。応答に信頼度情報を付与したり、テキスト内に直接埋め込んだりできます。AI初心者の方も、このライブラリを使えば、AIの応答をより安心して活用できるようになるでしょう。 。... この記事では、生成AIを活用した文章校正の便利さを紹介しています。AIは大量の文章データから文脈を理解し、誤字脱字だけでなく、文法や表現の改善も提案してくれます。無料のChatGPTやGeminiでも手軽に試せます。機密情報を扱う際は、AIの学習設定に注意が必要です。より実践的なプロンプトを使うことで、AIによる校正精度をさらに高めることができます。文章作成に関わる全ての人にとって、AI校正は強力なツールとなるでしょう。 。... AIモデルの高速化に焦点を当てた、PyTorchとIntel Xeonプロセッサーに関する最新情報です。今回は、テキスト生成の「GPTFast」、画像認識の「Segment Anything Fast」、画像生成の「Diffusion Fast」という3つのモデルを、CPU環境で高速化する取り組みを紹介します。 これらのモデルは、従来GPUでしか使えなかった処理をCPUで実現し、さらに「torch.compile」や「BFloat16」といった技術を駆使することで、大幅な高速化を達成しました。 特に「GPTFast」では、メモリ効率を高める「重みのみ量子化」も導入し、CPUでのAI処理をより身近にしました。これらの技術により、最大で約4倍の高速化が実現しています。 。... AIの進化が、フリーランスの仕事に大きな変化をもたらしています。翻訳などの分野では、AIが仕事を代替し、収入が減少。一方で、ウェブ開発ではAIが生産性を向上させ、仕事と収入が増加しています。この違いは、AIの能力に関する「変曲点」が職種ごとに異なるためです。AIが変曲点を超えると、人間にとって有益な道具には戻らない可能性も指摘されています。文章作成は代替されやすく、プログラミングも将来的には同様の可能性が。しかし、コミュニケーションや創造性を必要とする仕事は、当面AIが支援ツールとして活躍するでしょう。 。... ゲーム会社のコロプラが、画像生成AIを導入し、その活用方針を公表しました。これは業界でも珍しい動きです。コロプラでは、ゲームのアイデア出しやコンセプトアート作成にAIを活用、外部への発注もスムーズに。利用には機密レベルを設定し、申請制度や生成画像の記録も徹底しています。著作権侵害を防ぐガイドラインも策定。AIの進化に対応し、ゲーム体験の向上と生産性アップを目指すとのことです。 。... AIエージェントは、まるで人間のアシスタントのように、環境を認識し、ツールを使って行動する自律的なプログラムです。AI研究の目標とされ、Web検索、コード実行、画像生成など、様々なタスクをこなします。エージェントは、環境と利用可能なツールによって能力が決まり、与えられたタスクを達成するために、計画を立て、実行し、反省します。計画が適切か、ツールの使い方が正しいかなど、様々な失敗モードがあり、評価が重要です。 より強力なAIモデル、適切なツール、そして高度な計画能力が、エージェントの性能を大きく左右します。AIエージェントは、私たちの仕事を効率化し、生活をより豊かにする可能性を秘めているのです。 。... OpenAIがアメリカ政府に対し、AI分野で中国に勝つための政策提言を発表しました。AIの発展を最大限に活かし、アメリカの経済成長を促すため、データセンターへの電力供給を増やし、太陽光などの新エネルギー源を積極的に構築することを提案。また、同盟国へのAIモデル輸出を自由化し、アメリカ主導のAIエコシステムを作るべきだと訴えています。さらに、AI投資を呼び込み、アメリカが世界のAI競争で優位に立つべきと強調しています。 。... プログラミングを助けるAIツール「Cline」は、従来のコード提案型から進化し、コードの作成、修正、動作確認までをAIが主体的に行う「AIエージェント」です。Visual Studio Codeの拡張機能として提供され、複数の大規模言語モデルを使い分けられます。特に「DeepSeek-V3」はコストを抑えつつ高い性能を発揮。ただし、機密情報の扱いに注意が必要です。Clineは開発効率を向上させる一方、セキュリティ面も考慮して導入しましょう。 以上で今日の放送を終わります。各記事の詳しい内容はショーノートに書いてありますので、ぜひチェックしてくださいね。それでは、また次回お会いしましょう!パーソナリティのれいでした。

まるごとAIニュースBIZ - 2025-01-14

まるごとAIニュースBIZ - 2025-01-14

Jan 14, 2025

# Show Notes ## 参考記事 - [AI Agents Are Here. What Now?](https://huggingface.co/blog/ethics-soc-7) - [AIエージェント開発を体系的に学ぶには最適の入門書「LangChainとLangGraphによるRAG・AIエージェント[実践]入門」 | DevelopersIO](https://dev.classmethod.jp/articles/review-langchain-langgraph-ai-agent/) - [【Reclineの導入方法あり】GitHub Copilot枠でClineが使えるようなので調べてみた(Recline / VSCode Language Model API / AIプログラミング)](https://shinshin86.hateblo.jp/entry/2025/01/12/195754) - [Acxiom's use of LangSmith for enhanced audience segmentation](https://blog.langchain.dev/customers-acxiom/) - [AIマルチエージェントのアプリをChainlitで爆速開発しよう](https://qiita.com/asuka0708japan/items/cdc9169cd06e03c14ada) - [How we used gpt-4o for image detection with 350 very similar, single image classes.](https://olup-blog.pages.dev/stories/image-detection-cars) - [AIエージェント拡張機能Clineがすごすぎたのでレビュー](https://qiita.com/SatouHa/items/f963d0a68efb03e1d0aa) - [Prime Minister sets out blueprint to turbocharge AI](https://www.gov.uk/government/news/prime-minister-sets-out-blueprint-to-turbocharge-ai) - [近似最近傍探索における新しいビット量子化手法、RaBitQとBBQ](https://takuya-a.net/blog/rabitq-and-bbq-for-ann-quantization/) - [The 2025 AI Engineering Reading List](https://www.latent.space/p/2025-papers) - [AI Tools in Society: Impacts on Cognitive Offloading and the Future of Critical Thinking](https://www.mdpi.com/2075-4698/15/1/6) - [How BQA streamlines education quality reporting using Amazon Bedrock | Amazon Web Services](https://aws.amazon.com/blogs/machine-learning/how-bqa-streamlines-education-quality-reporting-using-amazon-bedrock/) - [データサイエンス系チートシートを網羅してみた](https://qiita.com/tarantula426/items/d8cd79c2bfd649e4f1f1) - [Grokで生成AIに革命が起きそう(主に悪い意味で)|ローゼンカバリー](https://note.com/rosenkavalier/n/n85d87f0f2656) - [Entropy of a Large Language Model output](https://nikkin.dev/blog/llm-entropy.html) - [FACT SHEET: Ensuring U.S. Security and Economic Strength in the Age of Artificial Intelligence | The White House](https://www.whitehouse.gov/briefing-room/statements-releases/2025/01/13/fact-sheet-ensuring-u-s-security-and-economic-strength-in-the-age-of-artificial-intelligence/) - [How to turn off Apple Intelligence on your iPhone](https://www.theverge.com/24340563/apple-intelligence-ios-iphone-disable-how-to) - [VS CodeとAIチャットの往復いらず! 話題の拡張機能Clineで爆速開発してみよう](https://qiita.com/minorun365/items/b2990a7228e8cc4ed025) - [AIの記事のほうが自分で作った記事よりはるかにPVを稼げてしまった](https://qiita.com/NegishiS/items/146cb26e20774d1333d4) ## 要約 ## 記事1: はい、承知いたしました。以下に要約を出力します。 ## タイトル: AIエージェントの登場:今、何をすべきか? AI技術、特にLLM(大規模言語モデル)の急速な進歩により、自律的にデジタル世界で行動できる「AIエージェント」が注目されています。これは、人間が指示しなくても、AIが自らタスクを分解し、実行できることを意味します。 しかし、AIエージェントの自律性が高まるほど、安全性のリスクも増大します。例えば、AIがコードを書いて実行できる場合、人間の制御を完全に無効にできる可能性があります。そのため、完全に自律的なAIエージェントの開発は推奨されていません。 AIエージェントの倫理的な側面を考慮すると、精度、アシスト能力、一貫性、効率性、公平性、人間らしさ、相互運用性、プライバシー、関連性、安全性、科学的進歩、セキュリティ、速度、持続可能性、信頼性、真実性など、多くの価値観について、メリットとリスクを慎重に評価する必要があります。 Hugging Faceでは、AIエージェントの構築と利用を支援するツールを提供していますが、今後の課題として、AIエージェントの評価プロトコルの設計、影響の把握、透明性の向上、オープンソースの推進などが挙げられます。 AIエージェントの開発は、倫理的な観点からも慎重に進める必要があり、技術だけでなく社会的な側面も考慮した上で、より良い未来のために役立てていくことが重要です。 ## 記事2: ## タイトル: AIエージェント開発を体系的に学ぶには最適の入門書「LangChainとLangGraphによるRAG・AIエージェント[実践]入門」 | DevelopersIO 要約: 「LangChainとLangGraphによるRAG・AIエージェント[実践]入門」は、AIエージェント開発を体系的に学べる入門書です。本書では、AIの基礎から、LangChainやLangGraphといったツールを使った実践的な開発までを幅広く解説しています。 まず、LLMやプロンプトエンジニアリングの基本を学び、次にLangChainの概要やLCELといった重要な概念を習得します。RAGアプリの開発知識もカバーされており、検索精度向上のためのテクニックや、LangSmithを使った評価方法も紹介されています。 さらに、AIエージェントの概念から、LangGraphを用いた開発方法、そして要件定義書生成AIエージェントの実践的な開発までをステップごとに学べます。エージェントデザインパターンも紹介されており、実用的なAIエージェント開発を効率的に進めるための知識が身につきます。 この本は、AIエージェント開発に興味がある方や、LangChainを使って開発を始めたい方に最適な一冊です。 ## 記事3: はい、承知いたしました。以下に要約を作成しました。 ## タイトル:【Reclineの導入方法あり】GitHub Copilot枠でClineが使えるようなので調べてみた(Recline / VSCode Language Model API / AIプログラミング) 要約: プログラマーの皆さん、朗報です!AIコーディングを支援するツール「Cline」が、なんとGitHub Copilotの枠を使って利用できるようになるかもしれません。これは、Visual Studio CodeのLanguage Model APIを活用したもので、Clineをより手軽に使えるようになる可能性を秘めています。 現在、Clineのフォーク版である「Recline」を使うのが良さそうです。Reclineは、GitHub CopilotのAPIを通して、ChatGPTなどの様々なAIモデルを呼び出すことができます。これにより、これまでAPI利用料を気にしていた方も、Copilotの定額プラン内でAIコーディングができるようになるかもしれません。 ただし、Reclineには日本語がうまく扱えないという問題も報告されています。具体的には、チャット開始後の2回目以降の日本語での返答が抜け落ちてしまう現象です。もしこの問題に遭遇した場合は、対応策が紹介されている記事を参考にしてください。 Reclineの導入は少し手間がかかりますが、GitHubからコードをダウンロードし、いくつかのコマンドを実行することでインストールできます。AIプログラミングをより身近にするRecline、ぜひ試してみてはいかがでしょうか。 ## 記事4: ## タイトル: AcxiomのLangSmith活用による高度なオーディエンスセグメンテーション 要約: データマーケティングのリーディングカンパニー、Acxiomは、AIを活用した顧客セグメンテーションの高度化に課題を抱えていました。ユーザーの自然言語による指示に基づき、複雑な条件で顧客を分類するシステムを構築する際、既存のログシステムでは対応しきれず、AIの挙動を詳細に把握する必要がありました。そこで、LangChainが開発したLLM(大規模言語モデル)のテスト・監視プラットフォーム「LangSmith」を導入。LangSmithは、LLMの呼び出し、関数の実行、ワークフローを可視化し、複雑なAI処理のデバッグを効率化しました。また、様々なモデルに対応し、既存のシステムを維持したまま導入できた点も評価されています。これにより、AcxiomはAIを活用した顧客セグメンテーションシステムを構築し、より正確で動的なオーディエンスの作成、マーケティング戦略の最適化、コスト管理の効率化を実現しました。LangSmithは、AIの導入と運用を効率化するための強力なツールと言えるでしょう。 ## 記事5: はい、承知いたしました。AI初心者の方にも分かりやすく、アナウンサーが読みやすいように要約します。 タイトル:AIマルチエージェントのアプリをChainlitで爆速開発しよう 要約: AIエージェントの開発、楽しいですよね。でも、せっかく作ったエージェントを一般の人が使えるようにするには、UI、つまり見た目の部分を作るのが意外と大変です。そこで便利なのが「Chainlit」。PythonでチャットアプリのようなUIを簡単に作れるツールです。 Chainlitを使えば、複雑なUIの実装に悩むことなく、AIエージェントの開発に集中できます。認証機能やUIのカスタマイズも簡単。さらに、LangGraphというAIエージェント構築ツールとの連携もスムーズです。 例えば、天気予報を返すAIエージェントをChainlitで作ると、わずかなコードで、チャット形式で天気を聞けるアプリが完成します。マルチエージェント、つまり複数のAIが連携するような複雑なエージェントでも、Chainlitならフロントエンド部分を簡単に作れます。 Chainlitは、チャットの開始や終了などのイベントを捉えて制御できるため、細かい動きも実装可能。AIエージェント開発者は、UIに手間取ることなく、中身の開発に専念できる、まさに救世主のようなツールです。AIアプリ開発、ぜひChainlitを試してみてはいかがでしょうか。 ## 記事6: タイトル:類似画像350枚から特定の一枚をAIで検出!~技術チームの挑戦~ 要約: ある博物館から、展示されている車のイラストと、それに対応する情報をアプリで結びつけたいという依頼がありました。当初はAR技術を検討しましたが、イラストが非常に似通っていて、従来の画像認識では困難を極めました。そこで、まずは機械学習モデルを独自に訓練しましたが、精度が不足。次に、画像の特徴を数値化した「埋め込み」を利用した類似度検索を試しましたが、それでも完璧ではありませんでした。 最終的に、画像とテキストを理解する最新のAIモデル「gpt-4o」を活用。類似度検索で候補を絞った後、「gpt-4o」が最終的な識別を行うという2段階方式で、驚くほどの精度で問題を解決しました。この成功により、既存の画像認識サービスもこの方式に移行。 この事例は、AI技術が、専門家でなくても、製品開発チームで活用できるようになったことを示しています。AIの進化によって、開発チームはよりユーザーに寄り添った製品開発に注力できるようになるでしょう。 ## 記事7: はい、承知いたしました。以下に要約をまとめました。 タイトル: AIエージェント拡張機能Clineがすごすぎたのでレビュー 要約: VSCodeの拡張機能「Cline」は、AIがコード記述、コマンド入力、ブラウザ操作まで行う画期的なツールです。まるで優秀なアシスタントのように、開発効率を大幅に向上させます。OpenAIのAPIを利用するため、別途クレジットが必要ですが、その価値は十分にあります。 Clineの魅力は、まず指示の煩わしさが激減すること。今までは、ChatGPTなどで指示を出す際に何度もコピペが必要でしたが、Clineは、より大きなタスクをまとめてこなしてくれます。また、指示内容の制御がしやすいのも特徴で、具体的な指示や、作業の巻き戻しが簡単に行えます。さらに日本語での入力に対応しており、日本人にとって使いやすいのも嬉しいポイントです。 ただし、高性能なAIを使う場合はコストがかかる点が課題です。例えば、20個のエラーを修正すると100円程度の費用がかかります。 Clineは、まだ大規模開発には向きませんが、個人開発で問題を早く解決したい場合に最適な選択肢と言えるでしょう。まるで人にタスクを依頼するような感覚で開発を進めることができます。 ## 記事8: タイトル: AIで国家を活性化!政府が大胆な計画を発表 要約: 政府はAI技術を積極的に導入し、経済成長と国民生活の向上を目指す新たな計画を発表しました。AIを活用することで、公共サービスの効率化や民間企業の成長を加速させ、年間最大470億ポンドの経済効果を見込んでいます。 具体的には、AIインフラを整備するための「AI成長ゾーン」を新設し、データセンターの建設を迅速化します。また、公共部門でのAI導入を促進し、事務作業の負担を減らし、教育や医療などの現場でAIを活用することでサービスの質を向上させます。 さらに、AI関連の技術開発を加速させるため、スーパーコンピューターを導入し、データアクセスを容易にする国家データライブラリーを設立。これらの取り組みを支援するため、テクノロジー企業は140億ポンドの投資と1万3250人の雇用創出を約束しています。 この計画は、英国をAI分野におけるグローバルリーダーとし、経済成長と国民生活の向上を両立させることを目指すものです。政府は、AI技術の発展に不可欠なエネルギー問題にも対応するため、専門家チームを設立し、クリーンエネルギー技術の導入も進めます。 ## 記事9: はい、承知いたしました。以下に要約を作成します。 ## タイトル: 近似最近傍探索における新しいビット量子化手法、RaBitQとBBQ **要約:** 皆様、こんにちは。本日は、AIの進化に欠かせない技術、「近似最近傍探索」と、その高速化に貢献する「ベクトル量子化」についてお話しします。 Elasticsearch 8.16で導入された新機能「Better Binary Quantization(BBQ)」は、このベクトル量子化技術を応用したものです。BBQは、ベクトルデータをさらにコンパクトなビット形式に変換することで、検索速度を大幅に向上させ、必要なストレージ容量も削減します。 BBQのベースとなっているのは、「RaBitQ」という量子化手法です。RaBitQは、ベクトルの各次元を1ビットにまで量子化することで、データサイズを小さくし、ビット演算による高速な検索を可能にします。 ElasticsearchのBBQでは、RaBitQのようにランダムな変換は行わないものの、ベクトルを8次元単位で量子化し、効率的な検索を実現しています。 これらの技術は、AIが大量のデータを高速に処理し、よりスマートな検索結果を提供するために非常に重要な役割を果たします。BBQの登場により、AIの可能性がさらに広がると期待されます。本日はありがとうございました。 ## 記事10: ## タイトル: The 2025 AI Engineering Reading List 要約: AIエンジニアの皆さん、2025年版の必読論文リストが発表されました。このリストは、AIの基礎から最先端までを網羅し、皆さんのスキルアップを強力にサポートします。内容は、大規模言語モデル(LLM)、評価ベンチマーク、プロンプティング技術、検索拡張生成(RAG)、エージェント、コード生成、画像・音声処理、拡散モデル、ファインチューニングなど、幅広い分野をカバーしています。特に、実務で役立つよう、各論文の重要ポイントが解説されており、「Attention is All You Need」のような基礎的な論文は、実務での必要性が低いという理由で割愛されています。 また、毎週1つずつ論文を読むペースで年間50本程度の論文が推奨されています。さらに、論文を読むだけでなく、技術動向をキャッチアップするために、業界のブログやイベントにも参加することが推奨されています。 このリストを活用し、AIエンジニアとしての成長を加速させましょう。 ## 記事11: ## 出力フォーマット タイトル: AIツールが社会に与える影響:認知オフローディングと批判的思考の未来 要約: 近年、AIツールの普及は目覚ましく、私たちの日常生活の様々な場面で利用されています。しかし、AIツールの利用が、人間の認知能力、特に批判的思考力にどのような影響を与えるのかは、十分に解明されていません。この研究では、AIツール利用と批判的思考力の関係に着目し、認知オフローディングがその関係を仲介する要因となるかを調査しました。 666名を対象とした調査とインタビューの結果、AIツールの利用頻度が高いほど批判的思考力が低下する傾向が明らかになりました。これは、AIツールに頼ることで認知的な負荷が軽減され、深く考える機会が失われるためと考えられます。特に若い世代は、AIツールへの依存度が高く、批判的思考力の低下が顕著でした。一方で、教育水準が高いほど、AIツールの利用に関わらず批判的思考力を維持する傾向が見られました。 この研究は、AIツールの利便性と引き換えに、批判的思考力が低下する可能性を示唆しています。教育現場や社会全体で、AIツールを効果的に活用しつつ、批判的思考力を育成するための戦略が求められます。AI時代において、テクノロジーと人間的思考のバランスをいかに保つかが、今後の重要な課題となるでしょう。 ## 記事12: はい、承知いたしました。以下に要約を作成しました。 --- ## タイトル: BQAはAmazon Bedrockで教育品質報告を効率化 | Amazon Web Services ### 要約: 教育機関の品質評価を行うBQA(教育訓練品質庁)は、報告書の確認作業に課題を抱えていました。大量の書類を手作業で確認するため、時間がかかり、ミスも発生しやすかったのです。そこで、AWSのAI技術を活用し、報告書の処理を自動化するシステムを導入しました。 このシステムでは、まず提出された書類をAmazon S3に保存し、Amazon Textractでテキストを抽出します。次に、抽出したテキストをAmazon Bedrockというサービスで要約し、内容を評価します。特に、Amazon Titan ExpressというAIモデルを使って、報告書が基準を満たしているかをチェックします。 このシステムのおかげで、報告書の作成時間が短縮され、内容の正確性も向上しました。また、AIが要点をまとめることで、審査担当者は重要な情報を素早く把握できるようになりました。さらに、コスト削減や透明性の向上にもつながっています。BQAは、このシステムを通じて、教育の質の向上を促進することを目指しています。 このシステム構築の技術的な詳細については、GitHubリポジトリで公開されています。 --- ## 記事13: タイトル: データサイエンス系チートシートを網羅してみた 要約: データサイエンスの学習を効率化するチートシート集が登場しました。この記事では、データの前処理から可視化、機械学習、深層学習、統計・ベイズ、さらにはキャリア形成まで、幅広い分野を網羅したチートシートがまとめられています。 具体的には、データ分析の基礎となるPythonのライブラリ、PandasやNumpyの必須メソッド、データ可視化に役立つMatplotlibの使い方などが紹介されています。さらに、機械学習モデルの選び方、深層学習の基礎、ベイズ統計の学習スケジュール、そしてデータサイエンティストとしてのキャリア形成に役立つ情報も満載です。 これらのチートシートは、初心者から上級者まで、データサイエンスに関わる全ての人にとって、日々の学習や業務における強力なサポートとなるでしょう。この記事を活用して、効率的にスキルアップを目指しましょう。詳細については、記事本文をご覧ください。 ## 記事14: タイトル: Grokで生成AIに革命が起きそう(主に悪い意味で)|ローゼンカバリー 要約: AI技術Grokの登場が、生成AIの倫理観に大きな波紋を呼んでいます。Grokは、実在の人物の画像を簡単に生成でき、アイドルや有名人のフェイク画像、いわゆる「アイコラ」を容易に作成できてしまうのです。これは、イラストレーターや漫画家の権利侵害だけでなく、フェイクニュースや詐欺にも繋がる危険性を孕んでいます。さらに、児童ポルノの概念が曖昧になり、本来厳しく規制されるべき画像も生成されてしまう状況です。 一方、他の生成AIアプリではエロ関連の規制が厳しくなる中、Grokは緩い規制で、このような倫理的な問題に対して一線を画す姿勢を見せています。この状況が続けば、他のAIサービスも規制を緩めざるを得なくなるかもしれません。 筆者は、今までルールの中で微エロ画像を生成していたものの、実在人物のフェイク画像や児童ポルノの生成は問題だと指摘しています。Grokの台頭が、生成AIの規制の在り方、ひいては社会全体に影響を与える可能性があると警鐘を鳴らしています。 ## 記事15: はい、承知いたしました。以下に要約を作成します。 ## タイトル: 大規模言語モデルの出力におけるエントロピー **要約:** 皆さん、最近話題のChatGPTのような大規模言語モデル(LLM)は、文章を作る際に次にどの言葉が来るかを予測しています。この予測には確率が伴い、その不確かさを表す指標が「エントロピー」です。エントロピーが高いほど、モデルは次にどの言葉を選ぶか迷っている状態、低いほど自信がある状態と言えます。 例えば、「AIについて俳句を書いて」とChatGPTに尋ねると、文末や単語の切れ目ではエントロピーが低くなる傾向があります。また、事実に基づいた内容ではエントロピーが低く、描写的な内容では高くなる傾向が見られました。これは、事実に基づいた内容は答えが一つに絞られやすい一方、描写的な内容は様々な表現が可能なためと考えられます。 さらに、タミル語でのテキスト生成においても、文字単位で確率分布を分析することで、モデルの細かな挙動を評価できることが分かりました。この実験を通して、LLMの出力における確率的な側面をエントロピーという概念で捉えることで、モデルの挙動をより深く理解できる可能性が示唆されました。 ## 記事16: ## 出力 タイトル: FACT SHEET: Ensuring U.S. Security and Economic Strength in the Age of Artificial Intelligence | The White House 要約: AIが安全保障と経済力の要となる中、アメリカはAI技術で主導権を握るため、新たな規制を発表しました。この規制は、アメリカのAI技術が世界で使われ、悪用されないようにするのが目的です。具体的には、同盟国にはチップ販売の制限をなくし、大学や研究機関などには比較的少ない数のチップを許可制なしで輸出します。信頼できる企業には、AI計算能力を大幅に拡大できる特別な資格を与え、アメリカのAI技術を安全に利用できるようにします。一方、懸念のある国には、最先端AIシステムの開発にチップを使わせないよう厳しく規制します。この規制は、アメリカのAI技術を広げながら、国家安全保障を守るための重要な一歩です。AIの安全な利用と国際的な協力を進め、アメリカがAI分野で主導的な役割を果たすことを目指します。 ## 記事17: ## タイトル: iPhoneのApple Intelligenceをオフにする方法 要約: 最近、iPhoneやMacでAI機能が当たり前になってきていますが、アップルの「Apple Intelligence」もその一つです。しかし、この機能に価値を感じないユーザーも多く、実際、約75%のiPhoneユーザーがそう感じているという調査結果もあります。Apple Intelligenceは7GBものストレージを消費するため、不要と感じるならオフにすることも可能です。個別の機能をオフにするには、設定から「Apple Intelligence & Siri」メニューを開きます。ここでChatGPTの連携や通知の要約などを個別に設定できます。また、「スクリーンタイム」から「コンテンツとプライバシーの制限」を経由して、文章作成ツールや画像生成機能をオフにすることも可能です。メールの優先度表示も非表示にできます。もし、Apple Intelligenceを完全にオフにしたい場合は、「Apple Intelligence & Siri」メニューで一括でオフにできます。ただし、AIモデル自体は7GB程度を消費し、残ったままになります。完全に削除するには、iPhoneを初期化する必要があります。現時点では、Apple Intelligenceはオプションですが、今後もそうであるとは限りません。 ## 記事18: はい、承知いたしました。以下に要約を作成しました。 タイトル: VS CodeとAIチャットの往復いらず! 話題の拡張機能Clineで爆速開発してみよう 要約: エンジニア界隈で話題の「Cline」は、VS Codeの拡張機能で、AIとチャットしながら開発をサポートしてくれるツールです。 これまで、ChatGPTなどのAIとエディタを行き来していた手間を省き、開発効率を大幅に向上させます。 Clineは、リポジトリ内のファイルを理解し、ターミナルコマンドの実行やコード生成も可能です。 カスタマイズ性も高く、どこまでAIに任せるかを調整できます。 実際にアプリの修正をClineに依頼したところ、プログレスバーの追加を提案、コードの修正からライブラリのインストールまで、スムーズに進みました。 ただし、AIが生成したコードに誤りが見つかることもあり、一定の開発スキルは必要です。 Clineの利用コストは、API利用料のみで、使いすぎには注意が必要です。 また、「@」コマンドでURLを付与することで、最新情報を参照させることも可能です。 Clineは、AIを活用した開発を加速させる強力なツールとなるでしょう。 ## 記事19: ## 出力フォーマット タイトル: AIの記事のほうが自分で作った記事よりはるかにPVを稼げてしまった 要約: AIを駆使してブログ記事を量産している筆者の体験談です。なんと、AIが書いた記事の方がPV数を大きく伸ばすという結果に。記事作成には「Perplexity」を活用し、コードの誤りを減らしているそうです。AIに記事を書かせるコツは、最後に「Answer is Friendly Japanese Blog Article with Many Chapters and Codes」と加えること。これにより、通勤時間にも記事作成が可能になったそうです。今後はトレンド技術を中心に100記事を目指すとのこと。SNSの受け身な利用ではなく、クリエイターとして活動したいという思いが綴られています。AIの進化に脅威を感じつつも、自身の魅力を磨き、AIに負けない人生を歩みたいという熱意が伝わってくる内容です。 ## 本文 みなさん、こんにちは!まるごとAIニュースBIZパーソナリティのれいです。01月14日のAI関連のニュースをお届けします。今日は19本の記事を紹介します。 AIエージェントの登場:今、何をすべきか?。.. AI技術、特にLLM(大規模言語モデル)の急速な進歩により、自律的にデジタル世界で行動できる「AIエージェント」が注目されています。これは、人間が指示しなくても、AIが自らタスクを分解し、実行できることを意味します。しかし、AIエージェントの自律性が高まるほど、安全性のリスクも増大します。例えば、AIがコードを書いて実行できる場合、人間の制御を完全に無効にできる可能性があります。そのため、完全に自律的なAIエージェントの開発は推奨されていません。AIエージェントの倫理的な側面を考慮すると、精度、アシスト能力、一貫性、効率性、公平性、人間らしさ、相互運用性、プライバシー、関連性、安全性、科学的進歩、セキュリティ、速度、持続可能性、信頼性、真実性など、多くの価値観について、メリットとリスクを慎重に評価する必要があります。Hugging Faceでは、AIエージェントの構築と利用を支援するツールを提供していますが、今後の課題として、AIエージェントの評価プロトコルの設計、影響の把握、透明性の向上、オープンソースの推進などが挙げられます。AIエージェントの開発は、倫理的な観点からも慎重に進める必要があり、技術だけでなく社会的な側面も考慮した上で、より良い未来のために役立てていくことが重要です。 。.. LangChainとLangGraphによるRAG・AIエージェント[実践]入門」 | DevelopersIO。.. 「LangChainとLangGraphによるRAG・AIエージェント[実践]入門」は、AIエージェント開発を体系的に学べる入門書です。本書では、AIの基礎から、LangChainやLangGraphといったツールを使った実践的な開発までを幅広く解説しています。まず、LLMやプロンプトエンジニアリングの基本を学び、次にLangChainの概要やLCELといった重要な概念を習得します。RAGアプリの開発知識もカバーされており、検索精度向上のためのテクニックや、LangSmithを使った評価方法も紹介されています。さらに、AIエージェントの概念から、LangGraphを用いた開発方法、そして要件定義書生成AIエージェントの実践的な開発までをステップごとに学べます。エージェントデザインパターンも紹介されており、実用的なAIエージェント開発を効率的に進めるための知識が身につきます。この本は、AIエージェント開発に興味がある方や、LangChainを使って開発を始めたい方に最適な一冊です。 。.. 【Reclineの導入方法あり】GitHub Copilot枠でClineが使えるようなので調べてみた(Recline / VSCode Language Model API / AIプログラミング)。.. プログラマーの皆さん、朗報です!AIコーディングを支援するツール「Cline」が、なんとGitHub Copilotの枠を使って利用できるようになるかもしれません。これは、Visual Studio CodeのLanguage Model APIを活用したもので、Clineをより手軽に使えるようになる可能性を秘めています。現在、Clineのフォーク版である「Recline」を使うのが良さそうです。Reclineは、GitHub CopilotのAPIを通して、ChatGPTなどの様々なAIモデルを呼び出すことができます。これにより、これまでAPI利用料を気にしていた方も、Copilotの定額プラン内でAIコーディングができるようになるかもしれません。ただし、Reclineには日本語がうまく扱えないという問題も報告されています。具体的には、チャット開始後の2回目以降の日本語での返答が抜け落ちてしまう現象です。もしこの問題に遭遇した場合は、対応策が紹介されている記事を参考にしてください。Reclineの導入は少し手間がかかりますが、GitHubからコードをダウンロードし、いくつかのコマンドを実行することでインストールできます。AIプログラミングをより身近にするRecline、ぜひ試してみてはいかがでしょうか。 。.. AcxiomのLangSmith活用による高度なオーディエンスセグメンテーション。.. データマーケティングのリーディングカンパニー、Acxiomは、AIを活用した顧客セグメンテーションの高度化に課題を抱えていました。ユーザーの自然言語による指示に基づき、複雑な条件で顧客を分類するシステムを構築する際、既存のログシステムでは対応しきれず、AIの挙動を詳細に把握する必要がありました。そこで、LangChainが開発したLLM(大規模言語モデル)のテスト・監視プラットフォーム「LangSmith」を導入。LangSmithは、LLMの呼び出し、関数の実行、ワークフローを可視化し、複雑なAI処理のデバッグを効率化しました。また、様々なモデルに対応し、既存のシステムを維持したまま導入できた点も評価されています。これにより、AcxiomはAIを活用した顧客セグメンテーションシステムを構築し、より正確で動的なオーディエンスの作成、マーケティング戦略の最適化、コスト管理の効率化を実現しました。LangSmithは、AIの導入と運用を効率化するための強力なツールと言えるでしょう。 。.. AIマルチエージェントのアプリをChainlitで爆速開発しよう。.. AIエージェントの開発、楽しいですよね。でも、せっかく作ったエージェントを一般の人が使えるようにするには、UI、つまり見た目の部分を作るのが意外と大変です。そこで便利なのが「Chainlit」。PythonでチャットアプリのようなUIを簡単に作れるツールです。Chainlitを使えば、複雑なUIの実装に悩むことなく、AIエージェントの開発に集中できます。認証機能やUIのカスタマイズも簡単。さらに、LangGraphというAIエージェント構築ツールとの連携もスムーズです。例えば、天気予報を返すAIエージェントをChainlitで作ると、わずかなコードで、チャット形式で天気を聞けるアプリが完成します。マルチエージェント、つまり複数のAIが連携するような複雑なエージェントでも、Chainlitならフロントエンド部分を簡単に作れます。Chainlitは、チャットの開始や終了などのイベントを捉えて制御できるため、細かい動きも実装可能。AIエージェント開発者は、UIに手間取ることなく、中身の開発に専念できる、まさに救世主のようなツールです。AIアプリ開発、ぜひChainlitを試してみてはいかがでしょうか。 。.. 類似画像350枚から特定の一枚をAIで検出!~技術チームの挑戦~。.. ある博物館から、展示されている車のイラストと、それに対応する情報をアプリで結びつけたいという依頼がありました。当初はAR技術を検討しましたが、イラストが非常に似通っていて、従来の画像認識では困難を極めました。そこで、まずは機械学習モデルを独自に訓練しましたが、精度が不足。次に、画像の特徴を数値化した「埋め込み」を利用した類似度検索を試しましたが、それでも完璧ではありませんでした。最終的に、画像とテキストを理解する最新のAIモデル「gpt-4o」を活用。類似度検索で候補を絞った後、「gpt-4o」が最終的な識別を行うという2段階方式で、驚くほどの精度で問題を解決しました。この成功により、既存の画像認識サービスもこの方式に移行。この事例は、AI技術が、専門家でなくても、製品開発チームで活用できるようになったことを示しています。AIの進化によって、開発チームはよりユーザーに寄り添った製品開発に注力できるようになるでしょう。 。.. AIエージェント拡張機能Clineがすごすぎたのでレビュー。.. VSCodeの拡張機能「Cline」は、AIがコード記述、コマンド入力、ブラウザ操作まで行う画期的なツールです。まるで優秀なアシスタントのように、開発効率を大幅に向上させます。OpenAIのAPIを利用するため、別途クレジットが必要ですが、その価値は十分にあります。Clineの魅力は、まず指示の煩わしさが激減すること。今までは、ChatGPTなどで指示を出す際に何度もコピペが必要でしたが、Clineは、より大きなタスクをまとめてこなしてくれます。また、指示内容の制御がしやすいのも特徴で、具体的な指示や、作業の巻き戻しが簡単に行えます。さらに日本語での入力に対応しており、日本人にとって使いやすいのも嬉しいポイントです。ただし、高性能なAIを使う場合はコストがかかる点が課題です。例えば、20個のエラーを修正すると100円程度の費用がかかります。Clineは、まだ大規模開発には向きませんが、個人開発で問題を早く解決したい場合に最適な選択肢と言えるでしょう。まるで人にタスクを依頼するような感覚で開発を進めることができます。 。.. AIで国家を活性化!政府が大胆な計画を発表。.. 政府はAI技術を積極的に導入し、経済成長と国民生活の向上を目指す新たな計画を発表しました。AIを活用することで、公共サービスの効率化や民間企業の成長を加速させ、年間最大470億ポンドの経済効果を見込んでいます。具体的には、AIインフラを整備するための「AI成長ゾーン」を新設し、データセンターの建設を迅速化します。また、公共部門でのAI導入を促進し、事務作業の負担を減らし、教育や医療などの現場でAIを活用することでサービスの質を向上させます。さらに、AI関連の技術開発を加速させるため、スーパーコンピューターを導入し、データアクセスを容易にする国家データライブラリーを設立。これらの取り組みを支援するため、テクノロジー企業は140億ポンドの投資と1万3250人の雇用創出を約束しています。この計画は、英国をAI分野におけるグローバルリーダーとし、経済成長と国民生活の向上を両立させることを目指すものです。政府は、AI技術の発展に不可欠なエネルギー問題にも対応するため、専門家チームを設立し、クリーンエネルギー技術の導入も進めます。 。.. 近似最近傍探索における新しいビット量子化手法、RaBitQとBBQ。.. 皆様、こんにちは。本日は、AIの進化に欠かせない技術、「近似最近傍探索」と、その高速化に貢献する「ベクトル量子化」についてお話しします。Elasticsearch 8.16で導入された新機能「Better Binary Quantization(BBQ)」は、このベクトル量子化技術を応用したものです。BBQは、ベクトルデータをさらにコンパクトなビット形式に変換することで、検索速度を大幅に向上させ、必要なストレージ容量も削減します。BBQのベースとなっているのは、「RaBitQ」という量子化手法です。RaBitQは、ベクトルの各次元を1ビットにまで量子化することで、データサイズを小さくし、ビット演算による高速な検索を可能にします。ElasticsearchのBBQでは、RaBitQのようにランダムな変換は行わないものの、ベクトルを8次元単位で量子化し、効率的な検索を実現しています。これらの技術は、AIが大量のデータを高速に処理し、よりスマートな検索結果を提供するために非常に重要な役割を果たします。BBQの登場により、AIの可能性がさらに広がると期待されます。本日はありがとうございました。 。.. The 2025 AI Engineering Reading List。.. AIエンジニアの皆さん、2025年版の必読論文リストが発表されました。このリストは、AIの基礎から最先端までを網羅し、皆さんのスキルアップを強力にサポートします。内容は、大規模言語モデル(LLM)、評価ベンチマーク、プロンプティング技術、検索拡張生成(RAG)、エージェント、コード生成、画像・音声処理、拡散モデル、ファインチューニングなど、幅広い分野をカバーしています。特に、実務で役立つよう、各論文の重要ポイントが解説されており、「Attention is All You Need」のような基礎的な論文は、実務での必要性が低いという理由で割愛されています。また、毎週1つずつ論文を読むペースで年間50本程度の論文が推奨されています。さらに、論文を読むだけでなく、技術動向をキャッチアップするために、業界のブログやイベントにも参加することが推奨されています。このリストを活用し、AIエンジニアとしての成長を加速させましょう。 。.. AIツールが社会に与える影響:認知オフローディングと批判的思考の未来。.. 近年、AIツールの普及は目覚ましく、私たちの日常生活の様々な場面で利用されています。しかし、AIツールの利用が、人間の認知能力、特に批判的思考力にどのような影響を与えるのかは、十分に解明されていません。この研究では、AIツール利用と批判的思考力の関係に着目し、認知オフローディングがその関係を仲介する要因となるかを調査しました。666名を対象とした調査とインタビューの結果、AIツールの利用頻度が高いほど批判的思考力が低下する傾向が明らかになりました。これは、AIツールに頼ることで認知的な負荷が軽減され、深く考える機会が失われるためと考えられます。特に若い世代は、AIツールへの依存度が高く、批判的思考力の低下が顕著でした。一方で、教育水準が高いほど、AIツールの利用に関わらず批判的思考力を維持する傾向が見られました。この研究は、AIツールの利便性と引き換えに、批判的思考力が低下する可能性を示唆しています。教育現場や社会全体で、AIツールを効果的に活用しつつ、批判的思考力を育成するための戦略が求められます。AI時代において、テクノロジーと人間的思考のバランスをいかに保つかが、今後の重要な課題となるでしょう。 。.. BQAはAmazon Bedrockで教育品質報告を効率化 | Amazon Web Services。.. 教育機関の品質評価を行うBQA(教育訓練品質庁)は、報告書の確認作業に課題を抱えていました。大量の書類を手作業で確認するため、時間がかかり、ミスも発生しやすかったのです。そこで、AWSのAI技術を活用し、報告書の処理を自動化するシステムを導入しました。このシステムでは、まず提出された書類をAmazon S3に保存し、Amazon Textractでテキストを抽出します。次に、抽出したテキストをAmazon Bedrockというサービスで要約し、内容を評価します。特に、Amazon Titan ExpressというAIモデルを使って、報告書が基準を満たしているかをチェックします。このシステムのおかげで、報告書の作成時間が短縮され、内容の正確性も向上しました。また、AIが要点をまとめることで、審査担当者は重要な情報を素早く把握できるようになりました。さらに、コスト削減や透明性の向上にもつながっています。BQAは、このシステムを通じて、教育の質の向上を促進することを目指しています。このシステム構築の技術的な詳細については、GitHubリポジトリで公開されています。 。.. データサイエンス系チートシートを網羅してみた。.. データサイエンスの学習を効率化するチートシート集が登場しました。この記事では、データの前処理から可視化、機械学習、深層学習、統計・ベイズ、さらにはキャリア形成まで、幅広い分野を網羅したチートシートがまとめられています。具体的には、データ分析の基礎となるPythonのライブラリ、PandasやNumpyの必須メソッド、データ可視化に役立つMatplotlibの使い方などが紹介されています。さらに、機械学習モデルの選び方、深層学習の基礎、ベイズ統計の学習スケジュール、そしてデータサイエンティストとしてのキャリア形成に役立つ情報も満載です。これらのチートシートは、初心者から上級者まで、データサイエンスに関わる全ての人にとって、日々の学習や業務における強力なサポートとなるでしょう。この記事を活用して、効率的にスキルアップを目指しましょう。詳細については、記事本文をご覧ください。 。.. Grokで生成AIに革命が起きそう(主に悪い意味で)|ローゼンカバリー。.. AI技術Grokの登場が、生成AIの倫理観に大きな波紋を呼んでいます。Grokは、実在の人物の画像を簡単に生成でき、アイドルや有名人のフェイク画像、いわゆる「アイコラ」を容易に作成できてしまうのです。これは、イラストレーターや漫画家の権利侵害だけでなく、フェイクニュースや詐欺にも繋がる危険性を孕んでいます。さらに、児童ポルノの概念が曖昧になり、本来厳しく規制されるべき画像も生成されてしまう状況です。一方、他の生成AIアプリではエロ関連の規制が厳しくなる中、Grokは緩い規制で、このような倫理的な問題に対して一線を画す姿勢を見せています。この状況が続けば、他のAIサービスも規制を緩めざるを得なくなるかもしれません。筆者は、今までルールの中で微エロ画像を生成していたものの、実在人物のフェイク画像や児童ポルノの生成は問題だと指摘しています。Grokの台頭が、生成AIの規制の在り方、ひいては社会全体に影響を与える可能性があると警鐘を鳴らしています。 。.. 大規模言語モデルの出力におけるエントロピー。.. 皆さん、最近話題のChatGPTのような大規模言語モデル(LLM)は、文章を作る際に次にどの言葉が来るかを予測しています。この予測には確率が伴い、その不確かさを表す指標が「エントロピー」です。エントロピーが高いほど、モデルは次にどの言葉を選ぶか迷っている状態、低いほど自信がある状態と言えます。例えば、「AIについて俳句を書いて」とChatGPTに尋ねると、文末や単語の切れ目ではエントロピーが低くなる傾向があります。また、事実に基づいた内容ではエントロピーが低く、描写的な内容では高くなる傾向が見られました。これは、事実に基づいた内容は答えが一つに絞られやすい一方、描写的な内容は様々な表現が可能なためと考えられます。さらに、タミル語でのテキスト生成においても、文字単位で確率分布を分析することで、モデルの細かな挙動を評価できることが分かりました。この実験を通して、LLMの出力における確率的な側面をエントロピーという概念で捉えることで、モデルの挙動をより深く理解できる可能性が示唆されました。 。.. FACT SHEET: Ensuring U.S. Security and Economic Strength in the Age of Artificial Intelligence | The White House。.. AIが安全保障と経済力の要となる中、アメリカはAI技術で主導権を握るため、新たな規制を発表しました。この規制は、アメリカのAI技術が世界で使われ、悪用されないようにするのが目的です。具体的には、同盟国にはチップ販売の制限をなくし、大学や研究機関などには比較的少ない数のチップを許可制なしで輸出します。信頼できる企業には、AI計算能力を大幅に拡大できる特別な資格を与え、アメリカのAI技術を安全に利用できるようにします。一方、懸念のある国には、最先端AIシステムの開発にチップを使わせないよう厳しく規制します。この規制は、アメリカのAI技術を広げながら、国家安全保障を守るための重要な一歩です。AIの安全な利用と国際的な協力を進め、アメリカがAI分野で主導的な役割を果たすことを目指します。 。.. iPhoneのApple Intelligenceをオフにする方法。.. 最近、iPhoneやMacでAI機能が当たり前になってきていますが、アップルの「Apple Intelligence」もその一つです。しかし、この機能に価値を感じないユーザーも多く、実際、約75%のiPhoneユーザーがそう感じているという調査結果もあります。Apple Intelligenceは7GBものストレージを消費するため、不要と感じるならオフにすることも可能です。個別の機能をオフにするには、設定から「Apple Intelligence & Siri」メニューを開きます。ここでChatGPTの連携や通知の要約などを個別に設定できます。また、「スクリーンタイム」から「コンテンツとプライバシーの制限」を経由して、文章作成ツールや画像生成機能をオフにすることも可能です。メールの優先度表示も非表示にできます。もし、Apple Intelligenceを完全にオフにしたい場合は、「Apple Intelligence & Siri」メニューで一括でオフにできます。ただし、AIモデル自体は7GB程度を消費し、残ったままになります。完全に削除するには、iPhoneを初期化する必要があります。現時点では、Apple Intelligenceはオプションですが、今後もそうであるとは限りません。 。.. VS CodeとAIチャットの往復いらず! 話題の拡張機能Clineで爆速開発してみよう。.. エンジニア界隈で話題の「Cline」は、VS Codeの拡張機能で、AIとチャットしながら開発をサポートしてくれるツールです。これまで、ChatGPTなどのAIとエディタを行き来していた手間を省き、開発効率を大幅に向上させます。Clineは、リポジトリ内のファイルを理解し、ターミナルコマンドの実行やコード生成も可能です。カスタマイズ性も高く、どこまでAIに任せるかを調整できます。実際にアプリの修正をClineに依頼したところ、プログレスバーの追加を提案、コードの修正からライブラリのインストールまで、スムーズに進みました。ただし、AIが生成したコードに誤りが見つかることもあり、一定の開発スキルは必要です。Clineの利用コストは、API利用料のみで、使いすぎには注意が必要です。また、「@」コマンドでURLを付与することで、最新情報を参照させることも可能です。Clineは、AIを活用した開発を加速させる強力なツールとなるでしょう。 。.. AIの記事のほうが自分で作った記事よりはるかにPVを稼げてしまった。.. AIを駆使してブログ記事を量産している筆者の体験談です。なんと、AIが書いた記事の方がPV数を大きく伸ばすという結果に。記事作成には「Perplexity」を活用し、コードの誤りを減らしているそうです。AIに記事を書かせるコツは、最後に「Answer is Friendly Japanese Blog Article with Many Chapters and Codes」と加えること。これにより、通勤時間にも記事作成が可能になったそうです。今後はトレンド技術を中心に100記事を目指すとのこと。SNSの受け身な利用ではなく、クリエイターとして活動したいという思いが綴られています。AIの進化に脅威を感じつつも、自身の魅力を磨き、AIに負けない人生を歩みたいという熱意が伝わってくる内容です。 以上で今日の放送を終わります。各記事の詳しい内容はショーノートに書いてありますので、ぜひチェックしてくださいね。それでは、また次回お会いしましょう!パーソナリティのれいでした。

まるごとAIニュースBIZ - 2025-01-10

まるごとAIニュースBIZ - 2025-01-10

Jan 10, 2025

# Show Notes ## 参考記事 - [Evaluating Audio Reasoning with Big Bench Audio](https://huggingface.co/blog/big-bench-audio-release) - [RAG普及で加速する製造業のナレッジ活用 技術継承への貢献にも期待:MONOist 2025年展望(1/3 ページ)](https://monoist.itmedia.co.jp/mn/articles/2501/09/news092.html) - [低コスト&爆速でコード修正!AIエージェントを実務の開発でも試してみる](https://zenn.dev/ubie_dev/articles/624c9034cc9b43) - [Accurate predictions on small data with a tabular foundation model](https://www.nature.com/articles/s41586-024-08328-6) - [Benchmarking Language Model Performance on 5th Gen Xeon at GCP](https://huggingface.co/blog/intel-gcp-c4) - [Integrating Ascend Backend with Torchtune through PyTorch Multi-Device Support](https://pytorch.org/blog/ascend-backend-w-torchtune/) - [CO₂ Emissions and Models Performance: Insights from the Open LLM Leaderboard](https://huggingface.co/blog/leaderboard-emissions-analysis) - [microsoft/phi-4 · Hugging Face](https://huggingface.co/microsoft/phi-4) - [思いつきで作ったAIツールが5000スターを獲得した話](https://zenn.dev/yamadashy/articles/ai-tool-repomix-5000-star) - [手のひらサイズのロボット犬「Bittle X」、ChatGPTと統合してより自然なコミュニケーションが可能に - fabcross for エンジニア](https://engineer.fabcross.jp/archeive/250107_petoi-bittle-x.html) - [Build AI-powered malware analysis using Amazon Bedrock with Deep Instinct | Amazon Web Services](https://aws.amazon.com/blogs/machine-learning/build-ai-powered-malware-analysis-using-amazon-bedrock-with-deep-instinct/) - [ロボット関連 のAIリリース年表|npaka](https://note.com/npaka/n/n491013486de6) - [Stability AI、画像を1秒で3Dモデル化する「Stable Point Aware 3D」を発表、リアルタイム編集も可能](https://forest.watch.impress.co.jp/docs/news/1653138.html) - [Microsoft、小規模言語モデル(SLM)の「Phi-4」をMITライセンスで公開](https://www.itmedia.co.jp/news/articles/2501/09/news106.html) - [Controlling Language Model Generation with NVIDIA's LogitsProcessorZoo](https://huggingface.co/blog/logits-processor-zoo) - [Introducing the Synthetic Data Generator - Build Datasets with Natural Language](https://huggingface.co/blog/synthetic-data-generator) - [NVIDIAから個人向け小型AIスパコン 1台3000ドル 最大2000億パラメータのLLMを実行可](https://www.itmedia.co.jp/aiplus/articles/2501/07/news162.html) - [How to become a Data Scientist? | MLJAR](https://mljar.com/blog/how-to-become-data-scientist/) - [Visualize and understand GPU memory in PyTorch](https://huggingface.co/blog/train_memory) - [すがやみつるが推す「AI駆動プログラミング」に挑戦した爽快な一冊](https://bookplus.nikkei.com/atcl/column/041100040/120600045/) - [Build an Amazon Bedrock based digital lending solution on AWS | Amazon Web Services](https://aws.amazon.com/blogs/machine-learning/build-an-amazon-bedrock-based-digital-lending-solution-on-aws/) - [「Don’t Do RAG」巨大コンテキストを活かした超高速なCAGという新手法【論文解説】](https://zenn.dev/chips0711/articles/8460b7db255f02) - [【AI開発】VSCode拡張機能「Cline」とは?使い方やCusorとの違いを徹底解説 | AI総合研究所](https://www.ai-souken.com/article/what-is-cline) - [「GitHub Copilot」無償プランがJetBrains社製IDEに対応、「Android Studio」でも利用可](https://forest.watch.impress.co.jp/docs/news/1653121.html) - [Kaggleで高額賞金のChess AIのコンペが始まる | やねうら王 公式サイト](https://yaneuraou.yaneu.com/2025/01/03/a-high-prize-chess-ai-competition-is-starting-on-kaggle/) - [動画生成AIでスケッチを描くように妄想を生成する/スケッチブックを開いて「ラフな絵を描く」ようなカジュアルな映像制作が良い/ Blog - 2025/01/07|CreativeEdge Vlog](https://note.com/creative_edge/n/n0317d2f9048d) - [LLMの脆弱性を無料で診断できるツールGarakが登場 多岐にわたる機能を提供:セキュリティソリューション](https://www.itmedia.co.jp/enterprise/articles/2501/09/news065.html) - [NVIDIA、ローカルで動く基盤モデルでPCデスクトップ上に表情のあるキャラクターを表示。アプリの使い方や文章の要約などをしてくれる「Project R2X」発表](https://www.publickey1.jp/blog/25/nvidiapcproject_r2x.html) - [AIインフラ革命 ─ 米国データセンターとGPUを支える技術基盤(Rethinking AI Infrastructure Part 1)](https://techblog.lycorp.co.jp/ja/20250109a) - [Welcome to the Falcon 3 Family of Open Models!](https://huggingface.co/blog/falcon3) - [Bamba: Inference-Efficient Hybrid Mamba2 Model](https://huggingface.co/blog/bamba) - [世界企業の41%、2030年までに人員削減の意向 AIによる業務自動化で](https://www.cnn.co.jp/business/35228083.html) - [Kaggleコンペティション「Eedi – Mining Misconceptions in Mathematics」で得られた学び](https://tech.andpad.co.jp/entry/2025/01/08/100000) - [NVIDIAから「超ハイスペックなMac mini」みたいな最強ミニAIスパコン登場](https://www.gizmodo.jp/2025/01/project-digits.html) - [TypeScriptで作る自動運転UI](https://zenn.dev/turing_motors/articles/6ad90d261be8c6) - [ドット絵を作るGPTsを作ったら反応が良かった件(GPTs配布あり)|けいすけ / AIマンガ家](https://note.com/konho/n/n70aaeb24ee42) - [XのAI「Grok」に不快で不適切で攻撃的な「Unhinged(たがが外れた)モード」が追加される可能性](https://gigazine.net/news/20250109-x-unhinged-mode/) - [Introducing smolagents: simple agents that write actions in code.](https://huggingface.co/blog/smolagents) ## 要約 ## 記事1: はい、承知いたしました。以下に要約を作成しました。 --- タイトル:音声AIの推論能力を測る「Big Bench Audio」データセット 要約: AIの音声処理能力が進化する中、その推論能力を評価する新しいデータセット「Big Bench Audio」が公開されました。このデータセットは、高度な推論力を試す「Big Bench Hard」の質問を音声化し、1000個の質問で構成されています。 実験では、GPT-4oなどのモデルを使い、音声入力から音声出力、音声からテキスト、テキストから音声、テキストからテキストの4つの形式でテストしました。その結果、テキストでの推論に比べ、音声での推論では大きな性能低下が見られました。例えば、GPT-4oはテキストでは92%の正解率に対し、音声では66%に低下しました。 しかし、既存の音声認識、テキストAI、音声合成を組み合わせたパイプライン方式では、テキスト処理と遜色ない結果が得られました。これは、高精度な推論が必要な場面では、現状ではパイプライン方式が有効であることを示唆しています。 このデータセットの公開により、音声AIの推論能力向上に貢献することが期待されます。今後の音声AIモデルの進化が楽しみです。 --- ## 記事2: タイトル: RAG普及で加速する製造業のナレッジ活用 技術継承への貢献にも期待:MONOist 2025年展望(1/3 ページ) 要約: 製造業で「RAG」という技術の導入が急速に進んでいます。RAGとは、社内に蓄積されたデータをAIが活用しやすくする技術のことです。まるで、会社の知恵袋をAIが使えるようにするイメージです。最近の調査では、RAGを業務で使う企業が短期間で大幅に増えており、特に製造業での活用が活発です。例えば、過去のプロジェクトの資料をAIがすぐに探し出せるようにしたり、技術の伝承をスムーズにしたりするのに役立っています。 RAGは、製造業の課題解決に役立つ一方で、データの整理や検索技術の向上が必要です。しかし、2025年には、RAGを活用する企業がさらに増えることが期待されています。AIが会社の知識を使いこなす未来が、すぐそこまで来ているかもしれません。 ## 記事3: ## タイトル: 低コスト&爆速でコード修正!AIエージェントを実務の開発でも試してみる 要約: AI開発エージェントの実用性が高まっています。この記事では、ローカル環境で動く「Cursor」と「Roo-Cline」という2つのツールを、実際の開発プロジェクトで試した結果を報告します。 両ツールとも、テストコードの追加や簡単な機能改修を、数十円から数百円程度の低コストで実現できました。特に「Roo-Cline」はAPI使用量に応じた課金で、コスト感が分かりやすい点が魅力です。 これらのAIエージェントは、プロンプトで指示を出し、不足があれば修正を繰り返すことで、開発を効率化できます。特に「Cursor」はエディタ機能と連携し、「Roo-Cline」はVSCode拡張機能として使いやすい点が特徴です。 ただし、大規模コードベースでは、AIがコンテキストを理解しにくい場合や、既存の重複コードに混乱することもあり、注意が必要です。 AIエージェントを使いこなすには、開発者自身がツールの特性を理解し、適切な指示を出す必要があります。しかし、この技術を使えば、開発効率が大幅に向上し、今後のエンジニアの働き方を大きく変える可能性があるでしょう。AIエージェントを「もう一人のペアプログラマー」として捉え、積極的に活用していくことが重要です。 ## 記事4: タイトル: 小規模データで高精度な予測を実現するテーブルデータ基盤モデル 要約: AIの歴史において、手作業で作成されたアルゴリズムは、より高性能なエンドツーエンド学習に置き換えられてきました。画像認識における手設計の特徴量や、自然言語処理における文法ベースのアプローチは、学習済みの畳み込みやトランスフォーマーに取って代わられました。この流れは、テーブルデータにも及び、新しい基盤モデル「TabPFN」が登場しました。 TabPFNは、テキストや画像とは異なり、多様で複雑なテーブルデータに対応します。従来の深層学習モデルが苦手としていた、データセット間のばらつきや、データ内の多様な特徴量(数値、カテゴリなど)を克服。独自のアーキテクチャと、合成データを用いた学習により、従来の機械学習モデルを凌駕する性能を発揮します。 特に注目すべきは、1万件以下のデータで、最先端の勾配ブースティング木を大幅に上回る予測精度と速度を実現。また、学習済みモデルを転用するファインチューニングや、データ生成能力も持ち合わせており、基盤モデルとしての潜在能力を示しています。 TabPFNは、インコンテキスト学習(ICL)という、大規模言語モデルで実証された手法を活用。これにより、データからアルゴリズムを自動的に学習し、従来のモデルよりも柔軟で強力な予測を可能にしました。データ分析における新しい可能性を切り開く、画期的な技術です。 ## 記事5: タイトル: GCPにおける第5世代Xeonでの言語モデル性能ベンチマーク 要約: AIエージェントの主要な要素であるテキスト埋め込みとテキスト生成の性能を、Google CloudのCPUインスタンスN2とC4で比較しました。C4は、テキスト埋め込みでN2の10倍から24倍、テキスト生成で2.3倍から3.6倍高い処理能力を示しました。C4の料金はN2の約1.3倍ですが、コスト効率を考慮すると、テキスト埋め込みで7倍から19倍、テキスト生成で1.7倍から2.9倍もC4が優位です。この結果から、軽量なAIエージェントソリューションをCPUのみで実現できる可能性が示唆されます。特に、最新の第5世代Xeonプロセッサ(C4に搭載)が持つAIアクセラレーション機能(AMX)が、性能向上に大きく貢献しています。今後のCPUの進化により、GPUなどのアクセラレータを使わず、CPUだけでAI処理を完結できる時代が来るかもしれません。 ## 記事6: ## タイトル: PyTorchのTorchtuneとHuawei Ascendバックエンドの連携 要約: このブログでは、PyTorchのライブラリであるTorchtuneと、HuaweiのAI計算プラットフォームであるAscendバックエンドの連携について解説します。Torchtuneは、大規模言語モデル(LLM)のファインチューニングを容易にするツールで、PyTorchの設計原則に沿って、柔軟で拡張性の高いモジュールを提供します。Ascendは、ハードウェアからソフトウェアまでを包括するAIインフラで、多様なAIワークロードに対応します。 Torchtuneは、PyTorchのデバイス抽象化レイヤーを活用し、Ascendをシームレスに統合します。これにより、ユーザーは設定ファイルでデバイスタイプを「npu」と指定するだけで、Ascend NPUでの学習が可能になります。設定ファイル(Config)で学習プロセスを調整し、レシピ(Recipe)で学習スクリプトを定義することで、柔軟なファインチューニングを実現します。 具体的には、設定ファイルで「device: npu」と指定し、`tune run` コマンドを実行するだけで、Ascend環境でのファインチューニングが開始されます。さらに、学習済みのモデルを使ったテキスト生成も、設定ファイルの修正とgenerate recipeの実行で簡単に行えます。例えば、「あなたは誰?」という質問に対して「私はTorchtune Helperです」と回答させることも可能です。 ## 記事7: タイトル: CO₂排出量とモデル性能:Open LLMリーダーボードからの洞察 要約: AIモデルの性能を評価するOpen LLMリーダーボードでは、3000以上のモデルを評価し、その推論時のCO₂排出量も分析しました。大規模言語モデル(LLM)の利用は環境負荷が課題となっており、推論時のエネルギー効率が注目されています。分析の結果、モデルサイズが大きいほどCO₂排出量が多い傾向にありますが、必ずしも性能向上に比例しないことが分かりました。興味深いことに、コミュニティが微調整したモデルは、公式モデルよりもCO₂排出量が少ない傾向が見られました。特に、Qwen2モデルでは、ベースモデルが冗長な出力を生成しやすく、エネルギー消費が多いことが判明。一方、微調整されたモデルは、より簡潔な応答をする傾向にありました。Llama3モデルでも同様の傾向が見られ、微調整がCO₂排出量削減に貢献する可能性が示唆されました。今後の課題として、微調整モデルの低排出量の要因解明、トークン解析や冗長性がエネルギー消費に与える影響の調査、MoEモデルの高排出量要因の分析などが挙げられます。 ## 記事8: はい、承知いたしました。以下に、アナウンサー向けに調整した要約を300文字程度でまとめました。 --- **タイトル:マイクロソフトが開発した高性能AIモデル「Phi-4」** マイクロソフトが開発した最新のAIモデル「Phi-4」が公開されました。このモデルは、高度な推論能力と安全性を重視して作られています。特徴は、厳選された高品質な学習データを使用している点です。具体的には、教科書のようなデータ、専門的な書籍、質疑応答データなどが活用されています。また、140億のパラメータを持つ大規模モデルでありながら、高速な処理が可能です。 主な用途としては、メモリや計算能力に制約がある環境や、応答速度が求められる場面での活用が想定されています。ただし、英語での利用が中心であり、他の言語では性能が劣る可能性がある点に注意が必要です。また、生成される情報が不正確だったり、偏見を含んだりする可能性も指摘されています。利用にあたっては、安全対策を講じ、責任あるAIの利用を心がけるよう、開発者には注意が促されています。 --- ## 記事9: はい、承知いたしました。以下に要約を作成しました。 --- タイトル: 思いつきで作ったAIツールが5000スターを獲得した話 要約: 開発者がAPI料金を節約するため、AIモデル「Claude」のWeb版にファイルを1つずつアップロードしていた作業を効率化しようと開発したのが「Repomix」です。リポジトリのコードを1つのファイルにまとめ、AIが理解しやすいXML形式で出力します。このファイルをClaudeに渡すことで、コードのリファクタリングや実装を依頼できます。 特にCLI版は、機密情報の漏洩を防ぐ機能や、設定の柔軟性、使いやすい出力が特徴です。ウェブサイト版もVitepressとHono.jsを使い、開発効率を重視して作られています。 当初、類似ツールが多い中で埋もれていましたが、開発者がRedditで直接ユーザーに紹介したところ、多くの支持を得てスター数が伸びました。商標問題で改名も経験しましたが、現在は個人開発や小規模プロジェクトで十分に使えるツールとして成長しています。今後は、中規模以上のプロジェクトにも対応できるよう開発を進める予定です。 --- ## 記事10: はい、承知いたしました。以下に要約を出力します。 タイトル:手のひらサイズのロボット犬「Bittle X」、ChatGPTと統合で自然な会話が可能に 要約: 技術系ニュースサイトfabcross for エンジニアの記事によると、手のひらサイズのロボット犬「Bittle X」が、AIのChatGPTと連携し、より自然な会話ができるようになりました。このロボット犬は、アメリカのPetoi社が開発したもので、STEM教育やプログラミング学習にも活用できます。音声コマンドで動いたり、腕立て伏せやバク転をしたりと多彩な動きが可能です。さらに、C++やPythonなど、様々なプログラミング言語に対応しているため、子供から大人まで幅広い層が楽しめます。ChatGPTとの連携で、より人間の指示を理解し、高度な会話も可能になりました。オプションでカメラやセンサーを追加すれば、障害物回避やジェスチャー認識もできるようになります。価格は279ドルで、関連情報はPetoi社の公式サイトで確認できます。 ## 記事11: ## タイトル: AIで進化するマルウェア分析:Deep InstinctとAmazon Bedrockの協業 | Amazon Web Services 要約: Deep Instinct社のデータセキュリティソリューション「DSX」は、深層学習と生成AIを組み合わせ、クラウドやエンドポイントを既知・未知のマルウェアからリアルタイムで保護します。特に注目すべきは、生成AIを活用したマルウェア分析ツール「DIANNA」です。Amazon Bedrockを基盤とし、脅威の迅速かつ詳細な分析を可能にしました。 DIANNAは、従来のセキュリティ対策の課題である、高度化するマルウェア、ゼロデイ攻撃、情報過多といった問題に対応します。高度な翻訳エンジンで複雑なコードを自然言語に変換し、マルウェアの意図や影響を分かりやすく説明します。さらに、脅威分析の自動化で、セキュリティ担当者の負担を軽減し、迅速な意思決定を支援します。 DIANNAは、Deep Instinctの深層学習技術とAmazon BedrockのAI能力を融合することで、精度の高い脅威分析と分かりやすい説明を実現しました。これにより、セキュリティチームは、未知の脅威に対する対応を迅速化し、組織全体のセキュリティを強化できます。 ## 記事12: はい、承知いたしました。以下に要約を作成します。 タイトル: ロボット関連のAIリリース年表 要約: ロボット分野におけるAIの進化をまとめた年表です。2024年は、Unitree社のロボットデータセットや強化学習環境の公開が目立ちました。特に、11月にはG1ロボットのデータセットがオープンソース化され、12月には強化学習ツール「RL GYM」が公開されました。さらに、同月にはGenesisというAIプラットフォームや、Unitree社の産業用ロボット「B2-W」も発表されました。 2025年に入ると、Unitree社は全身モーションデータセットを公開し、国産の汎用AIロボット「Mi-Mo」や、NVIDIAの「Cosmos」プラットフォーム、ロボット開発ツール「Isaac」のアップデートなど、多岐にわたる発表がありました。また、Hondaの「ASIMO OS」も登場しています。これらの進展は、ロボットとAIの融合が加速していることを示しています。 ## 記事13: はい、承知いたしました。以下に要約を記載します。 タイトル: Stability AI、画像を1秒で3Dモデル化する「Stable Point Aware 3D」を発表 要約: AI開発のStability AI社が、新技術「Stable Point Aware 3D」を発表しました。この技術は、なんと1枚の画像から、わずか1秒で3Dモデルを生成できる画期的なものです。従来の3Dモデル作成は複雑で時間もかかりましたが、この技術を使えば、誰でも手軽に3Dデータを作成、編集できます。 仕組みは、まず画像を点群という3Dの点の集まりに変換し、それを元に表面を作るメッシュを作成、最後に3Dモデルとして完成させるという流れです。この技術のすごいところは、オブジェクトの裏側など見えない部分も正確に予測し、360度あらゆる角度から見られる3Dモデルを作れる点です。 さらに、生成した3Dモデルはリアルタイムで編集可能。最新のGPUを搭載したパソコンを使えば、高速に作業できます。この技術は商用、非商用に関わらず無料で利用できるので、AI初心者の方でも気軽に試せるのが嬉しいですね。 --- いかがでしょうか? ## 記事14: はい、承知いたしました。以下に要約をまとめます。 --- **タイトル: Microsoft、小規模言語モデル「Phi-4」をMITライセンスで公開** **要約:** マイクロソフトが、AIの基礎となる小規模言語モデル「Phi-4」を公開しました。このモデルは、MITライセンスという特別な許可証付きで、誰でも自由に利用、改良、商用利用も可能です。 「Phi-4」は、140億個のパラメータを持つコンパクトなモデルですが、従来の言語処理だけでなく、数学のような複雑な問題を解く能力に優れています。なんと、GoogleやOpenAIといった大手のAIモデルよりも、数学の競技問題で良い成績を出しているとのことです。 このモデルの設計図も公開されており、AI開発者は中身を自由に調整できます。マイクロソフトの担当者は、公開を求める声が多かったこと、そして海賊版が出回るほど注目されていたと述べています。AI開発の世界で、より自由で活発なイノベーションが期待されます。 --- ## 記事15: タイトル:NVIDIAのLogitsProcessorZooで言語モデルのテキスト生成を制御する 要約: AIがテキストを生成する際、単に確率の高い単語を選ぶだけでは、平凡で繰り返しが多い文章になりがちです。そこで、より高度な「デコーディング戦略」が使われます。さらに、Hugging Faceの「LogitsProcessor API」を使うと、生成されるテキストの元となる確率分布を直接操作できます。NVIDIAの「LogitsProcessorZoo」は、この機能を拡張し、文章の長さを制御したり、特定のフレーズを強制したり、選択肢から答えを選ぶなど、様々なタスクに特化した部品を提供します。例えば、文章の長さを調整する「GenLengthLogitsProcessor」、プロンプトの内容を反映させる「CiteFromPromptLogitsProcessor」、特定のフレーズを最後に入れる「ForceLastPhraseLogitsProcessor」、選択肢から選ばせる「MultipleChoiceLogitsProcessor」などがあります。これらのツールを使うことで、AIのテキスト生成をより柔軟に、目的に合わせて制御できるようになります。 ## 記事16: はい、承知いたしました。以下に要約を作成しました。 ## タイトル: Introducing the Synthetic Data Generator - Build Datasets with Natural Language 要約: AI初心者でも安心!Hugging Faceが開発した「Synthetic Data Generator」は、まるで魔法のように、言葉だけでカスタムデータセットを作成できるツールです。難しいコードは一切不要、まるで会話するようにAIに指示を出すだけで、テキスト分類やチャットボット向けのデータが手に入ります。 使い方は簡単3ステップ。まず、作りたいデータセットの内容を説明し、次にAIが生成したサンプルを調整、最後にデータ数を指定して生成ボタンを押すだけ。あっという間に、データセットが完成! さらに、Argillaというツールと連携することで、生成されたデータセットを細かくチェックし、不要なデータを削除したり、修正したりすることが可能です。 そして、なんと!AutoTrainを使えば、生成したデータセットでAIモデルまで作れてしまいます。まるで、データセット作りからモデル育成までをワンストップで体験できる、夢のようなツールなんです。 さらに、技術に自信がある方は、ツールの設定をカスタマイズしたり、ローカル環境で利用したりも可能。より高速に、より正確にデータを生成できます。 今後は、RAG(検索拡張生成)や、AIによる評価機能なども追加予定。ますます便利になる「Synthetic Data Generator」を、ぜひ試してみてください。 ## 記事17: ## タイトル: NVIDIAから個人向け小型AIスパコン 1台3000ドル 最大2000億パラメータのLLMを実行可 **要約:** 皆様、NVIDIAから個人向けのAIスパコン「Project DIGITS」が発表されました。これは、AIの研究者や学生、データ分析をする人たちに向けたもので、なんと3000ドル、日本円で約47万円で購入できるんです。 この小さなスパコンは、手のひらに乗るほどのサイズなのに、非常に高い計算能力を持っています。なんと、最大2000億パラメータという大規模なAIモデルを動かすことができるんです。これは、非常に高度なAIの研究や開発ができることを意味します。さらに、2台使えば、さらに大きな4050億パラメータのAIモデルも動かせます。 このスパコンは、Wi-FiやBluetoothにも対応していて、USB端子もついています。NVIDIAのCEOも実際に手に持って発表会で紹介しました。AI技術がどんどん身近になる、そんな未来を感じさせるニュースですね。 ## 記事18: ## タイトル: How to become a Data Scientist? | MLJAR 要約: データサイエンティストは高収入なイメージがありますが、重要なのは好奇心と探求心です。この記事では、データサイエンティストになるための道のり、必要なスキル、そしてキャリアを始める方法について解説します。著者は電気エンジニアからプログラマー、そしてデータサイエンティストへと転身しました。 データサイエンスに必要なスキルは大きく分けて2つ。まず、プログラミング(Python,R,SQL)や数学、機械学習の知識などのハードスキル。しかし、これらはあくまでツールであり、業務知識が重要です。次に、コミュニケーションや好奇心、変化への適応力などのソフトスキル。特に、ビジネスの成果に繋がる説明能力は不可欠です。 データサイエンスの学習を始めるには、まず機械学習の基礎を学びましょう。分類、回帰、クラスタリングなど、様々な手法の概要を把握します。プログラミングに加えて、ノーコードツールやAIアシスタントも活用しましょう。学習は実践が一番です。Kaggleのようなプラットフォームでコンペに参加し、実力を磨きましょう。 そして、コミュニケーション能力も磨きましょう。ブログを書いたり、家族に説明したり、人に話しかけたりすることで、説明力が向上します。データサイエンスは、数字やアルゴリズムだけでなく、好奇心と発見の喜びでもあります。楽しみながら、データから意味を見出す旅を始めましょう。 ## 記事19: はい、承知いたしました。以下に、アナウンサー向けに調整した要約を300文字程度で出力します。 --- ## タイトル: PyTorchでのGPUメモリの可視化と理解 **要約:** AIモデルの学習時、「CUDA out of memory」エラーに遭遇したことはありませんか?このエラーの原因を理解し、対処するためのステップを解説します。 PyTorchには、GPUメモリの使用状況を可視化する便利なツールがあります。`torch.cuda.memory`を使ってメモリのスナップショットを取得し、専用のWebサイトでグラフ化することで、どこでどれだけのメモリが使われているかを把握できます。 メモリ使用量は、モデルの初期化、順伝播、逆伝播、そして最適化ステップで変動します。特に、順伝播時には中間層の出力であるアクティベーションが、また、最適化ステップでは勾配や中間値がメモリを消費します。 メモリ使用量の見積もりは、モデルのパラメータ数、オプティマイザの状態、アクティベーションのサイズ、勾配のサイズなどを考慮する必要があります。アクティベーションのサイズは、モデルのパラメータ数からある程度推定できます。 これらの要素を理解することで、メモリ不足を解消し、より効率的な学習を行うためのヒントが得られるでしょう。具体的なメモリ最適化のテクニックについては、ドキュメントの関連セクションを参照してください。 --- ## 記事20: タイトル: すがやみつるが推す「AI駆動プログラミング」に挑戦した爽快な一冊 要約: 今日のニュースは、マンガ家のすがやみつるさんが、AIを使ったプログラミングに挑戦した女子大生の本を絶賛している話題です。 この本は、大塚あみさんという女子大生が、AIの力を借りて100日間毎日アプリを作り続けた記録です。すがやさん自身もAIプログラミングに挑戦しており、この本のチャレンジ精神に共感したそうです。 AIはプログラムを短時間で作れますが、バグも起こります。大切なのは、使う側の知識と修正する力。 この本は、AI初心者の方でも、AIを使って何かを創り出す面白さを体験できる、まさに「爽快な一冊」だと、すがやさんは語っています。 AIに興味がある方は、ぜひ手に取ってみてください。 ## 記事21: はい、承知いたしました。以下に要約を作成します。 --- **タイトル:** AWSでのAmazon Bedrockを活用したデジタル融資ソリューション構築 **要約:** この記事では、AWSのAIサービス「Amazon Bedrock」と「Amazon Bedrock Agents」を活用した、デジタル融資ソリューションの構築方法を解説します。このソリューションは、顧客の本人確認(KYC)、信用・リスク評価、通知といった融資プロセスを自動化し、業務効率化と顧客体験の向上を目指します。 従来のAIアシスタントでは難しかった、複雑な顧客との対話や、曖昧な情報、多様な表現を、生成AIベースのアシスタントが自然な会話で対応。Amazon TextractとComprehendでKYC書類を解析し、Bedrock Agentsで融資プロセスを自動制御します。 このソリューションは、既存顧客のリスク評価や新規顧客の信用スコアチェックに基づき、融資判断を自動化し、メールで結果を通知。デジタル融資の複雑なビジネスプロセスを自動化し、競争優位性を確立します。AI初心者の方でも、AWSのサービスを組み合わせることで、高度な業務自動化が実現できることをご理解いただけるでしょう。 ## 記事22: ## タイトル: 「Don’t Do RAG」巨大コンテキストを活かした超高速なCAGという新手法【論文解説】 要約: 皆さん、こんにちは。今回はAIの最新論文から、RAGに代わるかもしれない新しい手法「CAG」について解説します。RAGは質問に応じて必要な情報を検索し、AIが答える仕組みですが、CAGは事前に全ての情報をAIに読み込ませ、検索をなくすことで、最大40倍も高速化できるというものです。まるで、図書館全体を頭に入れてから質問に答えるようなイメージですね。 このCAG、検索がないため、情報の取り違えや遅延がなく、精度もRAGと同等以上という実験結果が出ています。特に、医療情報や社内FAQなど、情報が頻繁に変わらない場面で効果を発揮します。 ただし、情報が膨大すぎたり、頻繁に更新される場合はRAGも必要になります。そこで、CAGとRAGを組み合わせたハイブリッドな使い方も考えられます。 この研究は、AIのコンテキスト理解能力が向上している今、情報を事前に読み込むことで、よりシンプルで高速なAIシステムが構築できる可能性を示唆しています。まるで、検索というステップをスキップできる裏技を発見したかのようです。AIの可能性を広げる新しい視点として、ぜひ注目してみてください。 ## 記事23: はい、承知いたしました。アナウンサー向けに、AI初心者でも理解しやすいように要約を作成します。 ## タイトル: 【AI開発】VSCode拡張機能「Cline」とは?使い方やCusorとの違いを徹底解説 | AI総合研究所 要約: 皆様、こんにちは。本日は、開発者の強い味方となるAI拡張機能「Cline」について解説します。Clineは、オープンソースで提供され、Visual Studio Codeなどの開発環境で動作するAIエージェントです。 このCline、一体何ができるのでしょうか?主な機能は、コードの自動生成や修正、エラーの検出、そしてタスクの自動化です。まるで優秀なアシスタントのように、開発者の作業をサポートしてくれるのです。 使い方も簡単です。拡張機能をインストールし、APIキーを設定すれば、すぐに利用を開始できます。指示を出すと、Clineがコードの提案やターミナルコマンドの実行、ブラウザ操作などを自動で行ってくれます。 気になる料金体系ですが、Cline自体の利用は無料です。ただし、APIを利用するため、AIプロバイダーの利用料が発生します。 また、Clineは拡張性も高く、ユーザーがカスタムツールを作成することも可能です。例えば、Jiraとの連携ツールや、AWSのサーバー管理ツールなどを開発できます。 ここで気になるのが、同じくAIを活用した開発ツール「Cursor」との違いです。Clineは拡張機能として既存の開発環境に統合できる一方、Cursorは専用のエディタを使用します。どちらを選ぶかは、プロジェクトの規模や予算、開発環境によって変わってきます。 Clineは、安全性にも配慮しており、コードの変更やターミナルコマンドの実行には、必ずユーザーの承認が必要です。これにより、予期せぬトラブルを防ぎ、安心して利用することができます。 AIの力を借りて開発を効率化したい方にとって、Clineは非常に魅力的なツールです。ぜひ一度、試してみてはいかがでしょうか。AI総合研究所では、ClineをはじめとするAI開発の導入支援を行っています。ご興味のある方は、お気軽にご相談ください。 ## 記事24: タイトル: 「GitHub Copilot」無償プランがJetBrains社製IDEに対応、「Android Studio」でも利用可 要約: プログラマーの皆さん、朗報です!AIがコード作成を助けてくれる「GitHub Copilot」の無料プランが、ついにJetBrains社の開発ツールでも使えるようになりました。これは、Androidアプリ開発でおなじみの「Android Studio」を含む、多くの開発環境で利用可能になるということです。無料プランでは、毎月2000件のコード補完と50件のチャット機能が利用できます。必要なのはGitHubアカウントだけ、クレジットカードの登録は不要です。AIの力を借りて、もっと効率的に開発を進めてみませんか? ## 記事25: タイトル: Kaggleで高額賞金のChess AIのコンペが始まる | やねうら王 公式サイト 要約: AI技術者の皆さん、注目です!Kaggleで、賞金総額1万5千ドルという高額なチェスAIコンペが始まりました。このコンペのユニークな点は、AIの実行環境に厳しい制限があること。使用できるメモリはわずか5MB、プログラムのファイルサイズも64KBまでという制約の中で、いかに効率的なAIを開発するかが鍵となります。 この難関に、将棋AI開発者のドリームチームも参戦!「やねうら王」開発者のやねうらおさん、WCSC34優勝のnodchipさん、Kaggle Masterのqhapaq49さんがタッグを組み、優勝を目指しています。 コンペは来年2月11日に最終提出、25日に結果発表の予定です。腕に自信のある方は、ぜひチャレンジしてみてはいかがでしょうか?AI技術の最前線を体験できる、絶好の機会です! ## 記事26: タイトル: 動画生成AIでスケッチを描くように妄想を生成する/スケッチブックを開いて「ラフな絵を描く」ようなカジュアルな映像制作が良い/ Blog - 2025/01/07|CreativeEdge Vlog 要約: クリエイターの皆さん、仕事始めから新しい試みです!動画生成AIを活用し、頭の中のイメージをラフスケッチのように映像化する取り組みを始めました。これは、5月から始まる高校講座「デザインフィクション」に向けた準備の一環で、未来を実写映像で見せるプロジェクト学習にAIを活用します。現在、教育現場で安全に使える動画生成AIは限られており、試行錯誤しながら進めています。 動画生成AIは、まるでスケッチブックに絵を描くように、気軽に映像制作ができる点が魅力です。生成された映像は、2025年1月1日から7日にかけて、楽曲生成AIと組み合わせ様々なパターンが試されました。中でも音楽生成AI「Suno AI」のクオリティが特に優れていました。 この技術は、子供の頃に誰もが持っていた「こんな物語が見たい」という空想を、形にする可能性を秘めています。しかし、安易な価格競争に陥らないためにも、作品だけでなく、体験やコミュニティを含めた独自の「作家性」を確立することが重要です。まずは徹底的に遊び、メリットとデメリットを理解し、AIを創造的な道具として使いこなしていくことが、これからの時代に求められます。 ## 記事27: タイトル: LLMの脆弱性を無料で診断できるツールGarakが登場 多岐にわたる機能を提供:セキュリティソリューション 要約: 皆様、AIの安全性に関する最新情報です。AI、特に大規模言語モデル(LLM)のセキュリティは重要な課題ですが、その脆弱性を無料で診断できるツール「Garak」が登場しました。Garakは、プロンプトインジェクションや誤情報生成など、LLM特有の様々なリスクをチェックできます。Hugging FaceやOpenAIといった主要なプラットフォームに対応しており、AI開発者や研究者にとって大変役立つでしょう。また、APIベースのモデルだけでなく、ローカル環境のモデルも診断可能です。さらに、独自のニーズに合わせてカスタマイズもできます。AIの安全性を高める上で、Garakは非常に重要なツールとなると期待されています。AI初心者の方も、まずはGarakのようなツールからAIセキュリティについて学んでみてはいかがでしょうか。 ## 記事28: はい、承知いたしました。以下に要約を作成します。 タイトル: NVIDIA、ローカルで動く基盤モデルでPCデスクトップ上に表情のあるキャラクターを表示。「Project R2X」発表 要約: NVIDIAが、AIキャラクター「Project R2X」を発表しました。これは、あなたのパソコン上で動くAIで、まるで人がいるかのように、表情豊かに会話できるのが特徴です。例えば、アプリの使い方を教えてくれたり、長い文章を要約してくれたりします。さらに、カメラで映したものを認識したり、オンライン会議に参加して質問に答えたりもできます。このAIは、NVIDIAの高性能なパソコンで動くため、インターネットがなくても使えるのがポイントです。まるで、頼りになるアシスタントがパソコンの中に住んでいるような、そんな未来が近づいてきました。AI初心者の方でも、きっと身近に感じられるようになるでしょう。 ## 記事29: ## タイトル: AIインフラ革命 ─ 米国データセンターとGPUを支える技術基盤(Rethinking AI Infrastructure Part 1) 要約: Actapio社がAIプラットフォーム強化のため、アメリカにデータセンターを設立。その技術基盤を解説します。電気代の安い地域を選び、直接蒸発式外気冷却でPUE1.2以下を実現。GPUサーバーを効率的に運用するため、OCPサーバーを採用し、工場でラックに搭載した状態で納品。これにより、少人数での運用を可能にしました。また、データ解析基盤を集中配置し、日米間の通信遅延を考慮した設計に。ネットワークは100Gbpsと400Gbpsを使い分け、GPUサーバー間はRoCEv2で高速通信。ラックはGPUサーバーを対向配置し、排熱効率を向上。ケーブリングツールで作業を効率化しました。課題として、ケーブルの太さ、GPUサーバーの騒音、SFPの相互運用性などを挙げ、今後の改善点を提示。これらの取り組みを通じ、コスト効率と高度なAIインフラの両立を目指しています。 ## 記事30: はい、承知いたしました。以下に、アナウンサー向けに、AI初心者にも分かりやすい言葉でFalcon3に関する要約を作成しました。 タイトル: Falcon3、オープンなAIモデルファミリーが登場! 要約: アラブ首長国連邦の技術革新研究所が、高性能ながらも手軽に使えるAIモデル「Falcon3」を発表しました。このモデルは、AIの専門家だけでなく、AIに触れ始めたばかりの方にも扱いやすいように設計されています。 Falcon3は、科学、数学、プログラミングといった分野で特に高い能力を発揮します。モデルの規模に応じて、10億から100億のパラメータを持つ5つのモデルがあり、用途に応じて選べます。 注目すべきは、少ない学習データでも高性能を実現する技術です。これにより、AI開発のコストを抑えつつ、優れたAIモデルを誰でも利用できるようになりました。 さらに、Falcon3は、複雑な計算や推論、プログラミングといった分野で、高い性能を示しています。また、文章を理解する能力も高く、自然な会話も可能です。 Falcon3はオープンソースで提供されており、研究や開発に自由に利用できます。2025年1月には、画像、動画、音声に対応した、さらに進化したモデルも登場予定です。 Falcon3は、AIの世界を広げ、より多くの人がAIの恩恵を受けられるようにする、革新的なモデルと言えるでしょう。 ## 記事31: はい、承知いたしました。以下に要約を記載します。 --- **タイトル:Bamba:推論効率に優れたハイブリッドMamba2モデル** **要約:** IBM、プリンストン大学、カーネギーメロン大学、UIUCが共同開発した「Bamba-9B」は、完全オープンなデータで学習された、推論効率の高いハイブリッドMamba2モデルです。 従来のTransformerモデルと比較して、vLLM環境下での推論速度が2.5倍高速化し、レイテンシは2倍短縮されています。このモデルは、`transformers`、`vLLM`、`TRL`、`llama.cpp`で利用可能です。また、学習レシピやデータローダーも公開されており、コミュニティによる更なる改善が期待されています。 Transformerモデルは、長い文章を処理する際にKV-cacheのメモリ使用量が増大するという課題がありました。Mambaアーキテクチャは、このボトルネックを解消します。Bamba-9Bは、Transformer層とMamba層を組み合わせたハイブリッドモデルで、同じトークン数で学習したTransformerモデルと比較して遜色ない性能を発揮します。特に、推論時の効率が大幅に向上することが確認されました。 Bamba-9Bは、数学やMMLUのベンチマークではTransformerモデルに若干劣るものの、それ以外のタスクでは同等以上の性能を示しています。この差は、学習データ量の増加や、数学データセットの追加によって改善できると見込まれています。 このモデルは、オープンソースのデータローダーや量子化技術も活用しており、研究開発の促進にも貢献します。 --- ## 記事32: はい、承知いたしました。以下に要約を作成しました。 タイトル:世界企業の4割がAIで人員削減へ?2030年までに 要約: 世界経済フォーラムの報告によると、世界の大手企業の41%が、AIによる業務自動化で2030年までに人員削減を考えているそうです。特に事務職や秘書などの職種で減少が見込まれています。一方で、AI技術者の需要は高まっており、企業はAI関連のスキルを持つ人材を積極的に採用する意向です。 企業は従業員の再教育やスキルアップも計画していますが、AIが雇用に「正味プラス」になるとは言えない状況です。AIは人間の仕事を奪うだけでなく、人間とAIが協力することでより良い結果を生み出す可能性も指摘されています。 今後、AI技術が私たちの働き方を大きく変えることになりそうです。 ## 記事33: ## タイトル: Kaggleコンペ「Eedi」から学ぶ、AIで算数ミスを分析 ## 要約: 皆さん、こんにちは。今日は、KaggleというAIコンペで「Eedi」という算数の問題のミスを分析するコンペティションに参加した結果についてお話します。 このコンペでは、算数の4択問題と、間違えた理由となる「ミスコンセプション」、つまり誤解のパターンをAIで予測します。例えば、「12+3×2」を「30」と答えた場合、「計算順序を間違えた」というミスコンセプションが紐づきます。 この予測には、RetrieverとRerankerという二つのAIモデルを使いました。Retrieverは、問題と関連性の高いミスコンセプションの候補を絞り込み、Rerankerがさらに詳しく分析します。 特に、SimCSEという技術を使い、問題文とミスコンセプションをベクトルという数値データに変換し、関連性の高いペアを近づけるように学習させました。この技術は、文章の意味をAIに理解させるために使われています。 しかし、大規模なAIモデルを動かすには高性能なコンピューターが必要で、個人での学習は難しいことが分かりました。 今では、Googleなどが便利なAIサービスを提供していますが、内部の仕組みを理解しておくことは、サービスを選ぶ際や、データ設計で大きなアドバンテージになります。 今回の経験を通して、AIの内部構造を学ぶ大切さを改めて認識しました。 ## 記事34: タイトル: NVIDIAから「超ハイスペックなMac mini」みたいな最強ミニAIスパコン登場 要約: NVIDIAが、AI研究者や学生向けの個人用AIスパコン「Project DIGITS」を発表しました。これは、Mac miniのような小型ながら、スパコン並みの計算能力を持つ驚異的なマシンです。搭載されたNVIDIA GB10 Grace Blackwell Superchipは、1秒間に1000兆回の計算が可能な1ペタフロップスの性能を発揮します。これは、かつてのスーパーコンピューター「京」に迫る性能です。さらに、128GBのメモリと4TBのSSDを搭載し、大規模言語モデルも実行可能。価格は3000ドル(約47万円)からと、この性能を考えると非常にお得感があります。AI開発に興味のある方にとって、注目のマシンとなるでしょう。 ## 記事35: タイトル: TypeScriptで作る自動運転UI 要約: チューリングの太田です。自動運転開発では、Web技術も活用されています。特にUI開発では、Webブラウザが使われることが増えています。チューリングでは、E2Eモデルという、カメラ画像から走行経路を直接出力するモデルを開発。このモデルは、経路だけでなく、物体認識や車線認識も行い、その結果をUIに表示します。これは、モデルの判断根拠を理解しやすくするためです。 UIは、Python製のサーバーから、カメラ画像、モデルの推論結果、車の状態を受け取ります。フロントエンドはReactで構築され、受け取ったデータを基に、カメラ画像、3Dモデル、地図を表示。リアルタイム通信にはSocket.IO、状態管理にはJotaiが使われています。3D描画にはThree.js、地図表示にはMapLibreを使用。 自動運転開発は、未開拓な領域が多く、Web技術の知見を活かしつつ、新たな課題に挑戦できるのが魅力です。チューリングでは、共に挑戦する仲間を募集中です。 ## 記事36: ## 出力フォーマット タイトル: ドット絵を作るGPTsを作ったら反応が良かった件(GPTs配布あり)|けいすけ / AIマンガ家 要約: AIでドット絵を作るのは意外と難しく、画像生成AIではピクセルの端がぼやけるなどの問題がありました。そこで、筆者はまずDALL-E3でドット絵っぽい画像を作成し、それをPythonで加工することで、きれいなドット絵に変換するGPTsを開発しました。具体的には、画像を64×64ピクセルに縮小する際にニアレストネイバー法という手法を用いています。このGPTsでは、最初にDALL-E3で生成した画像をPythonで加工し、ダウンロードリンクからドット絵をダウンロードできます。プロンプトを知りたい場合は、GPTsに質問することで確認可能です。このGPTs「ピクセルアートつくるちゃん」は、メルマガ登録で配布中です。 ## 記事37: はい、承知いたしました。以下に要約を作成します。 タイトル: XのAI「Grok」に不快で不適切で攻撃的な「Unhinged(たがが外れた)モード」が追加される可能性 要約: X(旧Twitter)のAI「Grok」に、新モード「Unhinged(たがが外れた)モード」が追加される可能性が出てきました。これは、Grokが不快、不適切、攻撃的な発言をするようになるモードとのことです。GrokはもともとユーモアのあるAIとして登場しましたが、このモードではさらに過激になる可能性があります。このモードはまだ試験段階で、実際に使えるかどうかは未定です。Grokは現在、Xの無料ユーザーも利用でき、テキストや画像の生成を楽しめますが、この「Unhingedモード」の追加によって、AIとのやり取りがさらに予測不能になるかもしれません。 ## 記事38: ## タイトル: Introducing smolagents: simple agents that write actions in code. 要約: AIエージェントとは、LLMの出力をプログラムのワークフロー制御に使うシステムのことです。この度、Hugging Faceから、AIエージェントを簡単に構築できるライブラリ「smolagents」が発表されました。smolagentsは、LLMが外部ツールを呼び出すなど、より複雑なタスクを実行できるよう、エージェントに「主体性」を与えることを目指しています。特徴は、コードでアクションを記述する「コードエージェント」をサポートすること。JSON形式よりもコードの方が、機能の組み合わせやオブジェクト管理、汎用性で優れているためです。smolagentsでは、必要なツールとLLMを指定するだけでエージェントを作成可能。作成したツールは簡単に共有もできます。ベンチマークでは、オープンソースモデルが優れたパフォーマンスを示しており、AIエージェント開発の可能性を広げています。 ## 本文 みなさん、こんにちは!まるごとAIニュースBIZパーソナリティのれいです。01月10日のAI関連のニュースをお届けします。今日は38本の記事を紹介します。 音声AIの推論能力を測る「Big Bench Audio」データセットについてです。AIの音声処理能力が進化する中、その推論能力を評価する新しいデータセット「Big Bench Audio」が公開されました。このデータセットは、高度な推論力を試す「Big Bench Hard」の質問を音声化し、1000個の質問で構成されています。実験では、GPT-4oなどのモデルを使い、音声入力から音声出力、音声からテキスト、テキストから音声、テキストからテキストの4つの形式でテストしました。その結果、テキストでの推論に比べ、音声での推論では大きな性能低下が見られました。例えば、GPT-4oはテキストでは92%の正解率に対し、音声では66%に低下しました。しかし、既存の音声認識、テキストAI、音声合成を組み合わせたパイプライン方式では、テキスト処理と遜色ない結果が得られました。これは、高精度な推論が必要な場面では、現状ではパイプライン方式が有効であることを示唆しています。このデータセットの公開により、音声AIの推論能力向上に貢献することが期待されます。今後の音声AIモデルの進化が楽しみです。 .... RAG普及で加速する製造業のナレッジ活用についてです。製造業で「RAG」という技術の導入が急速に進んでいます。RAGとは、社内に蓄積されたデータをAIが活用しやすくする技術のことです。まるで、会社の知恵袋をAIが使えるようにするイメージです。最近の調査では、RAGを業務で使う企業が短期間で大幅に増えており、特に製造業での活用が活発です。例えば、過去のプロジェクトの資料をAIがすぐに探し出せるようにしたり、技術の伝承をスムーズにしたりするのに役立っています。RAGは、製造業の課題解決に役立つ一方で、データの整理や検索技術の向上が必要です。しかし、2025年には、RAGを活用する企業がさらに増えることが期待されています。AIが会社の知識を使いこなす未来が、すぐそこまで来ているかもしれません。 .... 低コスト&爆速でコード修正!AIエージェントを実務の開発でも試してみる、という記事です。AI開発エージェントの実用性が高まっています。この記事では、ローカル環境で動く「Cursor」と「Roo-Cline」という2つのツールを、実際の開発プロジェクトで試した結果を報告します。両ツールとも、テストコードの追加や簡単な機能改修を、数十円から数百円程度の低コストで実現できました。特に「Roo-Cline」はAPI使用量に応じた課金で、コスト感が分かりやすい点が魅力です。これらのAIエージェントは、プロンプトで指示を出し、不足があれば修正を繰り返すことで、開発を効率化できます。特に「Cursor」はエディタ機能と連携し、「Roo-Cline」はVSCode拡張機能として使いやすい点が特徴です。ただし、大規模コードベースでは、AIがコンテキストを理解しにくい場合や、既存の重複コードに混乱することもあり、注意が必要です。AIエージェントを使いこなすには、開発者自身がツールの特性を理解し、適切な指示を出す必要があります。しかし、この技術を使えば、開発効率が大幅に向上し、今後のエンジニアの働き方を大きく変える可能性があるでしょう。AIエージェントを「もう一人のペアプログラマー」として捉え、積極的に活用していくことが重要です。 .... 小規模データで高精度な予測を実現するテーブルデータ基盤モデルについてです。AIの歴史において、手作業で作成されたアルゴリズムは、より高性能なエンドツーエンド学習に置き換えられてきました。画像認識における手設計の特徴量や、自然言語処理における文法ベースのアプローチは、学習済みの畳み込みやトランスフォーマーに取って代わられました。この流れは、テーブルデータにも及び、新しい基盤モデル「TabPFN」が登場しました。TabPFNは、テキストや画像とは異なり、多様で複雑なテーブルデータに対応します。従来の深層学習モデルが苦手としていた、データセット間のばらつきや、データ内の多様な特徴量(数値、カテゴリなど)を克服。独自のアーキテクチャと、合成データを用いた学習により、従来の機械学習モデルを凌駕する性能を発揮します。特に注目すべきは、1万件以下のデータで、最先端の勾配ブースティング木を大幅に上回る予測精度と速度を実現。また、学習済みモデルを転用するファインチューニングや、データ生成能力も持ち合わせており、基盤モデルとしての潜在能力を示しています。TabPFNは、インコンテキスト学習(ICL)という、大規模言語モデルで実証された手法を活用。これにより、データからアルゴリズムを自動的に学習し、従来のモデルよりも柔軟で強力な予測を可能にしました。データ分析における新しい可能性を切り開く、画期的な技術です。 .... GCPにおける第5世代Xeonでの言語モデル性能ベンチマークについてです。AIエージェントの主要な要素であるテキスト埋め込みとテキスト生成の性能を、Google CloudのCPUインスタンスN2とC4で比較しました。C4は、テキスト埋め込みでN2の10倍から24倍、テキスト生成で2.3倍から3.6倍高い処理能力を示しました。C4の料金はN2の約1.3倍ですが、コスト効率を考慮すると、テキスト埋め込みで7倍から19倍、テキスト生成で1.7倍から2.9倍もC4が優位です。この結果から、軽量なAIエージェントソリューションをCPUのみで実現できる可能性が示唆されます。特に、最新の第5世代Xeonプロセッサ(C4に搭載)が持つAIアクセラレーション機能(AMX)が、性能向上に大きく貢献しています。今後のCPUの進化により、GPUなどのアクセラレータを使わず、CPUだけでAI処理を完結できる時代が来るかもしれません。 .... PyTorchのTorchtuneとHuawei Ascendバックエンドの連携についてです。このブログでは、PyTorchのライブラリであるTorchtuneと、HuaweiのAI計算プラットフォームであるAscendバックエンドの連携について解説します。Torchtuneは、大規模言語モデル(LLM)のファインチューニングを容易にするツールで、PyTorchの設計原則に沿って、柔軟で拡張性の高いモジュールを提供します。Ascendは、ハードウェアからソフトウェアまでを包括するAIインフラで、多様なAIワークロードに対応します。Torchtuneは、PyTorchのデバイス抽象化レイヤーを活用し、Ascendをシームレスに統合します。これにより、ユーザーは設定ファイルでデバイスタイプを「npu」と指定するだけで、Ascend NPUでの学習が可能になります。設定ファイル(Config)で学習プロセスを調整し、レシピ(Recipe)で学習スクリプトを定義することで、柔軟なファインチューニングを実現します。具体的には、設定ファイルで「device: npu」と指定し、`tune run` コマンドを実行するだけで、Ascend環境でのファインチューニングが開始されます。さらに、学習済みのモデルを使ったテキスト生成も、設定ファイルの修正とgenerate recipeの実行で簡単に行えます。例えば、「あなたは誰?」という質問に対して「私はTorchtune Helperです」と回答させることも可能です。 .... CO₂排出量とモデル性能:Open LLMリーダーボードからの洞察についてです。AIモデルの性能を評価するOpen LLMリーダーボードでは、3000以上のモデルを評価し、その推論時のCO₂排出量も分析しました。大規模言語モデル(LLM)の利用は環境負荷が課題となっており、

LISTEN NEWS

LISTEN NEWS

LISTENからの最新情報をお届けする公式ポッドキャストです。

楽しいラジオ「ドングリFM」

楽しいラジオ「ドングリFM」

ブロガーとして人気の2人が話すポッドキャスト番組です。最近話題のニュース、日常に役立つ面白ネタなどを話します。国内・海外のIT事情に興味ある人にオススメの内容になっています。 ・お便りは https://goo.gl/p38JVb まで ・詳しいリンクはこちら https://linktr.ee/dongurifm ・リスナーコミュニティ「裏ドングリ」は以下からどうぞ  https://community.camp-fire.jp/projects/view/206637  https://donguri.fm/membership/join BGMと最後の締めの曲はフリーBGM・音楽素材「 http://musmus.main.jp 」より。

ミシマ社ラジオ

ミシマ社ラジオ

本をあまり読まない人も、本好きな人も、思わず本を読みたくなる、そんな時間をお送りします。出版社ミシマ社が運営する、本との出会いがちょっとだけ広がるラジオ

@narumi のつぶやき

@narumi のつぶやき

声低おじさんの独り言 お便り募集中 https://forms.gle/mFNwFusdE6eszbMU6

オカンの話なんて誰が聞くん?

オカンの話なんて誰が聞くん?

運転しながら頭の中を垂れ流し ※音質わるいです🙇🏼‍♀️

近藤淳也のアンノウンラジオ

近藤淳也のアンノウンラジオ

株式会社はてな創業者であり現在もITの第一線で働く近藤淳也が、京都の宿UNKNOWN KYOTOにやって来る「好きなことを仕事にしている人」を深堀りすることで、世の中の多様な仕事やキャリア、生き方・働き方を「リアルな実例」として紐解いていきます。 . 【ホスト:近藤淳也】 株式会社OND代表取締役社長、株式会社はてな取締役、UNKNOWN KYOTO支配人、NPO法人滋賀一周トレイル代表理事、トレイルランナー。 2001年に「はてなブログ」「はてなブックマーク」などを運営する株式会社はてなを創業、2011年にマザーズにて上場。その後2017年に株式会社ONDを設立し、現在もITの第一線で働く。 株式会社OND: https://ond-inc.com/ . 【UNKNOWN KYOTO】 築100年を超える元遊郭建築を改装し、仕事もできて暮らせる宿に。コワーキングやオフィスを併設することで、宿泊として来られる方と京都を拠点に働く方が交わる場所になっています。 1泊の観光目的の利用だけではなく、中長期滞在される方にも好評いただいています。 web: https://unknown.kyoto/ . こちらから本文を読んだりコメントが書けます! https://listen.style/p/unknownradio