1. 岡大徳のポッドキャスト
  2. さくらの生成AIプラットフォー..
2025-07-22 06:51

さくらの生成AIプラットフォーム×miibo×cotomi|日本語特化型LLMで実現する高精度RAG構築の実践ガイド

spotify apple_podcasts youtube

亀田治伸氏が、日本語特化型LLMであるNEC製cotomiとノーコード会話型AI構築プラットフォームmiiboを組み合わせた実践的なRAG構築方法を「さくらのナレッジ」で公開しました。この技術記事では、さくらの生成AIプラットフォームを活用して、さくらのクラウドマニュアルを対話的に検索できるシステムの構築プロセスが詳細に解説されています。

本記事の最大の特徴は、プログラミング知識なしで高度な対話システムを構築できる点にあります。cotomiの日本語処理能力の高さと、miiboの直感的な操作性を組み合わせることで、企業の技術文書やマニュアルを効率的に検索・活用できる仕組みを実現しています。さらに、完全閉域網での運用が可能なため、機密性の高い情報を扱う企業にとって理想的なソリューションとなっています。

さくらの生成AIプラットフォームがもたらす革新

さくらの生成AIプラットフォームは、アプリケーション開発からホスティング、モデル学習まで、生成AI活用に必要な機能を包括的に提供するサービスです。従量課金モデルによる初期投資の削減と、通信料金の無償化により、トークン消費の予測に集中できる環境を実現しています。

この環境において、NECが開発したcotomiは日本語に特化した大規模言語モデル(LLM)として機能します。日本語の文脈理解や専門用語処理において高い正確性を誇り、完全閉域網での独立運用が可能な点が大きな特徴です。企業の業務効率化や自動化を支援する上で、情報の独立性が求められる領域での活用が期待されています。

miiboとcotomiの連携による実装プロセス

記事では、実際の構築手順が詳細に解説されています。まず、miiboのアカウント開設から始まり、cotomiをLLMモデルとして選択する手順が示されています。現時点では、cotomiの利用にはさくらインターネットへの連絡が必要ですが、有効化後はmiiboの管理画面から簡単に選択できるようになります。

エージェント作成においては、システムプロンプトの設定が重要なポイントとなります。miiboでは専門知識なしでも直感的に設定できるインターフェースが用意されており、対話システムの人格や挙動を容易にカスタマイズできます。作成後はすぐにテストが可能で、実際の動作を確認しながら調整を進められます。

RAG構築の核心:ナレッジデータストアの活用

RAG(Retrieval-Augmented Generation)の実装において、miiboのナレッジデータストア機能が中心的な役割を果たします。外部ドキュメントを検索し、その結果を踏まえて回答を生成するこの技術により、特定ドメインの知識を持った対話システムを迅速に構築できます。

記事では、さくらのクラウドマニュアルを例に、URLを指定してクローラーがHTMLを自動収集する過程が説明されています。クローラーは階層をたどってリンク先を探索し、HTMLを発見して学習します。無償版では10ページまでという制限がありますが、基本的な動作検証には十分な容量です。収集されたHTMLは1000文字単位のチャンクに分割され、ベクトル化されてデータストアに保存されます。

HTMLからの情報抽出における技術的優位性

生成AIにとってHTMLの解釈は大きな課題となります。人間が見る整形されたWebページと、実際のHTMLコードには大きな差があり、タグやスクリプトなどのノイズが含まれています。通常はHTMLをmarkdown形式に変換する外部ツールが必要ですが、miiboはこの処理を自動化しています。

この自動化により、開発者は外部ツールの管理や追加課金を気にすることなく、純粋な対話システムの構築に集中できます。HTMLの構造を適切に解析し、意味のある情報のみを抽出してベクトル化する処理が、miiboのプラットフォーム内で完結する点が大きな利点となっています。

実践的な活用シナリオと今後の展望

亀田氏の記事は、単なる技術解説にとどまらず、実際のビジネスシーンでの活用を見据えた内容となっています。企業の技術文書やマニュアルを対話的に検索できるシステムは、業務効率化に直結する実用的なソリューションです。完全閉域網での運用が可能なため、機密情報を扱う企業でも安心して導入できます。

さくらの生成AIプラットフォームは「AIの力をすべての人に届ける」というコンセプトのもと、今後も連携可能なモデルやアプリケーションを拡充していく予定です。記事の最後では、個別相談の申し込みも受け付けており、実際の導入を検討する企業へのサポート体制も整っています。詳細な実装手順や技術的な背景については、ぜひ元記事をご覧ください。

記事の詳細はこちら:さくらの生成AIプラットフォームを活用したRAG構築 : NEC製 LLMモデル cotomi によるさくらのクラウドマニュアルを解説するチャットボット(https://knowledge.sakura.ad.jp/45017/)



Get full access to 岡大徳のメルマガ at www.daitoku0110.news/subscribe

サマリー

さくらの生成AIプラットフォームとNEC製の日本語特化LLMを組み合わせることで、専門知識がなくても高精度な対話AIを作成する方法を探るエピソードです。この方法は機密性の高い環境でも利用でき、多くの企業の課題解決に寄与しています。

対話AIの基本構築
さて今回はですね、プログラミングの知識がまあ全くなくても、結構すごい日本語の対話AIを作れるという、そういう方法について深く見ていきたいと思います。
元ネタは、亀田春信さんという方が書かれたさくらのナレッジの記事ですね。 さくらの生成AIプラットフォームと、あとNEC製の日本語特化LLM
ことみ、それからノーコードのAI構築ツールmiibo、これを組み合わせるという事例です。
そうですね。目指すところは、例えば企業が持っている大量のマニュアルとかですね、そういう文書情報をチャットで聞くだけで、ちゃんと答えが返ってくるシステム。
うーん、なるほど。 しかも大事なのが、完全に隔離された閉域網で動かせるという点、これ機密情報を扱う上では、すごく大きな意味がありますよね。
まさに、いやーそこ重要ですよね。この記事を手がかりに、じゃあどうやってそれができるのか、そしてなんでこれがただの効率化ツールじゃないのか、そのあたりを探っていきましょう。
はい。 まずこのアプローチ、面白いのは、やっぱり専門家じゃなくても高度なAIが作れちゃうっていうそのノーコードって部分ですかね。
さくらのプラットフォームっていう土台があって、その上で日本語が得意なコトミっていう頭脳を乗せて、それをミーボっていう直感的なツールで組み立てるみたいな、そういうイメージでしょうか。
まさにその通りだと思います。コトミはNECさんが開発したLLMで、やっぱり日本語の細かいニュアンスとか専門用語の扱いに長けてるんですね。
重要なのがおっしゃる通り、独立した閉域網で動かせる。これで情報のセキュリティレベルがグッと上げられるわけです。
さらにさくらさんのプラットフォーム自体も使った分だけ払う、重量課金制で、しかも通信料もかからない、コスト管理がしやすいっていうのも魅力ですよね。
いやーそれは大きいですね。じゃあ具体的にその対話するマニュアルみたいなものってどうやって作るんですか?記事によると、まずミーボ上でAIモデルとしてコトミを選んで、それからシステムプロンプトを設定すると。このプロンプトっていうのはAIの性格づけみたいなものですよね?
そうですね。例えばあなたは親切な社内ヘルプデスク担当ですとか、このマニュアルに基づいて丁寧な言葉で答えてくださいみたいに、AIの役割とか話し方を具体的に指示するわけです。
なるほど。
そして実際の知識、その参照部分ですね。いわゆるRAG、Retrieval Augmented Generation、これを実現するのがミーボのナレッジデータストアっていう機能なんです。
ナレッジデータストア。
ここに元になる文書、今回の例だとサクラのクラウドマニュアルの情報を登録していくわけです。
へー、マニュアルがウェブページにあるなら、そのURLを入れるだけでミーボが勝手に中身を読み込んで学習してくれるんですか?
そうなんです。
しかも無料版でも10ページまで試せるって書いてありましたね。これはかなり手軽に始められそう。
そうですね。読み込んだHTMLデータはそのままじゃなくて、意味のある塊、まあチャンクって見えますけど、さらにコンピューターが意味を理解しやすいベクトルっていう形式に変換して保存するんですよ。
ベクトル化ですか?
ええ。言葉とか文章の意味を数値のデータ、意味の座標みたいな感じで表現する技術ですね。これでAIは質問と関連性の高い情報を効率よく探せるようになるんです。
あのー、ここが個人的にすごく面白いなと思った点なんですけど、
はい。
普通AIってウェブページ、つまりHTMLをそのまま理解するのって結構難しいって聞くんですよね。タグとかスクリプトとか人間には見えない情報がいっぱいあるから。
ええ、おっしゃる通りです。
普通だったら人間がデータをきれいに整える、いわゆる全処理っていうのが必要になるんじゃないですか。
まさにそこがポイントなんです。通常はその全処理に専門知識とか別のツールが必要になることが多いんですけど、
miiboはこのHTMLの解析とか、整形、それからベクトル化までを全部自動でやってくれる。
ええ、それはすごい。
これが技術者じゃないユーザーにとっては、実はものすごく大きな壁を取り洗ってるんですね。
アイデアさえあれば、データ準備の複雑さなしに対話AIの中身作りに集中できる。
AI開発のハードルをかなり下げていると言えると思います。
なるほど。ということは、専門知識なしで日本語に強くて、しかもセキュアな環境で社内の文書に基づいた対話AIが作れちゃうと。
そういうことになりますね。
セキュアな文書検索AIの実現
ただ、ノーコードツールって聞くと、どうしても機能に限界があるのかなみたいなイメージもあるんですけど、
このmiiboとKotomiの組み合わせで実際どのくらい複雑なことまでできるものでしょうか。
まあ、もちろん非常に込み入ったロジックとか、特殊な処理が必要になってくると、やっぱりコーディングが必要になる場面もあるとは思います。
でも、例えば社内規定の検索とか、よくある質問への対応、マニュアルからの情報抽出とか、多くの企業が抱えている割と典型的な課題。
これに対しては、この組み合わせで十分すぎるくらい強力な解決策になり得ると思いますね。
なるほどね。
ちょっと想像してみてほしいんですけど、新人さんが分厚いマニュアルと格闘する代わりに、AIにレーザーの申請手順ってどうやるんですかって聞くだけで済む。
そういう活用がもう現実的になってきているわけです。
いやー、それは単に便利っていうだけじゃなくて、組織の中の知識の共有の仕方自体が変わるかもしれないですね。
そう思います。
今回は日本語に特化したLLMとノーコードツールを組み合わせることで、専門知識がなくてもかなり高精度な文書検索AIを、しかも安全に作れるっていう具体的な方法を見てきました。
そうですね。そして、やはり完全閉域網という選択肢がある点は、セキュリティをすごく重視する日本の組織文化においては、特に響くポイントかもしれません。
最後にちょっと皆さんも考えてみてほしいんですけど、もしあなたの組織でこういうツールが当たり前になったとしたら、今までなかなかアクセスしにくかった、いわゆる暗黙値とか形式値がどういうふうに活用されるようになるでしょうか。
面白い問いですね。
必要な情報に誰もが対話を通じてすぐにたどり着ける未来っていうのは、私たちが思ってるよりも案外すぐそこまで来てるのかもしれないですね。
元記事へのリンクも載せておきますので、もっと詳しく知りたい方はぜひ見てみてください。
06:51

コメント

スクロール