1. 耳で学ぶAI、ロボシンク
  2. #62 いくつ知ってる?AIでよく..
2025-03-26 23:34

#62 いくつ知ってる?AIでよく耳にするAI用語集10選

🎊Udemyのベストセラー獲得を記念してクーポンを発行します。AI自動化に興味がある方はぜひ!

→クーポンはこちら

✍️内容

今回のエピソードではAIでよく耳にする用語について1つずつ解説します。

ハルシネーションやファインチューニングなど、AIを使っていると普段耳にしない言葉を聞きますよね。一度、AIの用語について押さえておきたい方はぜひ!

【用語一覧】

1. プロンプト

2. ハルシネーション

3. オープンソース

4. トークン

5. コンテキストウィンドウ

6. LLM

7. ファインチューニング

8. RAG

9. AIエージェント

10. AGI

---

おすすめ生成AIツールの資料を配布中🎉

→資料を受け取る

---

🔗リンク

note: AI用語集

note: Whisperをローカルで動かす

note: ChatGPTのファインチューニングを試す

Youtube: RAG(IBM)

Youtube: Figure

---

「耳で学ぶAI」ではChatGPTやGemini、Claudeなど生成AIを初心者・中級者向けに分かりやすく解説します。

---

👨‍💻パーソナリティ: 矢野哲平

「AIを分かりやすく、楽しく」をコンセプトにポッドキャストやnoteでAI情報を発信。株式会社root c代表取締役。福岡出身。

note

X: 矢野哲平

---

📩番組の感想や要望はこちら

⁠https://forms.gle/VMyVYWzHSNKZFu787

サマリー

このエピソードでは、AIに関連するよく耳にするキーワード10選が紹介され、それぞれの概念がわかりやすく解説されています。具体的には、プロンプト、ハルシネーション、オープンソース、トークン、コンテキストウィンドウ、LLMなどの重要な用語について触れられています。また、小規模言語モデル、ファインチューニング、リトリーバルオーギュメンティッドジェネレーション、AIエージェント、汎用人工知能(AGI)など、最新のAI技術や用語が深く掘り下げられています。

AIキーワードの概要
皆さんこんにちは、矢野 哲平です。この番組は、耳で学ぶAIをコンセプトに、初心者・中級者向けにAIを分かりやすく解説する番組です。
今回のテーマは、いくつ知ってる、AIでよく耳にするキーワード10選について話していきます。
はい、ということで今日は、AIでよく耳にするキーワードについて話していきます。 AIっていろいろな単語がありますよね。
ハルシネーションとか、ファインチューニングとか、今までの生活の中でちょっと聞き慣れないようなキーワード、単語っていうのがよく出てくると思います。
で、2025年になって、今年からAIを触り始めた人っていうのも多いと思います。 ここで一旦、AIの文脈で登場する単語について、押さえておきたいと思います。
AIでよく登場するキーワードについて、耳で学んでいこうというのが、今回の番組の趣旨となります。
はい、では早速始めていきましょう。 いろいろですね、AIで出てくる単語っていうのがあります。
ただ今回ちょっといろいろ選んで10個ピックアップしました。 ちょっと紹介しますね。
プロンプト、ハルシネーション、オープンソース、トークン、コンテキストウィンドウ、LLM、ファインチューニング、ラグ、AIエージェント、AGI
これら10項ですね。 で、この中で聞いたことがないというものがあればですね、ぜひ最後までお付き合いください。
はい、それではまず最初は型慣らしにプロンプトからいきましょうか。 プロンプト、聞いたことがある人多いと思います。
プロンプト、簡単に言うとAIへの指示となります。 チャットGPTを使っていると、人間からAIに指示を出しますよね。
この書類を要約してくださいとか、メールの下書きを作成してくださいとか、こういった指示となります。 で、こうした指示というのをプロンプトと言います。
ちなみにプロンプトエンジニアリングという言葉もあります。 これはですね、AIの回答を最適化するために効果的な指示の出し方であったり
プロンプトを設計する技術となります。 例えばよく聞くものとしてはフユーショットプロンプトとか、あとはチェインオブソートなどこういったものがですね
プロンプトエンジニアリングの文脈で使われたりします。 はい、ではどんどんいきましょう。次はハルシネーションとなります。
これ直訳するとですね、幻覚という意味になります。 あの幻を見るとかの幻覚ですね。
ハルシネーションを簡単に言うとAIが間違った回答を出してしまうことを指します。 例えば現在のアメリカの大統領は誰ですかとAIに質問したとします。
今はトランプ大統領ですよね。でトランプ大統領なんですけど AIがですね、アメリカの現在の大統領はオバマ大統領ですと。
こんな感じでAIが事実とは異なる回答をしてしまうと、これをハルシネーションと言います。 でこのハルシネーションっていう言葉、よく聞きますし
よく私もですねこのポッドキャストで使うわけですけど AIにおいてものすごく大事な言葉というかキーワードだと思います。
2025年現在以前に比べてAIの性能っていうのは格段に上がっています。 あの最初チャットGPTのGPT3.5とかが出ていましたけど、そういった時に比べてかなり性能
っていうのは上がっています。 でもですね、それでもハルシネーションをゼロにはできていないんですね。
そのためAIを使う時っていうのは、AIは誤った回答を出すことがあるんだと。 このことを念頭に業務に組み込む必要というのがあります。
AIはハルシネーションを起こすものだと。 ハルシネーションリスクを踏まえた上でAIを業務に組み込むことを覚えておきましょう。
はいでは次はオープンソースという言葉になります。 これですね実はAIの用語ではないです。
まあただAIの文脈でよく登場するのでこの機会にチェックしておきましょう。 オープンソースっていうのはソフトウェアのソースコードを一般に公開して自由に使ってくださいよ
というものになります。 AIの文脈ではこのAIモデルはオープンソースのAIモデルですと
いうような感じで使われます。 直近の例でいうとあのDeepSeekがオープンソースのAIモデルに該当します。
以前もこのポッドキャストでDeepSeekという中国のAI企業について紹介しました。 でこの中国のAI企業が開発するAIモデルがDeepSeekというわけです。
このDeepSeekの特徴としてオープンソースであることが挙げられます。 つまりですねこのDeepSeekのモデルっていうのは内容を公開しているんですね。
なのでオープンソースなのでこのDeepSeekのモデルっていうのは誰でも使うことができます。 自分が用意したマシンにインストールすることも可能です。
例えばですね私がこのDeepSeekのAIモデルっていうのを自分のマシンにインストールしたとします。 かなり容量が大きいので結構マシンのパワーも必要になってくるんですけど
DeepSeekを自分のマシンにインストールしたと。 でそうすることでオフライン状態でもこのDeepSeekを使うことができます。
このようにオープンソースのモデルになるとこういうことができるようになります。 誰でも自由に使えると。
ちなみにChatGPTとあとはジェミニ、クロードですね。 これらはオープンソースのAIモデルではありません。
なので自由にChatGPTをダウンロードして自分のマシンで使うみたいなことはできないわけですね。 逆にオープンソースで公開されているAIで言うと
メタフェイスブックとかあとはインスタグラムの会社ですね。 メタが開発するラマというモデルであとはグロック
これはイーロンマスクのAI会社が開発するAIとなります。 こちらもオープンソースとなります。
ちょっと細かい部分を言うとグロックは最新モデルはオープンソースではないですね。 最新モデルが今はグロック3ですかね。
グロック3はまだオープンソースのモデルとしては公開されていません。 一般的には公開されているんですけど
一つ前のモデルをオープンソースにするというように言っています。 さらにもうちょっとですねものすごく細かいことを言うと一応ですね
オープンAIとあとはグーグルもあの オープンソースのモデルを公開していないというわけではありません。
具体的に言うと例えばオープンAI 音声認識モデルのウィスパーというものをオープンソースとして公開しています。
これはあの音声から文字起こしができるというものになります。 あとはグーグルの場合はジェマというオープンソースの計量モデルを公開しています。
トークンとLLMの理解
ちょっとウィスパーの話が出たのであのちょっと余談になるんですけどせっかくなので あのですねウィスパーものすごくいいですよ
おすすめです。あのオープンAIが公開している オープンソースの音声認識モデルですね
ウィスパーってあのAPIからも使えるんですね。 オープンAIのAPIからも使えると。ただこちらで使う場合っていうのは料金が発生します。
であとはAPIなので外部にデータを送信する必要があります。 でもですねこのウィスパーオープンソースで公開されているのでもう一つの使い方として
自分のマシンにインストールして使うこともできるんですよ。 でこれで何ができるようになるかっていうと外部に音声ファイルを送信せずに自分の
マシンの中だけで完結して文字起こしができるというわけです。 例えば会社の機密情報を取り扱った会議の音声があるとします
でこれを文字起こししたいわけですけど外部に送信したくないとAPIは安全だというふうに 言われているけどちょっといろいろセキュリティの面を考えると怖いなと
でこうした時にですねオープンソースのウィスパーを使うことで自分のマシンだけで オフラインで文字起こしができると
であとは自分のマシン上で行うのであの文字起こしにかかる費用っていうのは一切 かかりません無料でできます
結構インターネット上ってあの文字起こしのサービスいろいろありますよね 基本無料のところとかも多いんですけど例えばその何十分以上はいくらかかりますとか
あの制限があります結構お金が発生するサービスが多いんですね ただそれは企業がサービスとして提供しているのでお金がかかってくるっていうのは
当たり前なんです ただですねこうしたオープンソースのウィスパーを使うことで自分が用意したマシンに環境構築
して無料でそして外部に情報を送信せずに音声の文字起こしができると これ結構ですね企業によってはニーズがあるんじゃないのかなと思ったりしています
ちょうど私あの先週の土日にこのオープンソースのウィスパーをちょっと触ってみたんですね 自分のマシンにインストールして実際に文字起こしをあのしてみたわけです
結構ですねいや結構というかかなりおすすめですね 少しプログラミングの知識が必要になるんですけど全然難しいものではないです
AIのサポート借りたら結構誰でも実装できるんじゃないですかね あの興味がある方はぜひ動かしてみてください
ノートに記事を書いたので概要欄にリンクを貼っておきます すいません脱線しました次のワードいきます
次はトークンですねこれもよく出てきますよね えっとですねトークンというのはAIが言語を処理する時の最小単位となります
文字数のカウントって言い換えるとわかりやすいかなと思います 例えばアップルという英語のあの言葉があるとします
Appleですねアルファベットだと6文字になります でこれトークンで換算すると1トークンになります
ちなみに同じ意味でもあの日本語でリンゴと トークンでカウントすると3トークンになります
まあ基本的にですね英語の方がトークンは少なくて日本語の方はトークンが多い傾向になります じゃあこのトークンはどこで使うのかっていう話ですけど
主に開発の文脈なんかでよく登場します 例えばチャットGPTをプログラムから操作する場合
APIというものを使います あの普段私たちが使っているチャット画面とは別でですね
コードからもチャットGPTを操作できます でその時にかかる金額っていうのはトークン単位で課金されます
例えばですね私がそうですね あのオープンAIのAPIを使ってメールを自動で作成するプログラムを作ったと
入力したプロンプトそしてAIから返ってきた回答 それらのトークンがすべて合わせて1000トークンかかりましたよと
こうした時にですねこの1000トークンに対してモデルに応じて設定されていた 金額が発生するというような具合となります
はいでは次にコンテキストウィンドウいきましょう これも割と聞いたことがある人多いと思います
チャットGPTなど各AIにはコンテキストウィンドウというものが設定されています 例えばですねチャットGPTのGPT-4Oというモデルなら
そうですね12.8万トークンのコンテキストウィンドウが設定されているというような感じです
またトークン出てきましたね コンテキストウィンドウの値もトークンで表現されています
GPT-4Oのコンテキストウィンドウは12.8万トークンとこんな感じですね でこのコンテキストウィンドウって何かっていうと簡単に言うと
AIの短期記憶のようなものとなります 短い記憶と書いて短期記憶ですね
AIってあのずーっと会話をしていくと最初の会話を忘れてしまうんですよね ちょっとなんか人間ぽい挙動なんですけど
でこのコンテキストウィンドウの値が大きい AIになるとより多くの情報を扱えるということになります
ちなみにコンテキストっていう英語の意味ですね 直訳すると文脈とかあと背景というような意味になります
ちなみにいろいろなAIモデルありますけど最大のコンテキストウィンドウを誇るのは 現時点ではGeminiですね
ChatGPTのGPT-4Oが12.8万トークンに対して Geminiは200万トークンのコンテキストウィンドウを誇ります
なので容量の大きい資料とかあとは会話内容を取り扱う場合っていうのは Geminiがおすすめです
はいでは次はLLMいきましょう これはラージラングエッジモデルの頭文字を取ったもので
LLMと呼びますラージラングエッジモデル LLMですね でこれは大規模言語モデルとも呼ばれます
大量のデータを使って学習された巨大な言語モデルというものです 具体的にはChatGPTやGemini、クロードもこの大規模言語モデルに分類されます
ちなみにこのLLMの反対でSLMというものもあります これはスモールラングエッジモデルですね
あの小規模言語モデルと呼ばれるものです でこのSLMは大規模言語モデルと異なって小型の言語モデルとなって
例えばですねそうですねあの先ほど少し紹介した Googleのオープンソースのモデル
小規模言語モデルの理解
あのGemmaというモデルがあるんですけどこれも小規模言語モデルに分類されます 小規模言語モデルは軽量でリソースも少なくて動作してくれると
あの例えばスマートフォンとかウェアラブルデバイス あのまあ例えばサングラスとかですねそういったものにAIを搭載したいと
でも大規模言語モデルだとかなり容量が大きくなってしまうと こうした時に小型で軽量に動作する
SLM あの小規模言語モデルを搭載するというような選択肢に使えます はいでは次はファインチューニングです
これも結構聞いたことがある人多いと思います ファインチューニングはAIのモデルを特定のタスクとかデータに適応させるために微調整を
行うことになります AIを目的に応じてチューニングしていくとそういったものですね
例えばですね そうですねわかりやすい例で言うとあの先ほど紹介した音声認識モデルのウィスパーがあります
これをちょっと例に出して説明してみます 音声認識モデルのウィスパーを使うと音声から文字起こしができます
ただケースによっては音声認識がうまく動作しないケースっていうのもあります 例えば業界用語とかですね
例えば私があの病院関係者だったとします医療関係者 でウィスパーを導入してみたけどやっぱり専門的な用語とかあとは業界用語の認識
制度がちょっと弱かったなと こうした時に学習の音声データというものを用意します
でそこからウィスパーをファインチューニング 微調整することで業界用語や専門用語なんかも音声認識がしっかりできるようになると
これがあのファインチューニングの事例となります ちなみに音声認識モデルのウィスパーをファインチューニングする例を話しましたけど
これってあのChatGPTのモデルでもファインチューニングすることができます 結構簡単にですね自分でファインチューニングできるんですよね
こちらも以前ノートに記事を書いたので興味のある方は覗いてみてください 概要欄にリンクを貼っておきます
検索拡張生成のアプローチ
はいでは次はラグ行きましょう rag と書いてラグですね
リトリーバルオーギュメンティットジェネレーションの略になるんですけど ちょっと難しいですよね
でこれ日本語で言うとあの検索拡張生成というような意味で使われたりします 生成AIって学習していない内容に関しては回答できないですよね
例えばそうですねあの弊社の就業規則について回答してくださいって言っても そもそも弊社の就業規則を学習していないので回答はできません
じゃあAIが学習していない情報でも回答できるようにしようよっていうアプローチから スタートしたのがこのラグとなります
例えばですね 社内の様々な質問に対して回答してくれる社内チャットボットを作成したいとします
こういった時によく採用されるのがこのラグというアプローチになります 社内の質問をしたら社内文章の情報を検索して関連性の高いものをAIに渡すと
そしてAIがその取得した社内情報をベースに質問に回答するとこんな感じになります これですねまぁちょっと言葉だけだとイメージが湧きづらいので
IBMがYouTubeに公開しているラグの動画があります だいたい6分ぐらいの動画ですかね
これが結構わかりやすく説明しているのでリンクを貼っておきます 興味のある方はこちらも覗いてみてください
はいでは次はAIエージェントとなります 最近よくAIエージェントっていう言葉を聞くようになりましたよね
あの私も年明けに公開したあのポッドキャストのエピソードで2025年 今年注目しているものとしてAIエージェントを挙げました
でこのAIエージェントっていうのは簡単に言うとですね 自律的にタスクを実行できるAIを指します
例えば人間が達成したい目標とか あとはタスクっていうのを設定します人間がですね
でそこからAIが自律的に考えてタスクを実行してくれると 例えば私がハワイに行きたいとあのタスクを設定したとします
でそうするとAIエージェントがハワイに行くための最安値の航空券を探してくれたり あとはおすすめのホテルとかその周辺のレストランなどを自律的にですね
判断しながらスケジュールを組んでくれると AIエージェントはこんな感じのイメージとなります
じゃあこのAIエージェントはどうやって作るのっていう話ですけど 結構ですねAIエージェントを作るフレームワークっていうのはあのたくさんあるんですね
例えば有名なところで言うとラングチェーンとか あとはオープンAIもスウォームっていうAIエージェント用のフレームワークを出しています
まああのこれはですねちょっと実験版にはなるんですけども こんな感じで結構いろいろなところがAIエージェントを構築できるフレームワーク
あとはツールなんかを公開しています あと最近で言うとマヌスっていうのも結構話題になってますよね
基本的にはあのAIエージェントっていうのはプログラムを書いて実装していくんですけど ノーコードであのコードを書かなくても作る方法というのもあります
例えば有名なところで言うとDeFiとかですね あの日本で人気のあのAIツールですね
ただ現時点ですべてAIが自律的に稼働して満足のいく成果を出してくれるのかっていうと まあちょっとこれはですね
現時点ではなかなか難しいかなという部分もあります とはいえどんどんAIの技術が進歩していっているのでAIエージェントでできることっていうのは
これからもっともっと広がると思います はいでは最後の締めくくりとなります
汎用人工知能の未来
AGIいきましょうか これもよく聞く言葉ですね あの例えばオープンAIのCEOであるサムアルトマンも
AGIについてたびたび言及しています あとは日本で言うとあのソフトバンクのソン会長
ソン会長もあのAGIっていう言葉をよく使ってますよね でこのAGIっていうのは汎用人工知能とも言われます
簡単に言うと人間のような知能を持つ人工知能 これをですねAGIと言います
例えば人間のように汎用的な能力を有すると 特定の領域だけ得意というわけでなくて結構様々なタスクや問題に対しても
対応できる能力を持っていると あとは人間のように学習する能力があったり
人間のように意思決定ができるそういった能力を有する それがAGIの特徴というように言われています
今私たちって基本的にあのパソコン上でAIとチャットでやり取りをしていますよね 将来的にこのAGIっていうのが出てくると
例えばですねこのAGIがロボットに搭載されると そうすると人間のように様々なタスクをこなしたり
学習したり意思決定ができるあのロボット アンドロイドみたいなものですね そういったものができるようになると
ちょうど1年前ぐらいでしたかね あのフィギュアというスタートアップがあります
ロボットを開発しているスタートアップですね でこのフィギュアが開発したロボットにオープンAIのモデルを搭載したよというような
ことで話題になりました こんな感じでゆくゆくはロボティクスとあとはAIが融合して
アンドロイドが誕生するなんて日も近いのかもしれないですね フィギュアのYouTube動画概要欄に貼っておきますので興味のある方はこちらも
覗いてみてください ロボットはちょっとロマンがありますね
はい今回は以上のAIワードを解説しました プロンプト ハルシネーション オープンソース トークン
コンテキストウィンドウ LLM ファインチューニング ラグ AIエージェント AGIですね
他にもいろいろ言葉はあります 例えば上流とかですね でも今回はよく耳にする言葉っていうのを10個ピックアップしてみました
で今回話した内容はノートにまとめておきますので後で見返したい方っていうのは 復習がてら覗いてみてください
はい今日はこの辺ということで本日も聞いていただきありがとうございました ちょっと話変わるんですけどあの先日
UDEMYでノーコードでAI自動化を実装するという講座を公開しました でこの講座がベストセラーを獲得しました
ありがとうございます ベストセラーを記念してあのクーポンを発行したので AIの自動化に興味のある方は覗いてみてください
番組ではこのように耳で学べるAIを毎週発信しています 通勤中や家事の合間にAI情報をキャッチアップできます
毎週水曜朝に更新していますのでぜひフォローをお願いします そしておすすめの生成AIツールをまとめた資料も配布しています
興味のある方はこちらもぜひ概要欄にリンクを貼っておきます お相手は耳で学ぶAIの矢野てっぺいでした
また次の配信でお会いしましょう
23:34

コメント

スクロール