データアナリストのりょっちゅです。 データサイエンティストのたっちゃんです。
ハルシネーションってなんで起こるんですか? っていう話を今日はしましょうか。
なんか素敵な論文が出たね。 そうですよね。OpenAIからなぜ言語モデルはハルシネーションするのか。
生成AI系の論文にしては、後々でも読めそうな論文だなっていう感覚があって面白かったかも。
生成AI系の論文ってさ、そのモデルを使ってこうだった、みたいなものが多かったり、新しいモデルのアルゴリズムのリリースだったりみたいな、アルゴリズムというか、まあなんかリリースの内容だったりみたいなのでさ、
3ヶ月ぐらいすると古くなっちゃうじゃん。 そうですね。 新しいモデル出たりするから。なんかその一方で、
今回のやつは比較的長い間、そのハルシネーションっていうものに悩んだ時に、仕組みを一旦知っとく上でいいのかなっていう感覚がちょっとあったから寿命を流そうって言った。
ああそういうことですね。確かになんか結構これまでの考えられてきたことを根本から否定するというか、振り返ってみて、ハルシネーション原因ってこれだよねっていうところを突き止めたって意味だと、
まあ価値のある論文なのかなというふうに自分も思いましたね。 ね、そうだよね。
ハルシネーションに関する研究ってなんかそんな盛んなのかな。そこが今回の知ったところで止まってるからまだあんま分かってないんだよね。
ああ確かに確かに。ハルシネーション、簡単に言うと AIが自信を持って嘘をつくみたいな、間違ったことを言うっていうのがハルシネーションで、
なんかこれまでって結構、学習していたデータの中にあった間違いとか、学習データ起因で起こっていたみたいなことが考えられていて、
だからもっともっとこう正しいデータをAIに読み込ませて学習させたらいいモデルができるんじゃないかみたいな、
そのいわゆるより大きなモデルを作っていくみたいなところを目指した研究は多かったと思うんですけど、
なんか今回はそもそもこの方向性に対して疑問を唱えるというか、根本それだけでは解決できないよねって言ってたものなのかなというふうに見ていて、
事前学習と言われるAIを作る部分に対する問題だけではなくて、AIそのものを評価するときのそこにある原因が別であるんじゃないかっていうところが言われたのが結構価値のあるポイント。
学習の仕方。
そしてそのAIを評価するときの評価ポイントみたいなところかな。
なんかもっと具体的に言うと、ここの論文で言われていたのは、AIがわからないようなことを聞かれたときに、
わからないですって言うんじゃなくて、わからないんだけどなんか適当に答えていたらたまたま当たるよねみたいなところをAIがしていて、
そこに対して何かペナルティもなかったり、これまではペナルティもなかったり、たまたま当たったことに対して、
あ、当たったからラッキーみたいな感じでAIがこう、間違った学習をさせていく方向に進んでいたのが実際あって。
ああ、はいはいはいはい。
ただそれって本当は良くなくて。
その、狙って当たりだと思って当たりを当てたときにこそ評価してあげるべきで、
そうじゃない、当てずっぽ、なんか人間で言うと鉛筆コロコロで当てたものも、まあ運も実力のうちみたいな感じの評価方法になってたみたいな。
ああ、まさにそういうことですね。なんか、自分これ読んだ時思ったのはセンター試験の4択で、わからなかったらとりあえず4つのうち1つ埋めておけみたいな、
そういうのをよく予備校とか塾で言われると思うんですけど、まあ、教育とかもね、同じだと思うんですけど。
ああ、なるほどね。
ああ、油マークシートのとりあえず書くみたいなところを、そのやり方は間違ってるよねってちゃんと評価する仕組みがAIに対してもあるべきだよねっていう、そういう話かな。
ああ、意図して4番を塗ったわけではなくて、適当に塗った4番もお前できるやんって言って点数もらえるってことね。
そうそうそう。今まではそれでオッケーだったんだけど、それじゃダメって話。
ああ、なんかあったよね。その、TOEICって何番の答えが比較的多いから、その4分の1の確率を超えれるのが3であるみたいな。
ありますね。1番に出てくる可能性は低いみたいな。問題文全部読ませたいかなとかありますよね。
確かに。それでなんか山張ってた気もするな。
はい。
間に合わなかったところを塗りつぶすときにとりあえず、1,2,3,4、1,2,3,4よりは3,3,3,3,3,3の方が当たるみたいな。
そうですよね。
時間なかったから最後どれ塗りつぶしたみたいな話してる不毛な会話とかありますよね。
でも多分世の中それで、それでなんか進路が大きく変わったとかっていう人多分いるよね。
まあいるんじゃないですか。たまたま当たったみたいな。
月1ギリギリのやつで。
そんなんはもうAIではいらないって話なんだけどね。
ダメなんだ。
それで人生変わるんだから運も実力のうちっていう言葉は信憑性あるよねみたいな。
はい。
AIにはダメなのね。
AIには運はいらないっていう。
分かんないんだったらちゃんと分かんないって言えっていう、そういう話なのかな。