1. むらスペ
  2. 言語をコントロールするプロン..
2023-04-12 10:56

言語をコントロールするプロンプト

chatGPTの回答する言語をコントロールするには「LanguageCode:」をプロンプトに入れると効果的だということを話しました。その前提として、日本語でプロンプトを書くと英語でプロンプトを書くより回答の精度が落ちてしまうという問題も実例を上げてご紹介しました。


--- Send in a voice message: https://podcasters.spotify.com/pod/show/murasupe/message
00:01
冒険家の皆さん、おはようございます。
今日もですね、落雷に揺られて灼熱の砂漠を横断していらっしゃいますでしょうか。
本日は2023年4月12日、インドでは午前8時29分を回ったところですね。
今日も音声配信、むらスペを始めさせていただきたいと思います。
どうぞよろしくお願いします。
今日お話ししたいのは、言語をコントロールするプロンプトということですね。
これを話そうと思ったのはですね、僕がヒンディ語を勉強していて、
そのヒンディ語のわからない言葉とかをですね、チャットGPTに聞いたりすると、
時々ですね、日本語じゃなくてヒンディ語で説明が出てきちゃったりすることがあるからなんですね。
僕のヒンディ語はまだ本当に初級レベルなので、しかも言語学とかヒンディ語で勉強しているわけではないので、
その文法の説明とかですね、そういうのをヒンディ語で見せてもらっても、
ちょっと僕のヒンディ語のレベルではまだそれが読める、読むことはできません。
それでそういう時にいちいち日本語でお願いしますとかね、
言わなきゃいけないのがちょっと今まで面倒だったなというふうに思っていたんです。
あと実はもう一つ、この背景には別の問題もあってですね、
実はそのプロンプトをね、日本語で書くか英語で書くかっていう問題があります。
英語を教えている場合で、英語でね、ロールプレイとかするときは最初から英語で書いてしまっても全然問題ないんですけど、
日本語教育の場合はそれを日本語でプロンプトを書くこともあると思います。
ただですね、問題はチャットGPTが持っている言語のデータセットというのはですね、
英語はとても多い、ちょっとこれはまだソースが今見当たらないんですけど、
持っている言語のデータセットの半分ぐらいが英語だっていうんですね。
残りが日本語とかロシア語とか中国語とか他の様々な言語になっているわけなんです。
ですので、その答えの正確さっていうのは、その言語モデルですよね、
チャットGPTが持っているデータの量に、本当に正比例するかどうかはわからないんですけど、
つまりデータセットが大きければ大きいほど、
回答の正確さが上がってくるというのは実際あります。
それでですね、日本語教育の現場でも英語でこのプロンプトを書くというのは
03:04
ごく普通に行われていることなんですけれども、
しかしそうするとですね、日本語でロールプレイをしたいのに英語で返事が来てしまったりとか、
そういうふうに言語がコントロールできないことがちょっとあるんですね。
それもあるので今日はその話をしてみようと思っています。
まず最初にですね、英語と日本語でどのぐらい精度が違うのかということですよね。
つまり同じ日本語の回答が欲しいのに、
そのプロンプトを英語で書いたときと日本語で書いたときでどのぐらい精度が違うかということをですね、
ちょっと一つご紹介してみたいと思いますね。
これは特に本当に日本語教育の現場に関わるような例でやってみたいんですけど、
これはですね、セフ・アールですね、ヨーロッパ共通参照学のA1レベルの日本語で
冒険映画っぽいストーリーを書いてくださいって言ったときの、
それを日本語でプロンプトを書いたときと英語に翻訳してからそのプロンプトを入れたときの違いです。
まず最初にですね、冒険小説、冒険のストーリーちょっと長くなるので、
最後の2段落だけご紹介しますけど、最初は英語でですね、
英語でこのプロンプトを入れたときにどうなったかということです。
ヨーロッパ共通参照学のA1レベルの日本語でというふうにお願いしてるんですね。
はい、じゃあ2段落だけちょっと読んでみますよ。
まずは英語でプロンプトを書いたときの例です。
最後に彼女はアメリカに行きました。
そこで彼女はハリウッドの映画スタジオを訪れました。
彼女は映画の撮影に参加することができました。
彼女は自分が映画スターになったような気分になりました。
山田さんはたくさんの経験をしました。
彼女は世界中を旅し、新しい友達を作りました。
彼女の夢が叶い、彼女はとても満足していました。
はい、ここまでですね。
では今度は同じプロンプトを
その前にですね、十文とか副文が少なくて
短文が多いということがわかると思います。
例えば彼女はアメリカに行きましたとかね。
そこで彼女はハリウッドの映画スタジオを訪れましたとか。
十文でも副文でもない短文ですね。
そういうものがたくさんこの中にはあるというのがわかると思います。
ではその次に同じプロンプトを日本語で入れたときに
どういう物語が出てくるかということを
06:01
実際の例をご紹介しますね。
以下チャットGPTが出してきた
ヨーロッパ共通参照枠のA1レベルの日本語での
冒険映画っぽいストーリーの最後の2段落です。
最後に彼女はエジプトに向かいピラミッドを探検しました。
彼女は秘密の部屋を発見し、そこで貴重な宝物を見つけました。
しかし宝物を手にした瞬間罠にかかってしまい
ピラミッドからの脱出が困難になってしまいました。
しかし彼女は勇気を出して
罠を避けながら脱出する方法を見つけました。
田中さんは多くの危険に立ち向かい困難を乗り越えました。
彼女は新しい友達を作り、冒険に満ちた旅を経験しました。
彼女は冒険家として成長し、世界を見ることの重要性を学びました。
ここまでですね。こういうふうに見てみると
さっきの最初に英語でプロンプトを書いたときには
十文でも複文でもない短文がたくさんありましたけど
この中には短文が一つもないということが分かるのではないかと思います。
なのでこれだけ見ても
日本語の母語話者の人にはこの難しさの違いというのはあまり分からないかもしれませんけど
これは本当に日本語の学習者にとっては
もうすごく大きな違いがこの2つにはあると思います。
それでですね、僕が実はヒンディ語を勉強しているときも
全く同じようなことがあるんですね。
英語でヨーロッパ共通参照学のA1レベルのヒンディ語で
ストーリーを作ってくださいというときと
それと同じことを日本語でプロンプトを書くときでは
本当に難しさのレベルが全然違うので
それで僕も英語でプロンプトを書くようにしています。
それでプロンプトが日本語じゃないということが結構あるわけですね。
日本語教育の世界でもですね。
ヒンディ語教育の世界でもだと思うんですけど。
そうすると多分最初からプロンプトが全部日本語だったら
ChatGPTの回答も全部日本語になってくると思うんですよ。
ですけどこういうふうに英語でプロンプトを書いていたりすると
日本語で回答が欲しいのに英語で返事が来てしまう
というようなこともあります。
ロールプレイのところに英語の翻訳がついてしまったりとか
そういうこともあるんですね。
なのでそれを避けるために回答は日本語だけでお願いしますとか
日本語だけで回答してくださいとか
09:01
そういうふうにプロンプトの中に入れることもあるんですけど
もちろんそれを英語で書いたりすることもあるんですけど
だけど実はこれもっと直接的に分かってもらう書き方がある
ということが分かりました。
これがランゲージコードって言うんですよ。
もう本当に英語でそのままランゲージコードって書くんですね。
スペースなく。
その後にコロンを入れてJAって入れます。
ランゲージコードコロンJAですね。
JAはもちろんジャパニーズのことですね。
なのでそれを入れるとかなりコントロールが
強くできるようになるみたいですね。
その後僕も何回かやってみたんですが
途中でヒンディ語を勉強しているときに
ヒンディ語で説明されてしまったりするようなことは
今のところなくなっています。
なのでまずプロンプトを英語で書いたほうがいい
正確なものが出てくるということがあるんですけど
でもそうすると日本語じゃない回答が出てきてしまうことがある
そういう問題を避けるためには
このランゲージコードというのを入れると
それが解決できるというのが
昨日の夜から今朝にかけての発見としてありましたので
それを今日はご紹介させていただきました。
それでは本日もムラスペにご参加くださいまして
ありがとうございました。
今日の言語をコントロールするプロンプトにつきまして
感想とかコメントがありましたら
ぜひムラスペのハッシュタグ付きで
ご共有いただければと思います。
それでは本日も良い一日をお過ごしください。
そして冒険は続きます。
10:56

コメント

スクロール