#39 水準数が異なる直交表の応用的な使い方＆テストスキルと生成AI（LLM）の相性

オープニングと直交表の復習

皆さん、こんにちは。B-Testingのブロッコリーです。このB-Testing.fmは、QAエンジニア

である私、ブロッコリーがテストや品質に対する私内の考えを約10分間

で語っていくポッドキャスト番組です。この放送の公開の予定日が6月

の29日ですね。なので、ちょうど自分が実行委員長をしている若手の開催

した次の日になると思います。6月27日、 28日に若手2026夏を開催して

いたはずです。おそらく。なので、もし参加された方でこのポッドキャスト

を聞いているという方がいたらですね、どうでしたかね。楽しめましたかね。

また若手参加したことがないという方とか、今回参加してなかった

人はもしよければ半年に1回やってますので、次は12月にあるはずです

ので、もしよろしければ参加してもらえればと思います。

今日は前に話した直行表の使い方のちょっとした応用編になります。

ということで今回もB-Testing.fmスタートです。ということで今日は直行表

のちょっとした応用というか、話していきたいなと思います。水準数が

異なる直行表の使い方について話していきます。まずは前に話した

直行表復習になります。直行表とは何かという話ですね。直行表

はすでに定義されている数学的に裏付けられた表ですよと。この表

を使って組み合わせのセットを生成できるということが書かれています。

主な直行表の種類、これも復習にはなりますが、L4と呼ばれるような

3因子2水準の場合、L8と呼ばれるような7因子2水準の場合、L9と呼ばれる

ような4因子3水準といったものがあります。この中でも例えばL4ですね

3因子2水準の場合っていうのは通常に使おうと思えば2水準まで

しかできません。L8についてもそうですね。7つの因子まで対応できる

だけれども、そのときの水準は2水準までしか使えませんよというのが

基本的な直行表の形になっています。このときの水準数が全部2水準とか

あとはL9の場合は全部3水準だったらそのまま適用できるんですけれども

一部の因子だけ水準の数が変わっていたらどうなるっていう、どういう

ふうに使うのかというのを話していければなと思っています。説明

水準数が異なる直交表の応用：コーヒーショップのカスタマイズ

に使うお題は前回までに使っていたお題とほぼ一緒です。コーヒー

500円のカスタマイズができるっていうので、量が前回まではMサイズか

Lサイズの2水準だったのに対して今回はSサイズという3水準目を

付け加えました。あと処理は通常かデカフェ、シロップも普通か多め

トッピングも無しかチップ追加っていう他は2水準のものです。この

ときのコーヒーの価格に関するテストをしたいと。そうなったとき

にこれどうするかというと、まず今の話したお題に出てきた要素

を考えると、先ほども言いました量についての因子に関しては具体的

な値水準はS、M、Lの3つ。それ以外は処理、シロップ、トッピングが

全部2水準ずつになります。これをどうやって使うかというと、先ほど

紹介した3つの直行表のうち7因子 2水準の直行表L8を拡張して使って

いきます。どうやって使うのかという話ですが、こういうふうに見ます。

まず量がSかMかLかの3種類というお話をしました。量がMかLかの2種類

だった場合は直行表の1列目のところ 11、11、22、22の部分に1の部分にM、2

の部分にLを入れたというのが前回お話したやつでしたが、この3種類

S、M、Lになったらどうするかというと直行表のうち1列目、2列目、3列目

までを使って表現します。そうすると 1番目のテストケースは111、2番目

も111、3番目は122、4番目は122、5番目は212、6番目は212というふうになります

と、こういうふうに3つ合わせて使うことで、111、122、212の3パターン

を作り出すことができるわけですね。なので、ここにS、M、Lを当てがって

いきます。7番目のところと8番目のところ、221と書かれていた部分は

ここは2位です。本当は4つ目の選択肢もあったら、例えばLLとかあれば

それを入れればいいんですが、今回は3つまでしか水準が存在していない

ので、4つ目は2位になります。適当な SかMかLどれかを入れればいい

というふうになります。残りは同じような形ですね。処理通常化デカフェ

は4列目のところ1212、1212、1の部分に通常、2の部分にデカフェを入れて

いきます。そうすると通常デカフェ、通常デカフェ、通常デカフェ、通常デカフェ

というふうになるわけですね。同じようにシロップも1のところに普通、

2のところに多めを入れて、普通多め、普通多め、多め、普通多め、普通

というふうになります。最後6列目のところにトッピング無しかチョコチップ

か、1211、1212、1にそれぞれ当てはめて無しチョコチップ、チョコチップ無し、

無しチョコチップ、チョコチップ無しというふうになります。これで

直行表が完成します。2と書かれている部分どうするかというと、先ほど

言ったようにSかMかLをどれかを 1つ入れますと。今回の場合はSとM

を入れてSSMMLLSMというふうな量のところの8つのテストケース

にしました。こういうふうにしても 2種類の意思の組み合わせは必ず

存在しています。ペアワイズになっています。例えば1つ選ぶとして、量がLサイズ

でシロップが普通というのを見ると、それは6番目にあるなとか。あとは

量がSサイズでシロップが普通って考えると1番目にあるなとか。そういう

ふうにできますと。必ず存在していることになります。ペアワイズは満たして

います。ただし直行表を変則的に使っている以上、出現回数は同じ

ではありません。例えばさっき言った量がSでシロップが普通はテストケース

1番目の1つだけ存在しますが、量がSサイズでシロップが多めのものは

2番目のテストケースもそうだし 7番目のテストケースもそうですね。

こういうふうに出現回数は同じではないっていうのは、もともとの直行表

の使い方とはちょっと違うんですけれども、少なくともペアワイズ

は満たしている状態を作ることができます。ということで、水準数が異なる場合、

特に今回の場合のように他は2水準なんだけれども、ある1つだけ3水準

のときっていうのは直行表のうち 1列だけを使って1に当てはめるわけ

ではなくて、複数列使ってその組み合わせによって当てはめていく。そうする

ことによって2水準の直行表であっても 3水準以上のものを適用するっていうことが

できるというお話をしていきました。なお、1つ補足としてお伝えすると、

今回の場合は7因子2水準の直行表 L8を使って、それの1番目2番目3番目の

列を使って3水準Sサイズ、Mサイズ、 Lサイズを適用しましたけれども、

別の方法として直行表L9を使うことももちろん可能です。L9を使ったときは

L9の1列目のところにの1、1、1、2、2、 2、3、3、3のところにの1の部分Sサイズ

2のところにMサイズ、3のところに Lサイズを入れることでSSS、MMM、LLL

っていうふうに入れることができます。また処理が通常デカフェっていう

ところは2列目のところの1、2、3、1、 2、3、1、2、3の1の部分に通常2の部分に

デカフェを入れますと。3の部分は 3つ目の選択肢はないので通常デカフェ

どちらでもいいので2を入れるというふうにやります。そういうふうに

してすることによって、4因子までだったら3水準ないものも2を入れる

ことで対応が可能ということで今回は2つ目のやり方は今口頭のみ

での説明になりましたけれども水準数が異なる場合でもうまく工夫

することで直行表を使えるというお話をしてきました。

質問コーナー：QAスキルとLLM活用の相性

それではここからは質問のコーナーですね。以前いただいていた質問

から紹介していきます。QAスキルとLLM活用の相性は良かったり

どうしますかという質問をいただきました。ありがとうございます。個人的な

考えとしてQAスキルというよりも QAっていうと品質保証のスキル

っていう話になりますがその中の特にテストスキルですね。テスト

のスキルとLLMの活用の相性は意外と良くないなという印象を持っています。

どうしてかというと今日ご紹介したやり方ですね直行表の算水準

がある場合の直行表をこれを例えば生成AIに指示して作成するとこういう

ふうになりますと左のような表ですね医療がSSMLLSMで処理が通常通常

でカフェ通常通常シロップが普通多め普通多め普通多め普通多め

トッピングがなしチョコチップなしチョコチップチョコチップ

なしチョコチップなしっていうふうに例えばこういうふうに作成

してくれます。一見するとこれ直行表そのまま使ってうまくできてそう

に見えますよね。けれどもこれは直行表というよりもペアワイズ

のことを考えると実はあんまり良くない成果物になっています。

どうしてかというと例えばこの量と処理の組み合わせがペアワイズ

にしかもらいになってないんですよね。何かというと量がSサイズで処理

が通常のものはテストケース1テストケース 2あとテストケース7もありますけれども

量がSサイズで処理がデカフェっていうのが1つもケースとして出てきてないんですね。

これは何でかっていうと量のところを見るとSSMLLっていうふうになっている

ところに対して処理が通常通常デカフェデカフェデカフェと処理の部分が

まばらになってないっていう状態になっています。

何でこういうことが起こるのかっていうことを考えると実は直行表

っていうのはきちんと考えを知るとこの交互作用というものがあります。

交互作用っていうのは特定の組み合わせで効果が上がるような作用のもの

を確認するときに使ったりするんですけれども今回の直行表L8の場合

1列目と2列目の交互作用が3列目に来ます。なのでこれを今画面で

共有している中で左側のものをこれがさっき前半にお話した自分

が解説したやり方ですね。1列目 2列目3列目を使ってSサイズMサイズ

Lサイズを使うよっていうお話をしました。そうすると1番目のテストケース

2番目のテストケースは1列目2列目 3列目は111111っていうふうになっている。

3番目4番目は12122ってなっている。 5番目6番目は212217番目8番目は221221

っていうふうになっている。これを全部ひとまとめとして使ったほうが

いいですよ。なんでかっていうと 1列目の因子Aと2列目の因子Bの交互

作用として3列目が今回の場合は設定できてしまうと。一方で先ほど

生成AIで作ってうまくいかなかったパターンってどういうことかっていう

と1列目と2列目のみを使ってSサイズ MサイズLサイズを割り当てていたんですね。

3列目や3列目で処理の部分普通かデカフェカっていうのを

当てはめてしまっていたので 1列目2列目の交互作用のものである

はずの3列目の因子を用いているのでうまく散りばめられなくて

Pairwiseの認識感網羅も満たせないものになってしまったっていうこと

になります。ということでちょっと複雑ちょっと専門的な部分の説明

にはなりましたがこういうふうなちょっと専門的にちゃんと考えない

といけない部分っていうのが他にもいろいろあります。もちろん

機械的にできる部分はあります。例えばディシジョンテーブルでいえば

機械的に割り当てて◯トゥルーフォルスをつけていくはできます。一方で

そこから簡単化や金属のことを考えて圧縮をするみたいなところ

は人間の判断がいったりとかそこに専門的な部分があるわけ

ですね。この専門性っていうのがまだまだLLMの活用にはちょっと

壁になっているかなと思っています。なんでこれが壁になるかという

と個人的にはなんですが開発においてはオープンソースとして

いろいろこういうふうなプログラミングをしてっていうのは公開されている

ものが多いですと。ですがこのテストに関してはこういうふうにうまく

工夫してやればいいよっていうのを公開している資料が本当に

少ないと思うんですね。このPodcast の中で話したものでいえば直行

表の交互作用的な話も踏まえた話であったりとかあとは以前の

話でいえばクラシフィケーションをどういうふうなステップで作

っていくのかみたいなのは少なくとも日本語の文献ではほぼ見た

ことはないですし海外の文献でもほぼないと思っています。なので

学習するリソースが本当に少ないのでまだまだAIとしては学習でき

てないなのでうまくいってないっていうのが現状としてあるかな

と思っています。ということでちょっと専門的な話長くなっちゃ

いましたけれども私の考えとしてはまだまだうまくいかない現状

かなというのが質問のお答えになります質問ありがとうございました

エンディングとリスナーへの呼びかけ

ではエンディングです btesting.fm ではリスナーさんからのお便り

を募集していますエピソードの感想や私に聞いてみたい質問や

テストのお悩みなどどんなことでもかまいません投稿フォームは番組

概要欄にありますまたエピソードの感想はハッシュタグBtestingで

Xのポストをお願いいたします例えば今日の話で言えば直行表

を扱ってきました直行表いつも同じ数字しか使えないんじゃない

と思っていた方こういう使い方あるんだみたいな感想でもいい

ですしそもそもその使い方でいいのみたいな疑問点とか何でもかまい

ません聞いての感想をぜひポストお願いしますもしもこれからも

聞きたいという方はお手持ちの Podcastアプリで番組のフォローをお願いします

最新回が上がったときにすぐに気づくことができます今日オープニング

で話したとおり若手を昨日までやってきましたがもしかしたら

若手で多分自分宣伝してるんだろうなと思っているので若手で宣伝

見て聞いてじゃあちょっとPodcast を聞いてみようかなって思って

今回のエピソードを聞いた人もいるかもしれませんこんな感じで毎回

テストの話していますのでぜひ気になる方はフォローをお願いします

ということで今回はここまでですそれではまた次回

バイバイ

総スター数

エピソードをシェアする

Instagram シェア画像

埋め込みプレイヤーのカスタマイズ

プレビュー

カラーテーマ

メッセージを送信

Yuya Kazama

感想

サマリー

目次

総スター数

コメント

感想を書く

#39 水準数が異なる直交表の応用的な使い方 ＆ テストスキルと生成AI（LLM）の相性

総スター数

エピソードをシェアする

Instagram シェア画像

埋め込みプレイヤーのカスタマイズ

プレビュー

カラーテーマ

メッセージを送信

Yuya Kazama

感想

サマリー

目次

総スター数

コメント

感想を書く

#39 水準数が異なる直交表の応用的な使い方＆テストスキルと生成AI（LLM）の相性