デジタルヒューマンの登場
テレビ北海道の情報番組スイッチンにAIデジタルヒューマンアナウンサーが登場するということをニュース記事で知りました。
バーチャルヒューマンは、簡単に言うと人間に似ているリアルな見た目のCGで作られているアバターですね。
お天気キャスターとして11月18日土曜日の番組に出演したらしいです。
スイッチンは午前11時からの30分番組です。
AIバーチャルヒューマンのアナウンサーが起用されるのは地上波テレビでは初めてということらしいです。
このニュースを知って最初に思ったのが、このバーチャルヒューマンのアナウンサーは音声合成でテキストから喋るのか、声は生身の人間なのか、どっちなんだろうということです。
AIバーチャルヒューマンアナウンサーと言っているくらいなので、音声も当然音声合成でテキスト原稿を元に喋るんだろうなと考える人が多いと思うんですが、
もしかしたら声は実際の生身の人間のアナウンサーというやり方もあるなと思ったんですね。
別にズルとかインチキとかいうわけではなくて、見た目だけがデジタルヒューマンで、声は生身の人間でもVTuberと同じで、メリットとかやる意義は十分あるはずです。
ニュース記事ではその辺の説明は見つけられなかったんですが、このデジタルヒューマンの開発元のニュージアという会社から、この件についてのニュースリリースが出ていました。
そのニュースリリースの中に、人間のアナウンサーが持つ温かみと親しみやすさを兼ね備えつつ、AIが提供する性格無比な情報伝達能力を生かし、番組をさらに魅力的なものに変貌させることでしょうと書いてあったんですね。
このAIが提供する性格無比な情報伝達能力というところから、生身の人間じゃなくてテキストをもとに音声合成で喋るんだろうなと判断しました。
バーチャルヒューマンの特徴
実際のスイッチンに登場したお天気キャスターの動画はまだ見られていないんですが、開発元のニュージアがデジタルヒューマンを紹介するために用意している動画を見ることができました。
それを見るとやっぱり音声読み上げで喋っていますね。そしてまさにデジタルヒューマンが天気予報を読み上げている動画もありました。
そのバーチャルヒューマンの見た目の人物としては、今回スイッチンに採用されたイーナという名前がついてるらしいんですが、そのイーナさんとは見た目は違ったんですが、
たぶんCGの出来であったり喋りであったりのクオリティは私が見たそのデモ動画と同等なのではないかと思います。
それを見た感じ、音声にしてもCGによる人物にしてもそんなに違和感は感じませんでした。
普通にすんなり受け入れられるレベルだなと感じました。
もちろん実際の人間が喋っているのと見間違えるような感じではないんですが、
CGで作られたキャラクターが音声合成で喋ってるんだなということは感じるけど聞き取りづらいとか、CGの人物の動きが不自然で気持ち悪いとかそういう感じはなかったです。
不気味の壁という言葉があって、ロボットとかCGをリアルな人間にすごく近づけていくと、
リアルになればなるほど逆に実際の人間との違いが気になっちゃうのか、
気持ち悪い不気味の壁というぐらいなんで、不気味に感じてしまう、嫌な感情を抱かせてしまうそこの壁、そこを越えたら受け入れられるという不気味の壁という言葉が有名なんですが、
このニュージアのバーチャルヒューマンを見る限りでは不気味の壁はあまり気にならないと思いました。
ただその動画でのバーチャルヒューマンの動きを見ていて、手の動きが多すぎるのと動きのパターンが結構同じなのが気になりました。
実際にスイッチンでバーチャルお天気アナウンサーを見た人の数少ない感想を見つけたんですが、
手の動きが結構一定と書いてる人がいました。やたらに手を動かす割にはバリエーションが少ないんですね。
ニュージアのデジタルヒューマンは中国でのライブコマースでかなり使われているようで、
ライブコマースで商品を紹介したりするのを前提で考えて作ってあるので、手のアクションが結構大げさなのかもと思いました。
中国人は日本人よりも欧米並みに手のアクションが大盤なのかどうかはわかりません。
商品を紹介するための動きとニュースを読んだりお天気を伝えるときの動きは変えてチューニングするべきなんじゃないかなと思ったりもしています。
デジタルヒューマンの利用可能性
スイッチンでのいいなさんを見たわけではないんですが、ニュージアのデジタルヒューマンの紹介動画で女性のバーチャルヒューマンが天気予報を伝えている動画を見る限り、
日本人的感覚だとちょっと偉そうに見えるというか、欧米の人っぽい動きなのかなと感じたりもしました。
そして先ほど、声は人間で見た目だけデジタルヒューマンというのもあり得るという話をしましたが、その辺の話をちょっとしたいと思います。
デジタルヒューマンを使った接客というのが今注目されているジャンルらしいです。
で、もちろんAIを使って接客する、会話をするというのもいろいろ研究されていますが、やっぱり臨機応変に人間と会話をするのであれば人間の方がいいよねということで、
お客さん側が見る姿はバーチャルヒューマンだけど、VTuberのように中の人がいると、人間が接客する形でのバーチャルヒューマンでの接客というものも今後増えていきそうです。
接客する際に親しみを持ってもらえる温かみがあるように人の表情が見られたらいいんだったら、遠隔でのリモート接客だとしても、Zoomみたいに実際に喋ってる人の姿が映ればいいじゃないかとも考えられますよね。
多分その方がコストも安く済むはずです。それでもコストをかけてデジタルヒューマンでの接客のシステムがいろいろ開発されているというのは、そこにメリットがあるからということですよね。
で、大体こういう接客は女性が多いんですが、自分の姿が出ないということで、化粧とか見た目を気にしなくていいですし、プライバシー的なことの心配もないというところがまず大きいと思います。
見た目があまり良くない、自信がないという人もそうなんですが、見た目がいいという人にも多分人前に出て接客するということへのリスクとかダメリットが多いと思うので、そういうのなしに接客できるというのはありなんだろうなと、これからはそういう時代になっていくのかなと思ったりします。
着ぐるみを着ると人格が変わるみたいな効果と同じで、バーチャルヒューマンとして接客することによって、接客スタッフという役になりきれるというのもあるかもしれないですね。
遠隔地で離れたところから接客の仕事ができるので、フレキシブルな働き方ができるという働き手のメリットもありますし、複数の拠点の接客を一人であったり少数の人間でできたりするので企業側のメリットもありますよね。
あとちょっと話変わりますが、接客されている相手がAIだと、AIによる返答だとわかっていたら、わざと困らせるようなこととか失礼なこととかを言う人がいそうだなと思いました。
AIによる自動運転による車が街を走るようになったら、その性能を確かめるためとかでいたずらをする人がいるはずという話と同じですね。
ただ、もしかして生身の人間の店員にキレるおじさんとかもAI相手だとそんなにキレないのかもしれないですね。その辺、今後どんどん実証実験とかでいろいろわかってくるのかなと思います。
今回は以上です。アシカガコウジがお届けしました。