テレビ北海道の情報番組に「AIデジタルヒューマン・アナウンサー」が登場するということで、開発元による動画を見た感想などを話しました。
=== 目次 ===
テレビ北海道の情報番組にAIデジタルヒューマン
音声合成でしゃべるのか声は生身の人間なのか
開発元による動画を見てみた
手の動きが多すぎるのが気になった
デジタルヒューマンでの接客について
AI相手だと態度が変わる人もいそう
-------
#アシカガCAST
デジタル活用のヒントをスキマ時間で。
話題のサービス、注目のソフトウェアの紹介、デジタルツールの活用術など、テック系情報をわかりやすくお届けします。
月〜水 朝8時に更新
■Twitterアカウント
https://twitter.com/ashikagacast
Apple Podcast、Spotify、Google Podcastなどでも配信しています。
■アシカガCASTの聴き方
http://typebot.io/ashikagacast
■アシカガノオト
https://ashikaga.substack.com/
00:01
テレビ北海道の情報番組、スイッチンにAIデジタルヒューマンアナウンサーが登場するということをニュース記事で知りました。
バーチャルヒューマンは、簡単に言うと、人間に似ているリアルな見た目のCGで作られているアバターですね。
お天気キャスターとして、11月18日土曜日の番組に出演したらしいです。
スイッチンは午前11時からの30分番組です。
AIバーチャルヒューマンのアナウンサーが起用されるのは、地上波テレビでは初めてということらしいです。
このニュースを知って最初に思ったのが、このバーチャルヒューマンのアナウンサーは音声合成でテキストから喋るのか、声は生身の人間なのか、どっちなんだろうということです。
AIバーチャルヒューマンアナウンサーと言ってるくらいなので、音声も当然音声合成でテキスト原稿を元に喋るんだろうなと考える人が多いと思うんですが、
もしかしたら声は実際の生身の人間のアナウンサーというやり方もあるなと思ったんですね。
別にズルとかインチキとかいうわけではなくて、見た目だけがデジタルヒューマンで、声は生身の人間でもVTuberと同じで、メリットとかやる意義は十分あるはずです。
ニュース記事ではその辺の説明は見つけられなかったんですが、このデジタルヒューマンの開発元のニュージアという会社から、この件についてのニュースリリースが出ていました。
そのニュースリリースの中に、人間のアナウンサーが持つ温かみと親しみやすさを兼ね備えつつ、AIが提供する性格無比な情報伝達能力を生かし、番組をさらに魅力的なものに変貌させることでしょうと書いてあったんですね。
このAIが提供する性格無比な情報伝達能力というところから、生身の人間じゃなくてテキストをもとに音声合成でしゃべるんだろうなと判断しました。
実際のスイッチンに登場したお天気キャスターの動画はまだ見られていないんですが、開発元のニュージアがデジタルヒューマンを紹介するために用意している動画を見ることができました。
03:12
それを見ると、やっぱり音声読み上げでしゃべっていますね。
そして、まさにデジタルヒューマンが天気予報を読み上げている動画もありました。
そのバーチャルヒューマンの見た目の人物としては、今回スイッチンに採用されたイーナという名前がついてるらしいんですが、そのイーナさんとは見た目は違ったんですが、
たぶん、CGの出来であったり、しゃべりであったりのクオリティは、私が見たそのデモ動画と同等なのではないかと思います。
それを見た感じ、音声にしても、CGによる人物にしても、そんなに違和感は感じませんでした。
普通にすんなり受け入れられるレベルだなと感じました。
もちろん、実際の人間がしゃべっているのと見間違えるような感じではないんですが、
CGで作られたキャラクターが音声合成でしゃべってるんだなということは感じるけど、聞き取りづらいとか、CGの人物の動きが不自然で気持ち悪いとか、そういう感じはなかったです。
不気味の壁という言葉があって、ロボットとかCGをリアルな人間にすごく近づけていくと、
リアルになればなるほど、逆に実際の人間との違いが気になっちゃうのか、
気持ち悪い、不気味の壁というぐらいなんで、不気味に感じてしまう、嫌な感情を抱かせてしまうそこの壁、そこを越えたら受け入れられるという不気味の壁という言葉が有名なんですが、
このニュージアのバーチャルヒューマンを見る限りでは、不気味の壁はあまり気にならないと思いました。
不気味の壁を越えているんだと思います。
ただ、その動画でのバーチャルヒューマンの動きを見ていて、手の動きが多すぎるのと動きのパターンが結構同じなのが気になりました。
実際にスイッチンでバーチャルお天気アナウンサーを見た人の数少ない感想を見つけたんですが、手の動きが結構一定と書いてる人がいました。
やたらに手を動かす割にはバリエーションが少ないんですね。
ニュージアのデジタルヒューマンは中国でのライブコマースでかなり使われているようで、
06:06
ライブコマースで商品を紹介したりするのを前提で考えて作ってあるので、手のアクションが結構大げさなのかもと思いました。
中国人は日本人よりも欧米並みに手のアクションが大判なのかどうかはわかりません。
商品を紹介するための動きとニュースを読んだりお天気を伝えるときの動きは変えてチューニングするべきなんじゃないかなと思ったりもしています。
スイッチンでのいいなさんを見たわけではないんですが、
ニュージアのデジタルヒューマンの紹介動画で女性のバーチャルヒューマンが天気予報を伝えている動画を見る限り、
日本人的感覚だとちょっと偉そうに見えるというか、
欧米の人っぽい動きなのかなと感じたりもしました。
そして先ほど、声は人間で見た目だけデジタルヒューマンというのもあり得るという話をしましたが、
その辺の話をちょっとしたいと思います。
デジタルヒューマンを使った接客というのが今注目されているジャンルらしいです。
で、もちろんAIを使って接客する、会話をするというのもいろいろ研究されていますが、
やっぱり臨機応変に人間と会話をするのであれば、人間の方がいいよねということで、
お客さん側が見る姿はバーチャルヒューマンだけど、
VTuberのように仲の人がいると。
人間が接客する形でのバーチャルヒューマンでの接客というものも今後増えていきそうです。
接客する際に親しみを持ってもらえる温かみがあるように人の表情が見られたらいいんだったら、
遠隔でのリモート接客だとしても、Zoomみたいに実際に喋ってる人の姿が映ればいいじゃないかとも考えられますよね。
多分その方がコストも安く済むはずです。
それでもコストをかけてデジタルヒューマンでの接客のシステムがいろいろ開発されているというのは、
そこにメリットがあるからということですよね。
で、だいたいこういう接客は女性が多いんですが、
自分の姿が出ないということで化粧とか見た目を気にしなくていいですし、
09:07
プライバシー的なことの心配もないというところがまず大きいと思います。
見た目があまり良くない、自信がないという人もそうなんですが、
見た目がいいという人にも多分人前に出て接客するということへのリスクとかダメリットが多いと思うので、
そういうのなしに接客できるというのはありなんだろうなと、
これからはそういう時代になっていくのかなと思ったりします。
着ぐるみを着ると人格が変わるみたいな効果と同じで、
バーチャルヒューマンとして接客することによって、
接客スタッフという役になりきれるというのもあるかもしれないですね。
遠隔地で離れたところから接客の仕事ができるので、
フレキシブルな働き方ができるという働き手のメリットもありますし、
複数の拠点の接客を一人であったり少数の人間でできたりするので、
企業側のメリットもありますよね。
あとちょっと話変わりますが、
接客されている相手がAIだと、AIによる返答だと分かっていたら、
わざと困らせるようなこととか失礼なこととかを言う人がいそうだなと思いました。
AIによる自動運転による車が街を走るようになったら、
その性能を確かめるためとかでいたずらをする人がいるはずという話と同じですね。
ただ、もしかして生身の人間の店員にキレるおじさんとかも、
AI相手だとそんなにキレないのかもしれないですね。
その辺、今後どんどん実証実験とかで色々わかってくるのかなと思います。
今回は以上です。アシカガコウジがお届けしました。
11:25
コメント
スクロール