AIを活用したボーカル訓練
にゃおのリテラシーを考えるラジオ、読者と編集の千葉直樹です。
このチャンネルでは、読者とIT時代のリテラシーを中心に好きなものの話をしています。
今回お話しするのは、
AIにAdoのように歌うためのボーカルトレーニングメニューを作ってもらった、というものです。
今日は水曜日なので、IT絡みの技術的な話をしますね。
月曜日と金曜日は、Adoについていきます、と題して歌い手のAdoに関する色々な話をしています。
で、最近2回ぐらいかな?
Adoの歌に関する海外のリアクションの話をしました。
Adoのリアクションを見て、ファンになったボーカルコーチがいて、そのおかげで英語の動画を字幕なしで見るようになったんですね。
すごいでしょ?と言いたいところですが、実際のところは話していることの半分もわかりません。
聞き取れる単語を拾って、多分こんなことを言っているんだろうなぁと想像しているだけです。
まあそれでも飽きずに見ていられるというだけで、すごいことだなぁと思ったりはするのですが、
どんなことを言っているのか、ちゃんと知りたいという気持ちももちろんあるわけです。
実は現時点の自動字幕には弱点があります。
文章ではなく、話していることを逐次翻訳する形なので、前後の文脈がつながっていないことがよくあって、結果的に何を言っているのかわからないということがよくあるんですね。
そこは表情を見ながら想像力を駆使して解釈することになります。
まあ言葉を覚えていく過程は多分そんな感じでしょうから、言語学習という観点では興味深いのですが、
実用性には乏しいと言わざるを得ないところがあるわけです。
これはAI技術の進展で徐々に改善されるでしょうけど、ひとまず今の技術でなんとかならないかなぁなんてことも考えたりはしますよね。
そんなことを考えながら、パソコンのブラウザでGeminiを開いたら、新しいモデルが使えるようになっていました。
最近、バージョンが1.5から2.0に上がったのです。
上がったと言っても、2.0の正式版はFlashだけで、Proなどはまだエクスペリメンタル版です。
実のところ、Flashもろくに使えていないのですが、エクスペリメンタル版には推論をサポートしたモデルがあったので、そっちを試したくなってしまいました。
使いたくなったのは、2.0 Flash Thinking Experimental with Appsというものです。
1.5にはPro with Deep Researchというモデルがあります。
何らかのリサーチを自動でやってくれるモデルで、使ってみたらなかなか面白かったのです。
リサーチしたいことを伝えると、ネット上の様々な情報にアクセスして、数分でレポートをまとめてくれるのです。
すごいでしょ?
どうも2.0では、この機能がThinkingと呼ばれる形になるっぽいので、そこに推論が入ってくるというわけですね。
Deep Researchの時は、ネット上の情報を集めて、それを事実としてロジカルにまとめるという感じでしたが、
今度は多分そこから推測できることをさらに深掘りするみたいなことができるのでしょう。
というわけで、歌うことについて、都素人の僕がADOのように歌えるようになるためのトレーニングメニューを作ってみようと思いました。
参考にしたのは、大好きなADOの歌のリアクションをする大好きなボーカルコーチの動画です。
あ、ここで紹介するのはあくまでもAIが作成したもので、必ずしも参考にするボーカルコーチの意見というわけではないことにご注意ください。
実践的なトレーニングメニュー
最初にやったのは、とあるリアクション動画を否定して、その中でADOの歌唱法の特徴についての研究をまとめてもらうことです。
すると10個のポイントがリストアップされました。
このモデルはエクスペリメンタル版なせいか、一部にロシア語とかベンガル語とか韓国語の単語が混ざったりするのですが、
全部日本語にしてと言うと大体直してくれます。
次にそのリストから、ADOのように歌うためのトレーニングメニューを作って、と言ったら、トレーニング時間が入ったなかなか詳細なメニューが作られました。
もちろん注意点も書かれています。
これを実践するためにはやっぱりコーチが必要だなと思いましたが、
コーチがこれまで話してきたことをドキュメント化して指導に使うのにも良さそうだなと思いました。
歌唱に必要な要素を分解してそれをどんな風に練習するかが書かれていて、なんだか歌えるようになりそうと思いました。
ADOはこんなことをずっとやり続けて今があるんだなーなんてちょっと感動してしまいましたよ。
いや、これAIさんの想像の世界ではあるんですけどね。
こうやってAIを使ってみると、情報に関してはもう自分でちまちま手を動かす時代じゃないのだなと思います。
やるべきことは戦略を立て、欲しい結果を明確化して支持すること。
必要に応じてフィードバックをしてさらに結果を見かけることです。
AIに考えさせるためにより深く考えるみたいな感じ。
そういう意味で人がやることはなくなりませんが、今よりレベルの高い思考を求められるのも確かなようです。
僕は追い先短い身なので本格的に困ることにはならないような気がしますが、
人生道半ばというところまでの方は生き方について真面目に考えなければならないことがあるような気がします。
さて、どうしましょうね。
このラジオはYouTubeでも配信しています。音声では表現しきれないものを映像で補う場合があります。
ぜひチャンネル登録をお願いします。
今回は、AIにアドのように歌うためのボーカルトレーニングメニューを作ってもらったという話をしました。
今日はここまで。
読書と編集ではITを特別なものではなく、常識的なリテラシーとして広める活動をしています。
ストア化でITリテラシーの基礎を学べるオンライン講座をやっています。
詳しい内容については概要欄のリンクから見に行くことができます。
コメントはYouTubeで、文字で読みたい方はノートをどうぞ。
どちらも概要欄にリンクがありますので、フォローいただけると嬉しいです。
今日もワクワクする日でありますように。
千葉直樹でした。ではまた。