デジタル音声広告を音声業界のニュースをまとめるよ
【AD】
Audiostartでは、ポッドキャストに音声広告を掲載したい広告主を募集中です。詳細は以下のリンク先をご覧ください。
https://bit.ly/41jPwyu
【AD】
Audiostartでは、音声広告を掲載して広告報酬を受け取りたいポッドキャスターの方を募集しています。法人・個人問いません。詳細は以下のリンク先をご覧ください。
https://bit.ly/3GSVv5P
https://listen.style/p/audiostartnews?mSIM7ycj
番組の魅力・推薦
#32 「第一回AIアートグランプリ」で、亡くなった妻の声をAI音声合成で歌わせる松尾Pさんの動画作品が優勝
AIを活用したアート作品を対象とする「第一回AIアートグランプリ」の結果が発表されました。今回はこのニュースを紹介します。このコンテストの審査基準は、「人間らしい表現のための手段としてAIを正しく活用していること」「独創性のある表現が行われていること」「他者の権利を直接的に侵害していないもの」「日本国内法を遵守していること」とあります。生成系AIのあるべき姿を想定して、審査が行われていることがわかりますね。279の応募作品から見事優勝したのは、10年近く前に亡くなった妻の声をAI音声合成で歌わせる松尾公也(松尾P)さんの動画作品でした。歌声だけでなく、動画の映像も妻の写真をベースにAIが生成したものを利用しています。妻の歌声とそこから生成したUTAU-Synthの歌声、そして本人のおしゃべりを合計1時間分、機械学習ベースの声質変換ソフトウェア「Diff-SVC」(Diffusion model Singing Voice Conversion)に学習させて生成した歌声を使っているとのこと。「Diff-SVC」は、元になる音声データが1時間くらいあれば与えた音声を希望する声質に変換することが可能になるそうです。AIをここまで活用するモチベーションは愛(AI)だったそうです(^ ^)ともかく、松尾さん、優勝おめでとうございます!ではまた。
#31 YouTube Musicでポッドキャスト配信、RSSインテグレーションも予告!
YouTubeのCEO、ニール・モーハンが自社ブログでYouTubeの2023年の注力することを発表しました。その中にポッドキャストについて触れられている部分があるので簡単に紹介しておきます。注目点は以下の通りです。YouTube Studioの新機能によりポッドキャストをより簡単に公開できるようになるとのこと。ずっと噂されていたとおりの内容であるんですが、公式に発表されたのは朗報ですね。また音声中心のポッドキャストと動画中心のポッドキャストの両方を YouTube Musicで配信開始するとのこと。YouTube Musicリスナーにポッドキャストを届けられるというのはありがたいです。いつもの通り米国からということですが、日本でも順次展開されることでしょう。年内には RSS インテグレーションが予定されているとのこと。これは既存のポッドキャスターにとって、とてもありがたいことですね。もちろん、Audiostartのアドネットワークに参加いただいたポッドキャストについても、YouTubeへの自動配信については対応していきたいと思っています。また動きがあり次第お伝えしていきます!ではまた!
#30 音声版「Audiostart News」開始!音声業界ニュースを音声で聴こう!
こちら「Audiostart News」は音声業界のニュースをお届けするメディアです。ポッドキャストに興味のある方は多いと思いますので、いまさらながらポッドキャストでも聴けるようにしました。今回は当社が得意とする音声合成エンジンを活用した読み上げを使って番組を作ることにしました。その理由は、ほぼ毎日複数記事を更新していますので記事アップの都度録音するのは難しく、そしてなにより筆者がしゃべるのが下手だから・・・(^ ^:)そして、音声合成を使えば語り手不要で、気軽に音声コンテンツが作れるという当社サービスのデモンストレーションの意味もあります。ということで「Audiostart News音声版」、以下のお好きなポッドキャスト・プラットフォームでお楽しみください。■Apple Podcast■Google Podcasts■Amazon Music■Spotify改めてこの音声番組の作り方については紹介したいと思います。興味のある方はお楽しみに。ではまた!
#29 rinnaがテキスト入力でCGアバターが話す動画作成ソリューションを提供開始
rinnaがテキストの入力でリアルな人物のCGアバターが話して動くバーチャルヒューマン動画作成ソリューションの提供開始を発表しました。AI音声合成技術とモーション生成技術を応用して、テキストの入力をするだけで事前に収録した人物の3Dアバターが自然に動きながら話す動画を作成できるというものです。まずモデルとなる人物を専用のスタジオで撮影し、声を録音して記録することでキャラクターデータとし、取得したデータをもとに、感情に則った自然なイントネーションによる発話と、発話時の動作、表情の変化をリアルタイムに表現するバーチャルヒューマンを作成します。一度作成したバーチャルヒューマンは、テキストデータを渡すだけで、身振り・手振りを伴った動画を簡単に作成することが可能になるそうです。多言語にも対応しています。実際にデモを見てみると音声合成もなめらかで、動きもかなりリアルですね。ちょっと怖いぐらいです。ではまた。
#28 Chartableのポッドキャスト人気ランキングを使ってみよう
今回はポッドキャスト分析プラットフォームの「Chartable」を紹介します。ポッドキャスター向けにポッドキャストのオーディエンスを把握したり、ランキングを確認したりするサービスです。今回は登録なし・無料で使えるポッドキャストランキング機能にフォーカスして使い方を見ていきたいと思います。■Chartable Top 200毎週水曜日更新で、視聴者数の計測を行い、独自のフィード統合を利用した5,000のポッドキャストの視聴者数の週間変化に基づいて作成された、20カ国のトップ200とトレンドチャートです。世界ではどんなポッドキャストが人気なのかを把握することができます。■Apple Podcasts Charts / Japan Podcast Charts国内Apple Podcastのポッドキャスト番組・エピソードをジャンル別にランキングできるチャートです。細かい分析をしたい場合はこちらを入口に研究すると良いです。■Apple Podcasts — Japan — All PodcastsApple Podcastの人気ポッドキャストランキングです。ここだけ見ていれば、国内ポッドキャストの人気がだいたい把握できるのでおすすめページです。■Spotify — Japan — Top PodcastsSpotifyの人気ポッドキャストランキングです。「叶姉妹のファビュラスワールド」などSpotify独占配信番組も増えてきていることからこちらも念の為チェックするともれなく把握できるようになります。こんな感じで人気や自分の興味をもったポッドキャストを発見するツールとして活用していきたいですね。ちなみに、2022年2月16日にChartableは、ポッドキャスト広告測定サービスのPodsightsとともにSpotifyに買収されています。Spotifyさん、すごいです。ではまた〜!
#27 Googleが100以上の言語に対応する音声認識AI「Universal Speech Model (USM)」を発表
Googleが100以上の言語に対応する音声認識AI「Universal Speech Model (USM)」を発表しました。昨年11月にGoogleは世界中の言語をサポートするための「1000 Languages Initiative」を発表しており、今回はその第一歩として自動音声認識 (ASR)サービス「Universal Speech Model (USM) 」についての成果を公開したものになります。Googleが取得した300以上の言語にわたる1,200万時間の音声と 280億文のテキストでトレーニングされた20億のパラメーターを持つ最先端の音声モデルとなっており、英語や中国語と違って、トレーニングデータが不足しがちな話者の少ない言語でも、微調整を伴う自己教師あり自動学習を使うことで音声認識 (ASR) を効率よく構築できるというもの。「Universal Speech Model (USM) 」を使ってYouTubeのキャプションを生成した結果、73の言語で平均30%未満の単語エラー率を達成できたことも発表されました。最近リリースされたOpen AIの音声認識モデル「Whisper (large-v2)」と比較してもエラー率が低かったそうです。この領域の進化は目覚ましいものがありますね。これからの展開も楽しみです。ではまた!
#25 ソフツーがAI電話自動応答サービス「ミライAI」を「ChatGPT」と連携
株式会社ソフツーがAI電話自動応答・取り次ぎサービス「ミライAI」をOpenAIの「ChatGPT」と連携させ、声でChatGPTと会話できる「ミライAI電話GPT 無料体験窓口」を提供すると発表しました。実際に体験するのは簡単で、電話番号「050-5369-1110」に電話して質問をするとAIが回答をしてくれるとのこと。通話料はかかりますが、利用にあたって特別なアプリや設定は必要がないというのはありがたいですね。またすでに多言語にも対応しており、現在日本語、英語、中国語での対話が可能とのこと。デモ動画でChatGPTとしりとりする様子が公開されています。こういうサービス、増えそうですね〜。ではまた!
#26 CoeFontのAI音声がPictoriaのVtuber「紡ネン」の会話音声に採用される
CoeFontのAI音声が、VTuberを運営するPictoriaの配信システムの会話用音声として採用されたことが発表されました。具体的にはVtuber「紡ネン」の会話音声にて、CoeFontのAI音声が採用されたとのこと。「CoeFont」は「欲しい声が1秒で手に入る。」をコンセプトに、AI音声を表現力豊かな「フォント」に変換することで、だれもが安価で簡単に利用できる音声サービスです。5,000種類以上のAI音声を、利用したいときに必要な分だけすぐに利用できること、今までは50万円・10時間以上の収録を必要としていた音声を、500円・15分の低価格・短時間で作成できることが魅力です。ではまた!
#23 Sonosが次世代のスマートスピーカー 「Era 300」「Era100」を発表!
米国発オーディオブランドSonosが、新世代のスマートスピーカー「Sonos Era 300」と「Sonos Era 100」を発表しました。今回はこの新製品をチェックしてみます。Era 300もEra 100どちらもスマートスピーカーとして、スピーカー本体のタッチ操作、Sonos Appによる操作、その他スマホアプリからの操作(SpotifyやPandoraなど)、Amazon Alexaによる音声操作、Apple AirPlay 2による操作などコントロールする方法がたくさん用意されています。以下機種ごとの違いを見ていきましょう。Sonos Era 300は左、中央、右、そしてハイトチャンネル専用の6つのスピーカーを搭載したモデルです。音質もアーティストが精緻なチューニングを施しているとのこと。Dolby Atmos対応で空間オーディオを楽しみたい人、ホームシアターのリアスピーカーとして利用してサラウンドサウンドを楽しみたい人におすすめのモデルかと思います。価格は69,800円で、スマートスピーカー全体でみてもハイエンドモデルとなります。続いてSonos Era 100は、Sonos Oneの後継のスタンダードモデルです。2つのツイーター、大型化されたミッドウーファーが内蔵されています。Sonos Oneも高音質でしたが、それを上回るスペックを持ちつつ、価格は39,800円ということで個人的にはこれで十分ではないかと思います。久々に国内に新型スマートスピーカーが導入されて嬉しいです。ではまた!
#22 株式会社SEVEN「Audiostartポッドキャスト広告デビューキャンペーン」実施中〜
音声コンテンツ・ラジオCM・オーディオアドを得意とする株式会社SEVENさんが当社の音声広告ネットワークAudiostartのキャンペーンを実施中なので紹介させていただきます!Audiostartでは現在230のポッドキャストへの広告配信が可能となっており、雑誌のようにコンテンツを軸としたターゲットセグメンテーションが明確であることが特徴になっています。ポッドキャスト広告 CM制作費無料キャンペーンについて・媒体費200,000円(税別/以下同様)以上のポッドキャスト広告お取り扱いを当社にご依頼いただきましたら、TTS(人工音声合成)CMの基本制作費と原稿制作費を1本無料といたします。・本企画を適用するポッドキャスト広告は、Audiostartに限定させていただきます。・無料となるCM基本制作費には「40秒までのナレーション音声制作」と「CM原稿制作」「BGM/効果音を加えた完パケ素材制作」が含まれます。・媒体費40万円以上の場合は、弊社標準CMの基本制作費と原稿制作費を1本無料といたします。標準CMは、ナレーター1名の出演料、弊社ナレーションブースでの収録も含まれます。申込みは2023年4月末日まで。興味のある方は株式会社SEVENさんにお問い合わせください。ではまた!
#21 Amazonの「Alexa」は今後どうなるのか? ChatGPT搭載Amazon Echoの登場に期待!
英Financial Timesにて、アマゾンとAlexa搭載Amazon Echoについて、興味深い記事が掲載されました。有料会員限定記事ですので興味深かった部分をいくつかピックアップします。全文見たい方は会員登録してみてください。・Alexaの構想から10年余経過し、米国での普及率は66%でトップ。・AlexaはAmazon全体の収益でみれば貢献は少なく、開発チームが縮小された。・Alexaの利用時間は世界全体で2022年に30%以上増加。・Alexaを持っている人の半数以上が少なくとも1日に1回利用し、他社より高い利用率。これがAlexaの現状だといいます。利用者は増えているものの、使い勝手についての満足度が高い状況ではないということも指摘されています。これは国内の利用者も似たような印象を持っているのではないかと思います。そこで今後の展開として、流行中の生成系AIを活用することでAlexaのレベルを大幅に向上させることができるのではないか、とAlexa開発チームのメンバー内で話題になっており、重役からブレインストーミングを行うよう指示されているそうです。この方向は僕も大賛成です。もしChatGPT搭載のAlexaがあれば天気、音楽、ニュースを聞くという基本的な使い方以外の領域、例えば質問や雑談などで大きく体験が改善することは間違いないですよね。ということで、また続報あればお伝えしていきます。ではまた!
#20 Whizzo Productionが音声アドネットワーク「Audiostart」音声広告の取り扱い開始!
Web制作のウィゾ・プロダクションさんが当社の音声アドネットワーク「Audiostart」への広告出稿の取り扱いを開始しました。デジタル音声広告出稿にご興味がある方は、お気軽にウィゾ・プロダクションさんへお問い合わせください。また、2023年3月〜4月に音声広告をお申し込みいただいた方へ、AIが読み上げる自動音声CMを無料で提供するキャンペーンも実施中です。この機会に是非、ご検討いただければと思います。また、音声広告アドネットワークに参加したいポッドキャスト配信者の方も絶賛募集中です。ではよろしくおねがいします!
#19 音声合成のエーアイがChatGPTとオルツLHTM-2を活用した実証実験開始
音声合成のエーアイがAI開発のオルツと共同で、OpenAIの「ChatGPT」やオルツの大規模言語処理モデル「LHTM-2」を活用した法人向けのAIサービスを構築すると発表しました。音声合成と生成系AI(ジェネレーティブAI)との組み合わせは今後の音声領域の注目分野になっていくことが予想されますが、まさに今回の発表もこの流れに沿ったものになっています。音声認識が耳、音声合成が口、そして生成系AIが脳として、それぞれが発展していくことで新しい音声技術の未来へ大きく前進することができると思います。楽しみですね〜。ではまた。
#18 ラジオトークがライブ配信の経験者と初心者をつなぐ「Radiotalk道場」を発表
Radiotalkさんが配信の経験者である「師匠」と配信の「初心者さん」をつなぐ「Radiotalk道場」を発表しました。2023年3月6日(月)〜3月13日(月)の期間中、「初心者さん」の第1期生12名を募集しています。「Radiotalk道場」プロジェクト内容・週1回程度、オンラインで「師匠」と面談できます。・随時、「師匠」に質問や相談できます。 (例えば、合意があれば「師匠」の番組へのゲスト出演も可能)・サポート期間終了後の慰安会では同期や他の師匠と繋がったり、クローズドでの相談ができます。(オンライン参加可。オフラインでご来場の方には、その後会場でご歓談できます)音声ライブ配信をはじめてみたものの思ったよりリスナーが増えないなどの課題を解決したい人にぴったりな実践的な企画だと思います。興味のある方は、応募条件や審査基準を確認の上、応募してみてください。ではまた。
#17 米国でAI音声合成を使った振り込め詐欺が増加中
孫にそっくりな声のAI音声合成を使って祖父に電話し、刑務所から出るために急ぎで保釈金が必要だと伝えてお金を騙し取るといった新しいタイプのオレオレ詐欺が米国で多発しているそうです。声がそっくりなことでより説得力を増して、騙されやすくなるといいます。日本の特殊詐欺・振り込め詐欺よりもさらに高度で悪質です。米国連邦取引委員会(FTC)の報告によれば2022年に5,100件以上の電話を使った詐欺が発生し、その被害総額は1,100万ドル以上(およそ15億円)だったとのこと。恐ろしいことに、特定の人物の声を音声合成するためにはYouTube、ポッドキャスト、コマーシャル、TikTok、Instagram、Facebook の動画などから取った30秒間程度の音声サンプルがあれば十分とのことで、しかもローコストで作れてしまう状況にあります。技術の進歩によりスピーディーに高品質な音声合成ができるようになった反面、こんな形で技術が利用されてしまうのは非常に残念なことです。日本では同様のAI音声合成を使った特殊詐欺事件の報道はまだ見かけませんが、今後増えてきても不思議はないと思います。みなさんも電話の声だけでお金を騙し取られないように十分注意していきましょう。ではまた。
#16 エーアイの音声合成「AI Talk 5」に新規女性話者「つばさ」登場
エーアイさんが音声合成エンジン「AITalk 5」向けに女性話者「つばさ」を新たに提供することを発表しました。AI Talkは、もともと用意されていた「コーパスベース音声合成方式」と、最新の深層学習技術を活用した「DNN音声合成方式」の2種類のタイプが選択可能です。今回新たに追加された「つばさ」はコーパスベース音声合成方式に対応したものとなっています。AI Talkについては、僕らはPepperなどのロボットアプリ開発時代から、WEBメディアのポッドキャスト化のお手伝いをするなど音声合成サービスのスタンダードとして幅広く使わせてもらっています。今後も素敵な話者がどんどん増えることを期待しています。どれもそれぞれ魅力的で声を選ぶのは迷っちゃうんですけどね。ではまた〜。
#15 NOBORDERが「AIアナウンサー GPT」を発表
株式会社NOBORDERのAIメディアプロジェクトが「AIアナウンサー GPT」を発表しました。2014年より同社が運用している「AIアナウンサー」の改良版で、Open AIの生成系AIのChat GPTと音声認識AIのWhisperとAPIで連携し、AIで生成したテキストを音声合成で読み上げるもののようです。まだ詳細は発表されておらず、不明点も多いのですが、今後ChatGPTを組み合わせるサービスが増えることは間違いなく、メディアのDXにおける一つの方向性として注目です。2023年3月中にβ版の無料サービスを開始するとのことで、また使ってみた感想をお伝えできればと思います。ではまた。
#14 アニメ声の音声合成「VOICEPEAK 邪神ちゃん」発売決定!
AHSの音声合成ソフト「VOICEPEAK」の新しい声として「邪神ちゃん」が追加され2023年3月30日に発売されます。VOICEPEAKは、Windows、macOS、LinuxOS向けに提供されているダウンロードして使う入力文字読み上げソフトです。高品質な音声合成、シンプルな使い勝手、そして特にお手頃感のある買い切り価格が魅力です。邪神ちゃんではありませんが、汎用的に使える「商用可能な6ナレーターセット」は音声業界で利用されている方は多いのではないかと思います。今回発売となる「VOICEPEAK 邪神ちゃん」は、人気アニメ「邪神ちゃんドロップキック」のCVを務める声優・鈴木愛奈の声を元に製作したもの。もちろん感情表現も指定可能で「幸せ」「怒り」「悲しみ」「楽しみ」「激おこ」の5種類が選択可能になっています。すでに「VOICEPEAK 邪神ちゃん 無料お試し版」が配布開始していますので気になる方は試用をどうぞ。個人的にはVOICEPEAKユーザーでもあり、声のバリエーションが増えてくるのは仕事の幅が広がって嬉しいニュースです。ではまた。
#13 フェアリーデバイセズの音声AI技術「mimi」サービスサイトがリニューアル
フェアリーデバイセズが2023年3月3日にビジネス向け音声AIテクノロジー「mimi」のサービスサイトを全面リニューアルし、音声AIテクノロジーのビジネスへの応用に必要な全体の知見を一般に公開しました。今回はそんな「mimi」の概要を紹介をしていきます。「mimi」は音声ソリューションを開発するために必要となる「クラウドAI」「エッジAI」「デバイス」の3つを網羅した製品群。できることが多岐にわたっているため、今回サイトをリニューアルすることでわかりやすく伝えるようにしたというもの。一般的に、音声認識だけに特化、音声合成だけに特化するといった専門サービスが提供されることが多いと思いますが、mimiの製品群は機能別に細かく細分化されており、かつ幅が広いサービスをカバーしている点が他社との大きな違いになっています。エッジ側でノイズキャンセリング、バージインなどのフロントエンド処理を行いつつ、ウェイクワード認識を行い、その後クラウド側で言語識別、話者認識、態度認識、感情認識、そして音声認識。さらには機械翻訳から出口となる音声合成までカバーしています。まさに音声AI応用製品に必要なほぼ全てのテクノロジーが提供されていることがわかります。mimiのソリューションを使って、流行りのChatGPTの会話エンジンを組み込めば・・・すぐさま面白い音声サービスが提供できそうな予感がします。それはともかく、AI音声サービス開発者の方は一度mimiの新しいサイトをチェックする価値、あると思いますよ。ではまた。
こちらもおすすめ
音声広告実験隊
「音声広告実験隊」は、音声広告に関わる様々な実験・検証を行い、音声広告の現在・未来について考えていく番組になります。 聞き流しているだけでデジタル音声広告の現状や活用可能性をなんとなく把握できる、そんな番組を目指しています。毎週月曜更新。 デジタル音声広告に関わるご質問やご依頼、番組へのご意見・ご感想についてお気軽にご連絡ください。 HP:https://audiostart.jp/contact Mail:info@robotstart.co.jp https://listen.style/p/audioadexperimentalteam?vtH4nUX2
ロボット情報WEBマガジン「ロボスタ」
ロボット情報WEBマガジン「ロボスタ」より最新のロボットニュースをお届けします。 【AD】 Audiostartでは、ポッドキャストに音声広告を掲載したい広告主を募集中です。詳細は以下のリンク先をご覧ください。 https://bit.ly/41jPwyu 【AD】 Audiostartでは、音声広告を掲載して広告報酬を受け取りたいポッドキャスターの方を募集しています。法人・個人問いません。詳細は以下のリンク先をご覧ください。 https://bit.ly/3GSVv5P https://listen.style/p/robosta?OaThzt5o
今出川FM
「今出川FM」は株式会社Helpfeelの今をお届けするPodcastです。アプリケーション開発や普段の暮らし、他業種間のコラボレーションや社内文化などに関する話題を中心に株式会社Helpfeelのメンバーがゆるくお話します。 ご意見ご要望などはTwitterのハッシュタグ #今出川FM でお寄せ頂ければと思います。また、株式会社Helpfeelではメンバーを積極採用中です。よろしくおねがいします。 https://corp.helpfeel.com/ja/recruit 書き起こしなどはこちらから: https://listen.style/p/imadegawafm?H9lMZivo
Over Realism Radio
「生きながら、好きなことをやっていく」ために考える会です。 ▼ここで喋る人たち にくきゅう(https://twitter.com/nikuniku9) 影織(https://twitter.com/kageori_ar) にっとメガネ(https://twitter.com/nitmegane) ▼お便り・質問フォーム https://over-realism-club.blogspot.com/p/contact.html
mento.fm(メントエフエム)
mento.fmは株式会社mentoのメンバーを中心に、プロダクトやビジネスのお話、リアルなスタートアップの実情や日々のイシューについて話していく番組です。 mentoの日常や、仕事内容、メンバーの雰囲気など、リアルな声を通じて知ってもらえるよう、カジュアルな雰囲気でお話していきます。パーソナル・コーチングサービスmento(メント):https://mento.jp/mento採用ページ:https://recruit.mento.co.jp/
耳ヨリな音の話-音マーケティング情報-
様々なゲストと共に、音を使ったマーケティング情報を発信していきます。リスナーとのエンゲージメントを高め、ブランドの理解や共感をつくりやすい「音を使ったマーケティング」について、楽しくそしてわかりやすく、皆様にお届けします。<Twitterハッシュタグ>#ミミヨリ<音マーケティング (note)>https://note.com/d2cradmimi/