ライセンスがクリアな音源をもとに作成したRVC(AIボイスチェンジャー)独自モデルの変換比較です 【元音源】 【モデル1】「女性。クール」 【モデル2】「女性。かわいい」 【モデル3】「男性。さわやか」 【モデル4】「女性。お姉さん」 【モデル5】「女性。普通の子」 【モデル6】「女性。ハスキー」 【モデル7】「自分」 【モデル1】Common Voiceの音源(CC-0)をもとにRVCで学習したモデルで変換しています 【モデル2】tatoebaに公開されたyomiさん音源(CC BY-NC 4.0)をもとにRVCで学習したモデルで変換しています( https://qiita.com/yarimoto/items/98711f23f90ea068730b#3-tatoeba ) 【モデル3】以前「松風」という名前で活動していた現「待ち人」氏が松風時代に公開したITAコーパス(CC-BY。 https://twitter.com/mochi_jin_voice/status/1424789247014309888 )をもとにRVCで学習したモデルで変換しています 【モデル4】SpeedSpeech-JA-2022(CC BY-NC 4.0。 https://ast-astrec.nict.go.jp/release/speedspeech_ja_2022/download.html )をもとにRVCで学習したモデルで変換しています 【モデル5】Common Voiceの音源(CC-0)をもとにRVCで学習したモデルで変換しています 【モデル6】Common Voiceの音源(CC-0)をもとにRVCで学習したモデルで変換しています 【モデル7】自分の声を学習したモデルです。自分→自分の変換でも(モデルの音質がいい場合は)音質向上や音量ノーマライズ効果が得られます
●モデル作成手順等 https://zenn.dev/mossan_hoshi/scraps/249c1b5c9d7131 ● 画面付きの動画 https://youtu.be/eF1WPA3-aDE ●【Twitter @mossan_hoshi】 https://twitter.com/mossan_hoshi ●【Zenn @mossan_hoshi】 https://zenn.dev/mossan_hoshi ●【Qiita @mossan_hoshi】 https://qiita.com/mossan_hoshi
ボイスチェンジ