1. SNSニュース@聴くまとめ
  2. #252 不自然極まりない音声配..
2020-04-17 08:45

#252 不自然極まりない音声配信のその理由。効率化のための遠回りが止まらない。

以前から時々試している音声入力と音声録音の変更作業。ふと思うところがあったので今回再びGoogleドキュメントでの音声認識、同時にウィンドウズのボイスレコーダーを使って音声データとテキストデータ両方を取得してみました。

文章のに関してはブログ記事を併せてチェックしてみてください ▶︎ https://koukichi-t.com/archives/28363

---

🔗使用マイク
TASCAM タスカム DR-07X - USB オーディオインターフェース搭載 ステレオ リニアPCMレコーダー
▶︎ https://amzn.to/2VqoRzR
※音質や音声サンプルとして参考にどうぞ

✅今回の録音条件
・TASCAM DR-07X PC接続
・Windows純正?ボイスレコーダーアプリ使用
・m4a/12.8MB/8分38秒
・XYモード(単一指向性モード)/ステレオ
・エフェクト ルーム入力レベル1
・13時録音
・机の上にマイク
・距離30センチくらい
・入力レベル85(MAX90)
・声大きめ
・ウインドウジャマー有り
・低域カット無し

---

✅TASCAM DR-07Xで録音、音質テスト配信済みの各サービス

🔗インスタストーリーとライブでマイクテスト
▶︎ https://twitter.com/igtw_kt/status/1249589747019698176?s=21

🔗REC.
▶︎ タスカムDR-07Xマイクレビューの様なAmazon徘徊@Surfaceバッテリー爆発しそう - REC
https://rec.audio/recs/bqa3qr223akg02hlfs8g

🔗noteアプリでポッドキャスト配信テスト
▶︎ https://note.com/koukichi_t/n/neb54c8de309c

🔗standfmでのTASCAM DR-07X使用配信
インスタ今日の感謝とは?今日の感謝スタンプの意味は?
▶︎ https://stand.fm/episodes/5e9325bf954ca2ccc3f6f7ca

🔗比較用 iPhone 11 Pro録音回
マイク?注文してみた。TASCAM DR-07X
▶︎ https://stand.fm/episodes/5e9122a14f8c03f7ab528d7f

---

🔗RadiotalkでのTASCAM DR-07X使用配信

アマギフ山分けでゲットしたマイクで配信です!TASCAM DR-07X音質レビュー |
▶︎ https://radiotalk.jp/talk/258514

🔗比較用
iPhone 11 Pro録音配信
▶︎ https://radiotalk.jp/talk/256581
iPhone 7 録音配信
▶︎ https://radiotalk.jp/talk/255505

---

📸情報配信用インスタ&IGTV
▶︎ https://www.instagram.com/koukichi_t

🆕 Googleニュースのフォローはこちらから
▶︎ https://news.google.com/publications/CAAqBwgKMPf-kAsw6qmlAw

---

🎙この配信は以下ポッドキャストでも聞けます。
REC. https://rec.audio/@koukichi_t
Anchor https://anchor.fm/koukichi_t
Google http://bit.ly/2P4imRl
Apple https://apple.co/2s4iMhr
Spotify https://spoti.fi/2sc4cEQ

🎙回答専用 standfm
KT@こえのブログ インスタTwitter解説ラジオ
▶︎ https://stand.fm/channels/5e569261122b2506b1ceb9c9

🎙雑談専用 Radiotalk
余談がすぎる。
▶︎ https://radiotalk.jp/talk/249505

——

🎙この番組はKoukichi_Tがインスタグラム/Twitterを中心にSNS/アプリの新機能アップデート最新情報、Tech/ガジェットの最新ニュースを独自の視点で紹介/解説していくポッドキャスト「聴くまとめ」です。

関連リンクは概要欄からチェックしてください。



🔗運営アカウント
Blog
▶︎ https://koukichi-t.com/
YouTube
▶︎ https://www.youtube.com/user/latrell0815
Twitter
▶︎ https://twitter.com/koukichi_t
▶︎ https://twitter.com/IGTW_KT
Instagram
▶︎ https://www.instagram.com/kt.pics
Facebook
‬▶︎ https://www.facebook.com/pg/koukichi.takahashi.photography

---おすすめアプリ・サービス---

🦁 投げ銭でクリエイター支援可能な次世代型高速ブラウザBrave
▶︎ https://brave.com/ja/?ref=kou268

📸写真やイラストを世界販売!

🔗Printful(プリントフル) http://bit.ly/Printful_An01
🔗 Shopify(ショッピファイ) https://bit.ly/2Mnhw0f

00:10
現在TASCAM DR-07X、これをWindowsに接続して、文字入力と録音とこれを同時に作業しています。
はい、ちょっと最初、今、なんか動作両方起動ってできないのかなと思ったけど、そんなことはなくて、
あのー、Googleドキュメントからフォーカスを外して別のアプリに遷移してしまうと、おそらく録音はストップしてしまうんだけど、
そうじゃなければ、ちゃんと両方動いてます、今。はい、で、今、キーボードの音が入っているのに関しては、
これはGoogleドキュメントに関しては、エンターだとか、まあ、キーボードの普通の文字入力、これも並行して使うことができます。
なので、まあ、Googleドキュメント、このGoogle系で、いつも問題に思うのは、
しりと違って、点とか丸とか開業っていうのを言葉で言っても対応してくれない。
なので、今、この音が入っているままキーボードと並行して使うことで、
まあ、開業を加えたりで見やすくして、後ですぐ使いやすくできます。はい、で、もともとこの考えていたところっていうのは、
文字入力、音声認識をしつつ、その音声を録音すれば、録音データとテキストデータと、両方こう、いっぺんに手に入る。
孤立化って意味合いでそこを試してたんだけど、なかなかうまくいかない。
理由としては、交互とテキストとで、当然、文章の感じで変わってくるので、
そこをどういうふうに折り合いをつけるというか、そこら辺が大きな課題でした。
今、こうやって打ちながら試している感じだと、やっぱり多少喋る速度を落とす、やっぱり多少喋る速度を落とす必要があるかなと感じています。
これは文字入力の速度が追いつかないというよりは、
自分で喋るときに余計なマーだとか、
えーととか、こういうのをどちらかというと防ぐのが目的です。
03:00
単純に点を打ったり、丸を入れたり、回余を加えるタイミングっていうのはもちろんあるんだけど、
そういうところを意識しながら今試している最中です。
実際音声として聞く側としては結構聞きづらいのかなぁとも思うんだけど、
例えば今音声入力認識してませんでした、一部分。
そういう場合は2回同じ文章を口に出さなきゃいけない。
そういう場合は同じ文章を2回口に出さなきゃいけない。
この点はポッドキャストとかラジオ配信に関しては当然向いてないので、
結局どちらを優先するかっていう話にはなると思います。
本来はまあどちらかといえば音声の方を優先的にそのまま話して、
その際にできるだけフィラーとかが入らないようにするっていうのがベストだとは思うんだけど、
対して文章の方はどうしても相当やっぱり喋る速度を一定にするだとか、
そういうところは意識しないと難しいんじゃないかなと思います。
もともとそんなに喋る速度が速いわけでもないかもしれないけど、
かといって特にゆっくりというわけでもない。
どっちかっていうと喋る時にはゆっくりの方が苦手な印象があるので、
速い方がなんとなくテンポがつかめるというか。
とは言っても別に滑舌がいいわけではないので、
速く喋れば喋る分、なんか言葉がおかしくなる時はあります。
なのでまずはゆっくり喋るっていう点を意識的にやって、
ポッドキャスト配信とかに関してそのゆっくりの流れがつかめれば、
ポッドキャスト配信に関してゆっくり話すっていう流れがつかめれば、
音声認識で同時に文章を書いていくっていうところもうまくいきそうな気はしてきました。
今このくらいのペースで話をしていると、
一応点を打ったり回余を加えつつでも、
一応点を打ったり回余を加えつつ、
きちんと整理された感じで文章は打たれていってます。
06:07
どうしても音声認識を多少ないとも意識すると、
今みたいな感じで無駄な空白、
音声の余白みたいなものが生まれてしまいます。
この辺りは繰り返すことによっておそらく改善されていくと思うので、
今後ここら辺も試しながらやっていきたいなと。
今後ここら辺も試しながらやっていきたいなと。
今後この辺りも試しながらやっていきたいなと思います。
どっちかっていうと音声側が微妙な感じになっていると思うけど、
文章側に関しては比較的整った状態ですでに書かれてます。
あんまり手直しする必要がなさそうなので、
やり方をもうちょっと工夫。
やり方というよりは喋り方。
やり方というよりは喋り方。
こちらを意識していくことで、
両方のデータを手に入れるにあたってはかなり効率化できそうな気がしてきました。
繰り返しになるけど、
繰り返しになるけど、
やっぱり文字の入力がされないタイミングっていうのがどうしても出てくるので、
その時に同じ言葉を発するっていうのがやっぱり、
その時に同じ言葉を発す。
その時に同じ言葉を2回発する。
そこが問題かなと一番の。
ということで今回は音声認識と録音、
この両方を一緒にWindows上で行うっていうテストでした。
音声側かなり聞き抜く方と思うけど、
この打った文章に関してはブログだとか、ブログにしようかな。
もし概要欄に文字収まるようであれば概要欄にも冒頭だけでも貼るようにはします。
ということで今回はテストという形での配信でした。
よかったら概要欄からリンクなどチェックしてみてください。
さようなら。
08:45

コメント

スクロール