合成音声向けにITAコーパスなどを読み上げる時の加工などについて、Twitterでとても参考になるやり取りをされていたので、まとめさせていただきました。
音声合成用コーパス読み上げの母音子音の音量差について
MYCOEIROINK、TALQu、CoeFontなど、音声合成モデル作成のためにコーパス文を読み上げ録音する時の音声波形や加工についてのお話。
ひとつの文章の中で音量の凹凸が激しい場合はどうすれば良いのか、どんな加工をすれば良いのかなど、非常に参考になるアドバイスが多かったので、観測できた部分を掲載しました。
これからMYCOEIROINKやCoeFontやTALQuの収録をしてみよう、という方の参考になるかと思います。
あみたろは音声の加工については詳しくなく、出力する声そのものを安定させる方向で乗り切ってきたので、とても勉強になりました。
Twitterでは音声合成モデルを作って遊ぶ人たちの中に身を置いているのですが、知識や実験結果をシェアしあってみんなでおもしろいものを作っていこうという空気がとても心地よくて楽しいです。
MYCOEIROINKやCoeFontやTALQuなどの個人製作音声モデルの世界、今すごく熱いですよ…!
他にも、Twitterで拝見した有益な音声合成関係のツイートをいくつかまとめさせていただいています。
あみたろがまとめた記事の一覧はこちら。
Twitterの過去ログ&まとめ記事
あみたろの声素材工房のTwitterアカウントと、あみたろがまとめた記事についてご紹介します! あみたろの声素材工房では、主に2つのTwitterアカウントを運用しています…
コメント