ITAコーパス読み上げ音声のダウンロード
先日お知らせしたITAコーパス読み上げ音声、完成しました!! こちらからダウンロードしていただけます。
誤読があったため 2022/02/07 にファイルを差し替えています。
これ以前にダウンロードされた方は、お手数ですが再ダウンロードをお願いします。
ITAコーパスとは
ITAコーパスは、使用料0円、パブリックドメインの文章集。日本語のいろんな音がバランスよく含まれているので、これを読み上げた音声があれば日本語音声合成ソフトの作成にも使える、という特殊な台本のようなものです。
以前から音声合成関係の研究を全力で応援しているあみたろの声素材工房としては、何としても挑戦したいところ。
ということで、ITAコーパスの全424文を読み上げた音声を公開しました!
ITAコーパス読み上げ音声の製作過程
ITAコーパスは、全424文の日本語群。
424文、というとCoeFontCLOUDハイエンド版の700文よりも少ないのですが、とにかく時間がかかりました…!
声の調子や滑舌や話速や抑揚を意識して録って録って録りまくって、ver1.0の完成までにできたファイルの数は3211個。
この3211個のwavファイルのリップノイズを除去してから、たくさんのテイクの中からベストなテイクを選んだり、時には破裂音のつなぎ目などで音声と音声をがっちゃんこしたり…と、休日をたくさん費やしてようやく完成したのが、今回公開している圧縮ファイルです。
録音も何日もかかったけど、それ以上に編集が大変でした…。TALQuコンテスト優勝特典の大量録音の練習のつもりでやってみたけど、このやり方では3か月いっぱいいっぱい使っても全然数が稼げないことがわかったので、本番はもう少しさらっとやろうと思います。
ITAコーパス読み上げ音声 全424文の試聴動画
ダウンロード前に声質などをご確認いただけるよう、全424文の読み上げ音声を動画にしました。
こちらの動画をご覧いただければ、ITAコーパスがどんなものかわかると思います。
ジャデャクシュ! ブレンドデョート! イデュスルファーゼ!
あみたろITAコーパス読み上げ音声は こんなことに使えます
あみたろの声素材工房のITAコーパス読み上げ音声は、音声合成用の素材としてのご利用はもちろん、セリフ素材としてのご利用もOKです。不思議な文章ばっかりだけど、うまく繋げるとラジオやテレビの背景音みたいになるかも。セリフ素材の規約に沿って、うまく使ってください!
いつも通り年齢制限ものとかはNGだけど、真面目な研究用途ならほとんど制限なしです。音声合成ソフトを作って販売するのもOKです。クレジットは必須です。詳しくは規約をご覧ください。
また、読み間違いも咳払いもリップノイズも何もかもそのままの、完全未編集のwavファイル(全3211ファイル/1.18GB)も保存しています。必要な方はご連絡ください。(お渡しは音声合成等の研究をされている方に限ります)
この音声が、わくわくな未来を作る一助になることを願って。
あみたろITAコーパス読み上げ音声 利用規約
あみたろITAコーパス読み上げ音声 Ver.1.1 2022年02月07日更新
----------------------------------------
<目次>
1.はじめに
2.録音環境
3.著作権についてと、できること・できないこと
4. 禁止事項
5.連絡先
6. 更新履歴
----------------------------------------
1.はじめに
この音声ファイル群は、パプリックドメインとして公開されている日本語テキストコーパス「ITAコーパス」の文章424文を、あみたろが読み上げたものです。
音声はWAVE形式、PCM 48,000 kHz/ 16Bit/モノラルで保存されています。
ITAコーパスの文章リスト:https://github.com/mmorise/ita-corpus
音声は、自宅録音室で数日にわけて収録しました。
各文章ごとに2~30テイク(平均7.6テイク)を収録し、RX8 Standardのバッチ処理でリップノイズを除去後、それらのうち最も安定しているものを選別、あるいは安定した部分を切り出して別のテイクと繋げました。
未編集の自然な読み上げ音声ではありませんが、音声合成などにそのまま使える、非常に安定した音声になっていると思います。
これとは別に、読み間違いも咳払いもリップノイズも何もかもそのままの、完全未編集のwavファイル(全3235ファイル/1.19GB)も保存しています。必要な方はご連絡ください。なお、こちらのお渡しは音声合成等の研究をされている方に限ります。
----------------------------------------
2.録音環境
あみたろの声素材工房製作の音声の、録音環境はこちらです。
部屋 自宅録音室
マイク audio-technica AT4040(コンデンサーマイク)
オーディオI/F Steinberg UR242
ポップガード STEDMAN PROSCREEN XL(金属製)
ヘッドホン audio-technica ATH-SX1a
リフレクションフィルター CLASSIC PRO CAR900
自宅録音室は、工務店に依頼して作っていただきました。約2.4畳。
壁の中には全方位、防音性能の高い断熱材セルローズファイバーを詰め、壁材は音楽室のような穴のあいたものに。
床は厚手のカーペット仕上げ、天井は防音仕様の天井材です。
階下からの音が響かないよう、録音室の床と階下の天井の間に空間を設けています。
山梨大学の森勢将雅さんにお越しいただいて、録音室の環境を計測していただいたところ、反響音は録音スタジオに近いぐらいに抑えられているとのことでした。
あみたろの声素材は実際に、大手商業作品にも多数使っていただいています。
森勢さんからいただいたデータはこちらです。
A特性重み付き雑音レベル:18.5 dB
(リオン,NL-52EX)
残響時間 (T60):220 ms
計測条件:T60はインパルス積分法[1]に基づいて推定.
インパルス応答はTSP法[2]により計測.
収録はサンプリング周波数48 kHz,量子化ビット数24 bitで行われた.
TSPの長さは524288サンプル (約10.82秒)である.
計測責任者:森勢将雅 (山梨大学,現在明治大学)
----------------------------------------
3.著作権についてと、できること・できないこと
この音声は、音声合成などに使用していただくことを目的として作成しました。
が、音声そのものをセリフ素材としてご使用いただくことも可能です。
この音声を、音声合成の研究や音声合成ソフト等の作成に使用いただくにあたって、事前の許諾は必要ありません。動画サイトや学会等での発表も、あみたろへの問い合わせなしでご自由にどうぞ。
この音声を使用して作成した動画作品や音声合成ソフトなどは、有償・無償を問わず自由に配布していただくことができます。ただし、配布の際は事後報告で構いませんのでぜひご一報ください。
どうぞ良識あるご利用をお願いします。
用途等の制限は、あみたろの声素材(https://amitaro.net/)に準じます。
簡単にご説明しますと、
・使用料金 … 無料
・著作権 … あみたろが所有します
・使用禁止作品 … 年齢制限のある作品、新興宗教・政治・マルチ購などに深く関係する作品、特定の団体や個人や国家を誹謗中傷する作品
・著作権表示 … 必須
・音声提供者として「あみたろの声素材工房」の名前と「https://amitaro.net/」の記載をお願いします
・再配布 … 条件つきで可。(事後報告でもいいので必ずご連絡ください)
・商業利用 … 可。ただし、素材そのものの販売(素材集としてなど)は不可。
営利目的の商業利用の場合は、事後報告でもいいので必ずご一報ください。(動画収益化・広告つき無料アプリ・原価+α程度で頒布の同人作品はご連絡不要です)
以上の条件を守っていただければ、商業・非商業を問わず、誰でも無料でご使用いただけます。
編集もご自由にどうぞ。
音声の使用に事前の許諾等は不要ですが、「こんな作品に使ったよ」と教えていただけると励みになります。
今後の活動の参考にもさせていただきたいので、ぜひお知らせください。
ご連絡は、こちらにお願いします。
声素材ご利用作品宣伝コーナー https://amitaro.net/wp/user-cm/
メール amitaroinあっとまーくgmail.com (「あっとまーく」を@に書き換えてください)
Twitter @amitaro_voice
----------------------------------------
4.禁止事項
あみたろの声素材工房が配布しているすべての素材について、以下の行為を禁じます。
・年齢制限作品への使用(年齢制限の理由に関わらず)
・音声ファイルへの直リンクでの使用
・政治関係・宗教関係・デモ・市民運動など、特定の思想などを広める用途での使用
・クレジット表記無しでの使用(あみたろが許可した作品を除く)
・声素材そのものの販売、キュレーションサイトやDLサイトでの配布
----------------------------------------
5.連絡先
ご不明な点などございましたら、下記連絡先までお問い合わせください。
メール amitaroinあっとまーくgmail.com (「あっとまーく」を@に書き換えてください)
Webサイト あみたろの声素材工房 https://amitaro.net/
あみたろの声素材工房では、日本語のゲーム用声素材や、時報やタイマー用の音声、カーナビ用音声、英語素材、五十音読み上げなど、おなじ声の声素材を2700点以上公開しています。
その他、歌声合成ソフトUTAUなどで使える音源・小春音アミや、あみたろの声素材とあわせて使える、表情差分いっぱいの小春音アミ立ち絵セット、AI音声合成CoeFontCLOUD用のコエフォントなど、一緒に使える素材もたくさんご用意しています。
----------------------------------------
6. 更新履歴
022/02/07 ver.1.1 公開
RECITATION324_209 誤読修正のため再録・さしかえ
EMOTION100_011 声のばらつき修正のため再録・さしかえ
2021/11/03 ver.1.0 公開
コメント