最終更新日:2022/05/24 * セリフ素材2713点 + UTAU, CoeFont, TALQu, ITAコーパス ほか

ITAコーパス読み上げ音声

目次

ITAコーパス読み上げ音声のダウンロード

あみたろの声素材工房による「ITAコーパス読み上げ音声」を無料配布します。音声合成ソフトの作成に、セリフ素材と組み合わせて声ネタ素材に、自由な発想でご活用ください。

2022/05/23 に完全新録のVer.2.1を公開しました。
これ以前にダウンロードされた方は、お手数ですが再ダウンロードをお願いします。

通常は「ITAcorpus_amitaro_2.1.zip」(48kHz)を、MYCOEIROINKの学習に使用する場合は「ITAcorpus_amitaro_forMYCOEIROINK 2.1.zip」(44.1kHz)をダウンロードしてください。

ITAコーパスとは

ITAコーパスは、使用料0円、パブリックドメインの文章集。日本語のいろんな音がバランスよく含まれているので、これを読み上げた音声があれば日本語音声合成ソフトの作成にも使える、という特殊な台本のようなものです。

GitHub
GitHub - mmorise/ita-corpus: ITAコーパスの文章リスト ITAコーパスの文章リスト. Contribute to mmorise/ita-corpus development by creating an account on GitHub.
ITmedia NEWS
高い、使いにくい、読みにくい──音声合成研究者を悩ませるハードルを解決する“台本”、明治大学らが発表 明治大学らが、音声合成の研究に必要な音声を収録するための台本「ITAコーパス」を公開した。開発に携わった小口さんによると、ITAコーパスは既存コーパスが抱えていた3つ...

以前から音声合成関係の研究を全力で応援しているあみたろの声素材工房としては、何としても挑戦したいところ。

ということで、ITAコーパスの全424文を読み上げた音声を公開しています!

Ver.2.1を公開しました

録音室の改造で反響音が減ったので、もう一度すべての文章を録音し直して、Ver.2.1として公開しています。

声質はほとんど変わりませんが、音質が良くなり、読み上げもよりなめらかになりました。
これからダウンロードされる方は、Ver.2.1をどうぞ。

Ver.1.1も「old」フォルダの中に置いてあります。別収録の差分が必要な場合はお使いください。

ITAコーパス読み上げ音声の製作過程(Ver.1.0)

ITAコーパスは、全424文の日本語群。
424文、というとCoeFontハイエンド版の700文よりも少ないのですが、とにかく時間がかかりました…!

声の調子や滑舌や話速や抑揚を意識して録って録って録りまくって、ver1.0の完成までにできたファイルの数は3211個。

この3211個のwavファイルのリップノイズを除去してから、たくさんのテイクの中からベストなテイクを選んだり、時には破裂音のつなぎ目などで音声と音声をがっちゃんこしたり…と、休日をたくさん費やしてようやく完成したのが、公開しているVer.1.0の圧縮ファイルです。

録音も何日もかかったけど、それ以上に編集が大変でした…。TALQuコンテスト優勝特典の大量録音の練習のつもりでやってみたけど、このやり方では3か月いっぱいいっぱい使っても全然数が稼げないことがわかったので、TALQuの録音はもう少しさらっとやろうと思います。

なお、Ver.2.0は計2270テイクでした。読むのがちょっとうまくなりました…!

ITAコーパス読み上げ音声 全424文の試聴動画

ダウンロード前に声質などをご確認いただけるよう、全424文の読み上げ音声を動画にしてみました。
(動画はVer1.0のものです。これからダウンロードされる方には完全新録のVer.2.1をおすすめします)

ITAコーパス読み上げ音声を配布します【あみたろの声素材工房】ITA Japanese speech corpus dataset - Amitaro, Japanese girlITAコーパス読み上げ音声を配布します【あみたろの声素材工房】ITA Japanese speech corpus dataset – Amitaro, Japanese girl

こちらの動画をご覧いただければ、ITAコーパスがどんなものかもわかると思います。ジャデャクシュ! ブレンドデョート! イデュスルファーゼ!

あみたろITAコーパス読み上げ音声は こんなことに使えます

あみたろの声素材工房のITAコーパス読み上げ音声は、音声合成用の素材としてのご利用はもちろん、セリフ素材としてのご利用もOKです。不思議な文章ばっかりだけど、うまく繋げるとラジオやテレビの背景音みたいになるかも。セリフ素材の規約に沿って、うまく使ってください!

いつも通り年齢制限ものとかはNGだけど、真面目な研究用途ならほとんど制限なしです。音声合成ソフトを作って販売するのもOKです。クレジットは必須です。詳しくは規約をご覧ください。

また、読み間違いも咳払いもリップノイズも何もかもそのままの、完全未編集のwavファイル(全3211ファイル/1.18GB)も保存しています。必要な方はご連絡ください。(お渡しは音声合成等の研究をされている方に限ります)

この音声が、わくわくな未来を作る一助になることを願って。

アクセント情報・音素アライメントラベル

Yちゃんが、あみたろのITAコーパス読み上げ音声のアクセント情報・音素アライメントラベルを公開してくださっています。
(情報はVer.1.0のものです)

アクセント情報が見やすいVOICEVOX(0.10.4)プロジェクトファイルも同梱されています。アクセントの上下をVOICEVOX画面上で視覚的に確認することができるので、これからITAコーパスを録音される方にも役に立つかもしれません。

あみたろITAコーパス読み上げ音声 利用規約

あみたろITAコーパス読み上げ音声 Ver.2.1 2022年05月23日更新

----------------------------------------
<目次>

 1.はじめに

1.はじめに
2.Ver.1との違い
3.録音環境
4.著作権についてと、できること・できないこと
5.禁止事項
6.連絡先
7.更新履歴

----------------------------------------

1.はじめに

この音声ファイル群は、パプリックドメインとして公開されている日本語テキストコーパス「ITAコーパス」の文章424文を、あみたろが読み上げたものです。
音声はWAVE形式、PCM 48,000 kHz/ 16Bit/モノラルで保存されています。【注:44,100kHzではありません】

 ITAコーパスの文章リスト:https://github.com/mmorise/ita-corpus

音声は、自宅録音室で数日にわけて収録しました。

各文章ごとに3~19テイク(平均5.4テイク)を収録し、RX8 Standardで手作業でポップノイズ・リップノイズ・ブレス音を手作業で除去後、それらのうち最も安定しているものを選別、あるいは安定した部分を切り出して別のテイクと繋げました。

未編集の自然な読み上げ音声ではありませんが、音声合成などにそのまま使える、非常に安定した音声になっていると思います。
これとは別に、読み間違いもリップノイズも何もかもそのままの、完全未編集のwavファイル(全2291ファイル/858MB)も保存しています。必要な方はご連絡ください。なお、こちらのお渡しは音声合成等の研究をされている方に限ります。

----------------------------------------

2.Ver.1との違い

Ver.1の収録に使用した録音室の壁を厚手のカーテンで覆い、反響音を減らしてVer.2を収録しました。

音声はすべて完全新規録音しているので、声質が若干異なります。
また、コーパスを読み慣れたため少しこなれた読み方になっているかと思います。

----------------------------------------

3.録音環境

あみたろの声素材工房製作の音声の、録音環境はこちらです。

部屋 自宅録音室
マイク audio-technica AT4040(コンデンサーマイク)
オーディオI/F Steinberg UR242
ポップガード STEDMAN PROSCREEN XL(金属製)
ヘッドホン audio-technica ATH-SX1a
リフレクションフィルター CLASSIC PRO CAR900

自宅録音室は、工務店に依頼して作っていただきました。約2.4畳。

壁の中には全方位、防音性能の高い断熱材セルローズファイバーを詰めています。
音楽室のような穴のあいた壁材を、厚手のカーテンで覆っています。
床は厚手のカーペット仕上げ、天井は防音仕様の天井材です。
階下からの音が響かないよう、録音室の床と階下の天井の間に空間を設けています。

山梨大学の森勢将雅さんにお越しいただいて、録音室の環境を計測していただいたところ、反響音は録音スタジオに近いぐらいに抑えられているとのことでした。(計測は録音室の改造以前)
あみたろの声素材は実際に、大手商業作品にも多数使っていただいています。

森勢さんからいただいたデータはこちらです。

 A特性重み付き雑音レベル:18.5 dB
 (リオン,NL-52EX)
 残響時間 (T60):220 ms

 計測条件:T60はインパルス積分法[1]に基づいて推定.
 インパルス応答はTSP法[2]により計測.
 収録はサンプリング周波数48 kHz,量子化ビット数24 bitで行われた.
 TSPの長さは524288サンプル (約10.82秒)である.

 計測責任者:森勢将雅 (山梨大学,現在明治大学)

 あみたろの録音環境:https://amitaro.net/about/aboutrec/
 Ver.1とVer.2の録音環境の違い:https://amitaro.net/wp/20220419_01/

----------------------------------------

4.著作権についてと、できること・できないこと

この音声は、音声合成などに使用していただくことを目的として作成しました。
が、音声そのものをセリフ素材としてご使用いただくことも可能です。

この音声を、音声合成の研究や音声合成ソフト等の作成に使用いただくにあたって、事前の許諾は必要ありません。動画サイトや学会等での発表も、あみたろへの問い合わせなしでご自由にどうぞ。
この音声を使用して作成した動画作品や音声合成ソフトなどは、有償・無償を問わず自由に配布していただくことができます。ただし、配布の際は事後報告で構いませんのでぜひご一報ください。
どうぞ良識あるご利用をお願いします。

用途等の制限は、あみたろの声素材工房の規約(https://amitaro.net/voice/voice_rule/)に準じます。

簡単にご説明しますと、

 ・使用料金 … 無料
 ・著作権 … あみたろが所有します
 ・使用禁止作品 … 年齢制限のある作品、新興宗教・政治・マルチ購などに深く関係する作品、特定の団体や個人や国家を誹謗中傷する作品
 ・著作権表示 … 必須
 ・音声提供者として「あみたろの声素材工房」の名前と「https://amitaro.net/」の記載をお願いします
 ・再配布 … 条件つきで可。(事後報告でもいいので必ずご連絡ください)
 ・商業利用 … 可。ただし、素材そのものの販売(素材集としてなど)は不可。
  営利目的の商業利用の場合は、事後報告でもいいので必ずご一報ください。(動画収益化・広告つき無料アプリ・原価+α程度で頒布の同人作品はご連絡不要です)

以上の条件を守っていただければ、商業・非商業を問わず、誰でも無料でご使用いただけます。
編集もご自由にどうぞ。

音声の使用に事前の許諾等は不要ですが、「こんな作品に使ったよ」と教えていただけると励みになります。
今後の活動の参考にもさせていただきたいので、ぜひお知らせください。
ご連絡は、こちらにお願いします。

 声素材ご利用作品宣伝コーナー https://amitaro.net/wp/user-cm/
 メール amitaroinあっとまーくgmail.com (「あっとまーく」を@に書き換えてください)
 Twitter @amitaro_voice

----------------------------------------

5.禁止事項

あみたろの声素材工房が配布しているすべての素材について、以下の行為を禁じます。

・年齢制限作品への使用(年齢制限の理由に関わらず)
・音声ファイルへの直リンクでの使用
・政治関係・宗教関係・デモ・市民運動・ヘイトスピーチなど、特定の思想などを広める用途での使用
・クレジット表記無しでの使用(あみたろが許可した作品を除く)
・声素材そのものの販売、キュレーションサイトやDLサイトでの配布

----------------------------------------

6.連絡先

ご不明な点などございましたら、下記連絡先までお問い合わせください。

 メール amitaroinあっとまーくgmail.com (「あっとまーく」を@に書き換えてください)
 Webサイト あみたろの声素材工房 https://amitaro.net/

あみたろの声素材工房では、日本語のゲーム用声素材や、時報やタイマー用の音声、カーナビ用音声、英語素材、五十音読み上げなど、おなじ声の声素材を2700点以上公開しています。

その他、歌声合成ソフトUTAUなどで使える音源・小春音アミや、あみたろの声素材とあわせて使える、表情差分いっぱいの小春音アミ立ち絵セット、AI音声合成CoeFontCLOUD用のコエフォントなど、一緒に使える素材もたくさんご用意しています。

----------------------------------------

7. 更新履歴

2022/05/23 ver.2.1 公開
 recitation243、recitation307 誤読修正のため再録・さしかえ (Yちゃんご指摘ありがとうございます!)
2022/05/17 ver.2.0 公開
 録音環境を改良し全文新規録音
2022/02/07 ver.1.1 公開
 recitation209 誤読修正のため再録・さしかえ (Yちゃんご指摘ありがとうございます!)
 emoNormal011 声のばらつき修正のため再録・さしかえ
2021/11/03 ver.1.0 公開

目次
上へ
目次
閉じる