おふとんPさんが公開された「関西弁コーパス」の文章作成や雑務のお手伝いをしました。
GitHubからダウンロードできます。
クレジット…おふとんP、あみたろの声素材工房、Nacl_E 開発協力…Haruqa
「関西弁コーパス」は、「ITAコーパスを(音素バランスを考えずに)関西弁に翻訳した文章群」と、「完全オリジナルの関西弁の文章群」(の台本)です。
この「関西弁コーパス」+「無改変のITAコーパス」を関西弁のイントネーションで読むと、関西弁の音声合成モデルを作りやすいかも?という感じのものです。
(COEIROINKなど、元になっているデータが標準語イントネーションの場合は、完全には再現できないようです)
ITAコーパスの関西弁翻訳は、発起人のおふとんPさんが担当されました。
あみたろは読み仮名入力などの雑務をいろいろお手伝いしました。
また、オリジナル文章442文の一部として、あみたろが書き溜めていた「あみたろ大阪弁コーパス」324文を提供しました。
あみたろ提供部分は、関西弁の中でも大阪弁に特化した文章です。
幼い頃から大阪弁文化の中で育ってきたので、実生活で耳にした会話を元にして日常的な表現をいっぱい入れました。
「あみたろ大阪弁コーパス」は、文章をさらに増やして後日公開予定です。
関西弁コーパスはイントネーションが特殊なので、他の地方の方には読みにくいと思います。
また、「関西弁」は対象となる地域が意外と広いので、あみたろも自分が書いた文章以外は読み方がわからない部分がいっぱいありました。
なので、読み上げ例の音声があると便利だと思います。
が、今のところ、読み上げ音声はまだ公開されていません。(と思います)
また、おふとんPさんは、原則としてコーパス読み上げ音声を公開しない姿勢を取られています。
なので、「大阪弁ネイティブの読み上げ例」として、あみたろの読み上げ音声を公開できれば考え、「無改変ITAコーパス」+「関西弁コーパスITAコーパス」+「関西弁コーパス」を収録しました。
(イントネーションがわからない部分は、本人許諾のもと、おふとんPさんのイントネーションを参考にさせていただきました)
1290文もあるので時間はかかると思いますが、編集が完了したら音声を公開します。こつこつがんばります!
コメント