ファイル名見直しの理由
膨大な音声ファイルの中から、誰でも必要なファイルを検索できるようにするため。
新しい命名ルール
1. 使用する文字は「英数字・ハイフン・アンダーバー」のみ
当サイトでは「ファイル名=URL」となります。
このため、ファイル名には日本語や特殊記号は使えません。
使用する文字は「半角英数字・半角ハイフン・半角アンダーバー」のみとします。
(これまでも上記ルールを採用していました)
2. ローマ字表記を採用
原則として、セリフ素材のファイル名は「セリフをそのままローマ字にしたもの」とします。
(これまでもローマ字表記を採用していました)
3. ローマ字表記のルール
ミス防止のため、ファイル名は、ひらがなで入力したものを変換ソフトでローマ字に変換します。
このため、ローマ字表記のルールは変換ソフトのルールに準拠します。
ただし、「-(ハイフン)」「_(アンダーバー)」以外の記号は削除し、長音は母音に変換します。
ローマ字での表記方法が複数ある文字について、以下のように統一します。
ローマ字表記のルール:
- 「ん」=「n」
- 「し」=「shi」
- 「ち」=「chi」
- 「つ」=「tsu」
- 「ふ」=「fu」
- 「を」=「wo」
- 「ー(長音)」は前の母音を重ねる
- 「っ(促音)」は次の子音を重ねる
- 文頭・文末の「っ」は無視
- 「、(読点)」=「_(アンダーバー)」
- 文中の「。(句点)」=「_(アンダーバー)」
- 「…」「!」「?」「♪」などの記号は無視
4. 文頭によくある言い回しを一部省略
ある程度の文字数のセリフの場合は、よくある「話し始めの言葉」を省略してローマ字化することがあります。
具体的には、文頭の「えっと、」「うーん、」「お手数ですが、」などを省略することがあります。
文頭を省略する例:
- ま、なんとかなるよね → nantokanaruyone_01.wav
- うわぁ、まっくらだ~ → makkuradaa_01.wav
検索の際は、絶対に省略されそうにない部分を入力してください。
5. 長文は後半を省略
長いセリフは、他のセリフと区別できる範囲でセリフの後半を省略してファイル名とします。
厳密に文字数で切ることはしません。
が、目安として、ひらがな15~16文字程度が上限となるよう省略します。
また、文頭の省略と合わせて使用することがあります。
後半を省略する例:
- 入力内容をもう一度確認してください → nyuuryokunaiyouwo_01.wav
- 作業、はかどってますか? → sagyouhakadotte_01.wav
- お手数ですが、もう一度ご確認ください → mouichidogokakunin_02.wav
6. 外来語を英語表記するのは、なじみのある「名詞」「単位」「フレーズ」のみ
日本に広く浸透している英単語は、そのまま英語で表記することがあります。
ただし、英語で表記するのは「名詞」「単位」「フレーズ」のみとします。
英語で表記する例:
- Wifiに繋がりません → wifinitsunagarimasen_01.wav
- ゲームスタート → gamestart_01.wav
- キャラクターを選んでね → characterwoerandene_01.wav
- 100パーセント → 100percent_01.wav
これまでのファイル名とその問題点
これまでのファイル名
あみたろの声素材工房で公開している声素材はこれまで、原則としてセリフ名をローマ字にしたものをファイル名としてきました。(長すぎる場合は一部省略)
これまでのファイル名の例:
- こんにちはー! … konnichiwa_03.wav
- ごめんなさいっ … gomennasai_01.wav
- わかんなくなっちゃった … wakannnaku_01.wav
- 大変申し訳ございませんでしたぁっ … taihennmoushiwake_01.wav
- だってあんなにがんばってきたのに … datteannaniganbattekitanoni_01.wav
- 起動しました!今日も安全運転よろしくお願いします … anzennunten_01.wav
2022年7月27日現在、当サイトで公開しているセリフ素材は、上記のようなファイル名になっています。
「セリフ名をローマ字にしたもの」としたのは、以下の理由からです。
- 2700以上のセリフから必要なものを検索できるよう、「amitaro_2659.wav」等ではなくセリフ名を入れたい
- 「ファイル名=URL」となるので、日本語は使えない
これまでのファイル名の問題点
これまでのファイル名には、以下の問題がありました。
- ローマ字化のルールにブレがある
- 「shinai」が「親愛(shinai)」にも「市内(shinai)」にも読める
- 長文がとても読みづらい
- 英語が混在している
問題の具体例1:ローマ字化ルールのブレ
現在公開している声素材は、2007年頃から2022年の現在まで、少しずつ追加し続けてきたものです。
制作が長期にわたっているため、ローマ字化のルールに若干のブレがあります。
ローマ字化ルールのブレの例「ん」:
- こんにちはー! … konnichiwa_03.wav 「んに」を「nni」と表現 (ん=n)
- わかんなくなっちゃった … wakannnaku_01.wav 「んな」を「nnna」と表現 (ん=nn)
ローマ字化ルールのブレの例「し」:
- はじめまして … hajimemasite_01.wav 「し」を「si」と表現
- おひさしぶり … ohisashiburi_03.wav 「し」を「shi」と表現
ローマ字化ルールのブレの例「つ」:
- 一緒に発音してみよう … isshonihatuonshitemiyou_01.wav 「つ」を「tu」と表現
- 着きました! … tsukimashita_01.wav 「つ」を「tsu」と表現
これらのブレのせいで、ローマ字でファイル検索をしてもみつけられない可能性があります。
問題の具体例2:「んあ/な」等が区別しづらい
「na」は「んあ」とも「な」とも読めるなど、ローマ字は複数の読み方ができる場合があります。
これは当サイトのファイル名に限らず、日本語をローマ字化した時によく発生する問題です。
区別しづらい言葉の具体例:
- shinai … 「しんあい(親愛)」「しない(市内・竹刀)」
- kenin … 「けんいん(牽引・検印)」「けんにん(兼任・検認)」
- honya … 「ほんや(本屋)」「ほにゃ」
- funinnomikomi … 「ふにんおみこみ(赴任を見込み)」「ふにんのみこみ(赴任の見込み)」
- shinyougajuuyouda … 「しんよう(信用)が重要だ」「しにょう(し尿)が重要だ」
単語のセリフしかなければ、「親愛(shin-ai)」「市内(shinai)」とすれば解決します。
しかし文章のセリフもあるため、「shin-yougajuuyouda」のように単語の途中に記号を入れると読みづらいです。
問題の具体例3:長文が読みづらい
長文セリフは一部を省略してファイル名にするなど、工夫しています。
しかしそれでもなお、長文ファイル名が非常に読みづらいです。
長文ファイル名の具体例:
- hauushitsureishimashita_01.wav … はううっ、失礼しましたぁっ
- donatakairasshaimasenka_01.wav … どなたかいらっしゃいませんかーぁ?
- datteannaniganbattekitanoni_01.wav … だってあんなにがんばってきたのに
- demodemodaijoubudayo_02.wav … でもでも大丈夫だよっ、これから何度だって挑戦すればいいんだから♪
問題の具体例4:英語が混在している
外来語をローマ字表記すると非常に読みにくいため、外来語は英語表記している場合があります。
が、英語表記/ローマ字表記の区別があいまいです。
外来語入りファイル名の具体例:
- rankinguwohappyoushimasu_01.wav … ランキングを発表します(ローマ字)
- purasu_01.wav … +(プラス)(ローマ字)
- wifinitsunagarimasen_01.wav … Wifiに繋がりません(英語)
- netnitsunagattenaimitai_01.wav … ネットに繋がってないみたい(英語)
- no_thankyou_03.wav … のーさんきゅうっ(英語)
- testnideruyo_01.wav … テストに出るよー
これらのブレのせいで、ファイル検索でうまくみつけられない可能性があります。
ファイルの命名ルールの見直しが必須
あみたろの声素材工房は、クリエイターさん支援のため、これからも無料セリフ素材を作り続けていきたいと考えています。
しかし、どんなにたくさんのセリフ素材があっても、ほしいセリフをみつけられなければ意味がありません。
「誰でもみつけられる形」にするため、「ファイルの命名規則の統一」が必要だと判断しました。
たくさんの方にご意見をいただきました
ファイルの命名規則を決めるにあたって、様々な業界の方から多角的な視点でご意見をいただきました。
とても参考になるご意見がたくさんありましたので、まとめを共有します。
新しいルールは、みなさまからいただいたご意見を元に、慎重に考えさせていただきました。
本当にありがとうございました!
コメント