改訂版 UTAU音声ライブラリカタログ 仕様

※2018/03/12: 一部用語が統一されていなかった部分の記述を修正しました

2018年3月11日に「改訂版 UTAU音声ライブラリカタログ」を公開しました。
ここでは、動画内では言及が十分でなかった集計・および声質評価用wavファイルの作成仕様についてまとめています。

■集計手順
1. 2015年11月27日・2017年9月15日に、下記の集計対象タグを対象として、ニコニコ動画でのスナップショット検索を行った。以降の作業は、この各集計に対して独立に実施している。
ここでヒットした動画のうち10本以上につけられていたタグで、かつUTAUでの利用を前提に創作された
キャラクター名を表すタグを《集計対象タグ》とする。表記ゆれ等への対応については後述。

UTAU / UTAU音源配布所リンク / UTAUオリジナル曲 / UTAUカバー曲 /
VOCALOID→UTAUカバー曲 / UTAU→UTAUカバー曲 / VOCALOID&UTAUオリジナル曲 /
VOCALOID&UTAUオリジナル曲 / HANASU / UTAU式人力 / UTAU連続音音源 /
CVVC収録音源 / ust配布 / UTAU殿堂入り / UTAU音源テスト / UTAU-Synth /
UTAU名曲リンク / UTAU名カバー曲リンク / CV:UTAU音源シリーズ

2. 1. でヒットした動画のうち、以下の各項目に該当する動画を除外したものを《集計対象動画》とした。
集計対象動画のうち、ある集計対象タグがついていた動画の集合を、そのキャラクターの《音源使用動画群》とする。

 A. 以下の各条件に該当するタグ等を含む動画
  ランキング動画 / 動画・音源・MMDモデル紹介を意図して制作された動画 /
  複数の楽曲をつないだアルバム動画、もしくはそのクロスフェード /
  カラオケ動画 / UTAU楽曲に対する「○○してみた」 / イベント告知のための動画 /
  合唱シリーズ(原曲が合唱曲である場合を除く) / 元動画と派生動画を比較のために並べた動画

 B. 以下に該当する動画のうち、複数の既存動画を組み合わせて作成されたか、生放送のアーカイブであると判断される動画
  ・タイトルに下記のいずれかを含む動画
   ランキング / カタログ / 合わせて / 混ぜて / 比較 /
  ・以下のタグを含み、動画IDがnmで始まる動画
   ユーザーニコ割
  ・以下のタグのいずれかを含む5分以上の動画
   作業用BGM / 「BGM」で終わるタグ / 「メドレー」で終わるタグ
  ・タイトルに下記のいずれかを含む5分以上の動画
   メドレー / 耐久 / アルバム / 放送/ アーカイブ / ニコ生
  ・15分以上の動画

 C. その他、集計対象動画としての取り扱いが不適切と判断される動画

なお、集計対象タグの選定時に行った、表記揺れなどによる振り分け方針は以下の通り。

・分類対象タグ名そのもののみを検索対象とし、 後述の名寄せ処理対象を除いて表記揺れには対応しない
  例) 「波音リツキレ音源」タグは波音リツが使用されているものとしてカウントしない
  例) 「ルーク」タグはルーク(UTAU)が使用されているものとしてカウントしない
・キャラクターとしての名称が分かれているものは全て別キャラクターとして扱う
  例) 「重音テッド」は「重音テト」とは分けて集計する
  ※いわゆる“g変え”キャラについては、元音源の制作者が公認していると判断される場合に限り対象とする

また、以下の各条件に当てはまるタグについては、使用キャラの読み替えを行った。
・改称した音源の旧名、および特定音源の別名表記として定着しているもの → 現在一般的に用いられている(と判断される)音源名への統合を行う
 例) ・唄音ウタ → デフォ子
 例) ・白音ヒヨリ → 白鐘ヒヨリ
 例) ・はくあっぽいど → 月代はくぽ
・複数のキャラを包摂するタグ → タグに含まれるキャラが全て使われているものとして扱う
 例) ・音魂屋一姫・二太郎 → 音魂屋一姫, 音魂屋二太郎
 例) ・橙屋イモコ・コハナ → 橙屋イモコ, 橙屋コハナ

・複数のキャラおよび音源を包摂するタグのうち、タグ情報のみからでは使用キャラの特定が困難な下記のタグについては、以下の方針で読み替えを行った。
 ・そのタグが含むキャラ名のいずれかのタグと併用されている場合、併用されているキャラのみが使用されているものとして取り扱う。
 ・上記で使用キャラが絞り込めない場合、実際に動画を視聴した上で個別に判断する。
  その際、実際にはそのタグが含むキャラのいずれの音源も使用されていなかった場合は「音源不使用」と判断し、いずれのキャラにも振り分けていない。
  従って、下記に示すキャラクターは動画数などの統計値の集計条件が他のキャラと異なる点に注意。
  なお、以下では実際に紹介対象にならなかったキャラクターに関する記述は省略している。
  ・欲音ルコ
   キャラクターとしては単一だが、別音源である「欲音ルコ♀」「欲音ルコ♂」を包含するタグ
  ・彼音ちぃ*いずむ
   別キャラクターの「彼音ちぃ」「彼音いずむ」を包含するタグ。
   一方のキャラのみ使われている動画でもこのタグが使われる頻度が高いためこちらで扱った
  ・櫻歌ミコ
   別キャラクターの「櫻歌ミコ第二形態」を含んだ意味で用いられることがある。
   このタグに限り、タイトルと説明文のいずれかに「第二」を含む動画のみをチェック対象とした

3. 各キャラの音源使用動画群のうち、集計日の3年前の1月1日以降に公開された
全動画の再生・コメント・マイリスト登録数の各値から、以下の計算式に基づいてキャラクターごとにポイントα・βを算出した。
ポイントαの算出式はボーカロイドオリジナル曲 マイリス度ランキングの計算式を参考にしている。

・ポイントα = (マイリスト率 × 1000 + 聴き入り度 × 10) × UID補正値
 ・マイリスト率: 総マイリスト数 ÷ 総再生数 × 100
 ・聴き入り度: 総マイリスト数 ÷ 総コメント数 × 100
 ・UID補正値: log2(ユーザーID数)
 ※ユーザーID数: そのキャラ名タグがついた動画をアップロードしているユーザーIDの数。
  同一ユーザーが複数アカウントを所有する場合の名寄せは行っていないため、ユーザー数と等価ではない点に注意。

・ポイントβ = (動画ごとの (マイリスト登録数÷(集計対象タグ数+VOCALOIDキャラクター名タグ数)) の総和) ÷ 経過日数
 ・経過日数: 「音源名タグの初出日」「集計日の3年前の1月1日」のうち、新しいほうの日付と集計日の間の日数

  「音源名タグの初出日」は、その音源名タグがついている動画のうち最も古いものの公開日。
  従って、キャラクターの「誕生日」として設定されている日付とは必ずしも一致しない。

なお、ポイントαにおける動画ごとのマイリスト率と聴き入り度については、
上記の方法で計算した上でそれぞれの常用対数を取り、各キャラ名タグを含む動画群の中で、
どちらか一方以上の値が 平均値±標準偏差×3 の範囲外にある動画を、
上記の計算式における総再生数・総コメント数・総マイリスト数の算出対象から除外した。
ただし、それらの動画に関してもユーザーID数の算出対象からは除外していないほか、
動画内で表示している各値は上記の処理を行わず、全期間の値を単純に足し合わせたものとしている。

4. 以下の A.~E.のいずれかに該当するキャラクターを《紹介対象キャラクター》とする。

A. 下記の条件を満たすもののうち、ポイントα上位80キャラ
 ・集計対象動画のうち20本以上にタグがついている
 ・音源使用動画群のマイリスト登録数中央値が5以上
B. A.で紹介対象になっていないキャラのうち、下記の条件を満たすポイントα最大上位5キャラ
 ・音源使用動画群のマイリスト登録数中央値が5以上
C. A.およびB.で紹介対象になっていないキャラのうち、ポイントβ上位5キャラ
D. 全期間のユーザーID数が100以上
E. A.で選出されたキャラと音源収録者が同一で、かつ選出済のキャラより
 動画数・再生数・コメント数・マイリスト数の全ての値が大きいキャラ

ただし、以下の条件に該当するキャラクターは順位決定の対象に含めない。
これらに該当する音源が上記A.~C.の各条件におけるボーダーより上位に存在する場合、それらは全て紹介対象とする。
 a. 2017年11月01日時点で全ての音源配布を終了している
 b. 音声提供者が同一人物である別の音源がより上位に存在する
 c. 特定音源のgフラグを操作することによって生成された音声に別のキャラクターを割り当てたもの
 d. 人間の声以外を音源の構成要素に含んでいる
なお、「UTAUスターターパック」「UTAUパーフェクトマスター」、および雑誌「Windows100%」の各号は
現在いずれも入手困難のため、集計上は a.と同様に扱い、また動画内でも入手不可として記載している。

■声質評価用音源作成仕様
紹介対象キャラクターと紐づける形で配布されている音源について、
下記の要領で声質推定用のwavファイル(以下「歌唱wav」)を作成した。
※この動画向けの仕様であって、今後公開予定のWebサービスにおいて下記に従うことを推奨するものではありません

・作成対象音源
 各キャラクターの音源のうち、2017年12月31日までに配布開始されたものに対して歌唱wavを作成する。
 複数の声質を同梱したパッケージの場合、その声質ごとに歌唱wav作成を行う。
 ・単独音・連続音など同じ音源種別のカテゴリー内で、同じ名前を冠した音源が音階ごとなど
  複数に分割して個別配布されている場合、それらをすべて統合した1つの音源群に対してのみ歌唱wavを作成する
 ・ある音源γが別の音源βとの併用を前提として配布されている場合、γの歌唱wavは βとγを併用した状態で作成する。
  ここでいう“併用を前提とする音源”は、以下のいずれか1つ以上に該当するものとする。
   A. oto.iniに元々エイリアスが振られている
   B. prefix.mapが別音源との併用前提で作成されている
   C. 公式サイトやreadmeなどで、『既存の○○音源に追加して使う』旨の記述がある
    ・併用先の音源が明確にされていないものは、個別にwav作成を行う
   ・この場合も、γを含まないβ単体での歌唱wavは別途作成する
 ・以下に該当する音源は歌唱wavの作成対象としない
  ・個別に配布されている息音源など、単体での利用を想定していないと判断される音源
  ・複数音階の音源パッケージから、軽量化などを意図して少数の音階分のみを抜き出してリパッケージされた音源
  ・ある音源αに対するノイズ除去版α´が別途配布されている場合の、ノイズ未除去版に相当する音源α
  ・配布終了が明示されている・アップローダーから流失しているなど、新規に入手することができない音源
   ・ただし、そのキャラクターの全音源が配布終了になっている場合は、配布終了直前に入手可能だった音源について歌唱wavを作成する

・作業手順
①声質評価用の指定ustを読み込み、原音ファイルセットを指定
②すべてのノートを選択する
③「原音のプロパティ」で表示される“freq avg.”に表示された音階がA3より低い場合、
評価用ustの最初の音(初期状態でA3)が“freq avg.”と等しくなるように全てのノートの音高を変更する
④単独音以外の音源の場合、autoCVVC 2.0-0.4を用いてプラグインでustを変換する
⑤[P1P4]をクリックし、クロスフェードの設定を行う
 ・autoCVVC 2.0で一部音源・一部ノートのクロスフェード設定が適切に行われない現象を確認したため、念のため手動で再設定する
 ・[!] が大量に発生した場合は、一度処理を取り消した後で[P2P3]・エンベロープ正規化等で対応する

・その他の技術的な仕様
 ・使用するUTAUのバージョンはv0.410以降。そのほか共通の設定は下記の通り
  ・オプション→レンダリング で “レンダリング時にファイルの存在チェックを行い、なるべく音抜けしないようにする” 以外のチェックはすべて外す
  ・Mode2ボタンは使用しない。ONになっている場合はustを変換する前にOFFにする
  ・oto.ini・prefix.mapは下記の場合を除き、音源配布時に添付されているものをそのまま使用する
   ・音源が配布終了していて、配布時点の設定を再現できない場合
   ・prefix.mapで収録範囲と設定範囲が1オクターブずれているなど、配布時の設定では正常に歌わないと判断される場合
  ・oto.iniが音源に同梱されていない・同梱されていてもほとんどの値が0、などの場合は以下のように扱う
   ・公式サイトでoto.iniが提供されている場合はそちらを改変せず使用。複数のoto.iniが提供されている場合はそのうちの一つを任意に採用
   ・それも存在しない場合は、UTAU本体機能の自動推定によって作成された設定値を改変せずに使用
   ・連続音など、自動推定が行えない音源の場合は作業者の判断にて手動でoto.iniを作成する
  ・複数の音源を統合・併用した場合、その状態に即したprefix.mapが存在しない際は作業者の判断にて手動でprefix.mapを作成する
  ・合成エンジンにはUTAU最新版付属のresamplerを使用し、各種フラグ設定は評価用ustから変更しない
   ・ただし、使用を推奨する合成エンジンやフラグ設定が公式に明示されている場合はそちらを優先する
    ・このとき、全ノートのフラグ設定を一括で変更すること
    ・gフラグは「各キャラクターに固有の仕様」の箇所に記載がない場合は全て0で固定する
    ・合成エンジンのバージョンは明示的に指定されている場合を除き最新版とする
    ・推奨エンジンとして複数の種類が併記されている場合は、その中で最初に明記されているエンジンを使用する。
     同一エンジンの系列で複数のバージョンが併記されている場合は、その中で最も新しいバージョンを採用
  ・原音に欠けがあるなどの理由により、評価用ustで歌えない箇所がある場合は、発声可能な原音の中で近い音素に置換し、無音の箇所を作らない
   ・他音源との統合によって回避できる場合はそちらの処理を優先する

・各キャラクターに固有の仕様
 ・重音テッド: 重音テトの各音源をg+30させた状態で歌唱させたwavファイルをテトとは別に作成する
 ・彼音ちぃ: 配布音源をg-10させた状態で歌唱wavを作成する
 ・彼音いずむ: 配布音源をg+10させた状態で歌唱wavを作成する
 ・音魂屋一姫・二太郎: 「どの音源をどちらのキャラに紐づけてもよい」という仕様のため、共通の結果を使用
 ・ソーホー, くあいあ, ラ・ズィマッキエ: 音源コンセプトそのものが補助音源的であると判断し、wav作成および声質推定は行わない



B! LINE