はじめに

概要

唄詠（うたよみ）は、テキストスピーチソフト（棒読みちゃんなど）の声として、UTAU 音源（重音テトなど）を当てられるようにするためのソフトです。

テキストスピーチソフトに文章を入力するだけで、お気に入りの音源にしゃべらせる（HANASU）ことができるようになるため、調声が不要で手軽です。棒読み状態となるためリアルな表現には不向きですが、短時間で多くのセリフをしゃべらせたい場合などに力を発揮します。

動作環境

唄詠公式ページのサポート情報をご覧ください。

必要なもの

唄詠を使うためには、唄詠の他に、以下の物が必要となりますので、別途用意して下さい。

UTAU……使用する調声プラグインにもよりますが、デフォルトの調声プラグインは、歌声合成ツール UTAU に付属するツールを使用します。
有志が UTAU 互換ツールを公開されており、互換性が完全であれば、互換ツールも利用可能で、互換ツールを使う場合は、UTAU は不要です。
また、調声プラグインによっては、UTAU が不要のものもあります。
UTAU 音源……しゃべりの「声」です。
テキストスピーチソフト……読み上げる文章を入力するためのツールです。SofTalk や棒読みちゃんなど、「SAPI 5」と呼ばれる規格に準拠しているものを用意して下さい。

インストール

唄詠のインストールは、ダウンロードした zip ファイルを解凍するだけで完了です。

前節の必要なソフトについては、各ソフトのインストール方法に従ってインストールして下さい。

使い方クイックガイド

大きな流れとしては、

唄詠で UTAU 音源を登録
テキストスピーチソフトで読み上げ

となります。

UTAU 音源の登録

UTAU 音源に文章を読み上げさせる（HANASU）ために、まず、UTAU 音源を登録します。

唄詠（UtaYomi.exe）を起動します。メインウィンドウは右のような画面となります。初期状態では、音源は登録されておらず、リストは空欄になっています。

「新規登録」ボタンをクリックすると、音源の新規登録画面となります。

「音源名（設定名）」には、これから登録しようとする UTAU 音源の内容が分かりやすいような名前を入力します。この欄を空欄にしておいても、次の「oto.ini の場所」を入力すると自動的に入力されますので、ひとまず空欄にしておいても構いません。

「oto.ini の場所」には、UTAU 音源に付属している oto.ini ファイルの場所（フルパス）を入力します。エクスプローラーなどから oto.ini をドラッグ＆ドロップすれば、場所が入力されます。

UTAU 音源は、日本語音源であれば、単独音音源、連続音音源、CVVC 音源（単独音音源扱い）のいずれも使用可能ですが、発音が滑らかになる連続音音源をおすすめします。

なお、調声プラグインにもよりますが、デフォルトの調声プラグイン「やまなみ」の場合は、サブフォルダにも oto.ini がある音源の場合に音源の最上位フォルダの oto.ini を指定すれば、サブフォルダの oto.ini も自動的に読み込みます。

「声質」および「年代」では、音源の基本的な属性を指定します。デフォルトの調声プラグインの場合、この属性によって声の高さが変わります。

「調声プラグイン」で調声に使用するプラグインを指定します。プラグインによって話し方が変わります。「設定」ボタンをクリックすると、調声プラグイン固有の設定を行うことができます。詳しくは、調声プラグインの設定章を参照して下さい。

すべてを入力し終えたら、「OK」ボタンをクリックします。音源が登録され、メインウィンドウのリストに項目が追加されます。音源登録時には管理者権限が必要ですので、管理者の ID とパスワードを入力して下さい。

なお、まれに、「唄詠音源をシステムに登録しました」と表示されたにもかかわらず、メインウィンドウのリストに項目が追加されない現象が発生することがあります。そのような場合は、トラブルシューティングを参照して下さい。

音源登録前に、どんな感じでしゃべるのか試聴することもできます。「試聴」ボタンをクリックすると、管理者権限登録の後に試聴できます。

まだ自分が持っていない新しい音源を使ってみたいと思ったら、「音源検索」ボタンで、音源検索ウェブサイトにジャンプできます。詳しくは音源の検索章を参照して下さい。

なお、音源の登録が完了したら、唄詠は終了して構いません（文章読み上げの際に唄詠が起動している必要はありません）。

テキストスピーチソフトで読み上げ

音源の登録が完了したら、実際に UTAU 音源で読み上げを行います。

読み上げには、テキストスピーチソフトを使います。

SAPI 5 に対応したテキストスピーチソフトを起動します。ここでは、棒読みちゃんを例として説明します。

「声質」を選ぶドロップダウンリストに、先ほど登録した UTAU 音源が列挙されていますので、UTAU 音源を選択します。

テキストボックスに、読み上げたい文章を入力します。テキストスピーチソフトが棒読みちゃんの場合は、漢字かな交じり文を読み上げることができます。対応文字の詳細については「対応文字種」章をご覧ください。

音声合成ボタンをクリックして、少し待つと、入力された文章が UTAU 音源の声で読み上げられます。

以上で、一通り読み上げまでの操作ができるようになりました。

再生までに時間がかかる場合は、設定の中の発生のタイミングや、プラグイン設定の中の音声合成の高速化を変更すると良いでしょう。

他者の前例（既存の唄詠利用作品）を見て参考にしたい場合は、ニコニコ動画の唄詠コンテンツツリーを参照してみましょう。

しばらく唄詠を使い、操作に習熟した後は、ワンランク上の読み上げを目指してみるのもいいかもしれません。

唄詠ワンポイント Tips：アクセントを指定する

音源の検索

UTAU 音源は 5,000 種類以上存在すると言われており、唄詠はそのほとんどを使うことができます。UTAU 音源はそれぞれ利用規約がことなるので、目的に合った規約かどうか確認してから使って下さい。

様々な音源があるのは有り難いのですが、多すぎて、何の手がかりもなくイメージ通りの音源を探すのは困難かもしれません。そんな時は、「UTAU 音源　声質検索」サイトを活用してみてはいかがでしょうか。

UTAU 音源　声質検索
※唄詠の音源の新規登録画面にある「音源検索」ボタンからもジャンプできます。

このサイトは、UTAU 音源を、「しゃべった時の声質」から検索することができます。例えば、「女声」「男声」といった声の性別や、「明るい」「力強い」などの声の雰囲気を表すタグから検索できます。また、UTAU 音源声質アンケートの結果から検索することもできます。

検索結果や音源情報ページでは、唄詠でしゃべらせた時のサンプルボイスも聴けますので、音源をダウンロードしなくても、声の雰囲気を確認することができます。

このサイトは、どなたでも登録・編集ができます。声の雰囲気を表すタグを追加したり、自分がしゃべらせた唄詠ボイスをサンプルボイスとして追加したりして、情報の充実にご協力をお願いします。

唄詠使用支援中

前章で説明した「UTAU 音源　声質検索」サイトは、唄詠使用支援中の音源を対象として検索します。

唄詠使用支援中の音源というのは、文字通り、UTAU 音源の製作者が唄詠を支援する気持ちを表明して下さっている音源です。唄詠使用支援中の音源であれば、安心して唄詠で使うことができるでしょう。なお、唄詠使用支援中でないからといって、唄詠で使えないわけではありません。あくまでも音源の利用規約が正となります。

唄詠使用支援中の詳細については、支援サイト「【唄詠使用支援中】をひろめよう！」を参照して下さい。

唄詠使用支援中の音源は、ニコニコ動画の唄詠使用支援中タグ検索で見つけることができます。新たに唄詠を支援して下さる UTAU 音源製作者の方は、支援サイトをご覧の上、音源配布動画にて「唄詠使用支援中」タグロックをお願いします。

機能説明

音源の登録情報修正

メインウィンドウで音源を選択した後、「修正」ボタンをクリックすると、既に登録した音源の情報を修正することができます。

修正画面での入力方法は、新規登録画面と同様です。

音源の登録抹消

メインウィンドウで音源を選択した後、「登録抹消」ボタンをクリックすると、唄詠で使用する音源としての登録を抹消することができます。

なお、登録抹消を行っても、UTAU 音源のファイル自体が消えるわけではありません。あくまでも、唄詠（ないしはテキストスピーチソフト）で使用できなくなるというだけです。

旧仕様の音源

メインウィンドウの音源一覧において、旧バージョンの唄詠で登録した音源が「旧唄詠仕様」と表示されることがあります（テキストスピーチソフトの声選択時には表示されません）。

旧仕様の音源でも基本的な読み上げを行うことはできますが、最新バージョンの機能を活かせないことがありますので、最新仕様にすることをお薦めします。

旧仕様の音源を最新仕様にするには、音源の修正画面にて、再度登録をするだけで完了します。

設定

メインウィンドウで「設定」ボタンをクリックすると、設定ウィンドウが表示され、唄詠全般の動作に関する設定を変更することができます。

発声のタイミング

「発声のタイミング」では、音声合成と発声を並行で行うかどうかを設定します。

発声のタイミングを「一括合成」にすると、しゃべらせたい文章全体を音声合成してから発声します。発声までのタイミングは長くなります。

発声のタイミングを「逐次合成」にすると、指定した文字の音声合成が終わり次第、発声します。発声までのタイミングが短くなりますので、快適に利用できます。ただし、一部のテキストスピーチソフトは逐次合成に対応していません。また、お使いのパソコンの性能が低いと、途中で発声が一時停止し、プチプチとすることがあります。

唄詠コンポーネントの互換性をチェックする

唄詠は複数のファイル群から構成されており、これらのファイルの互換性（バージョン）が統一されている必要があります。通常はバージョンは統一された状態であるはずですが、何らかの原因で、バージョンが不統一になっていないかを確認するための項目です。

「今すぐ互換性を確認する」ボタンをクリックすると、互換性の確認が行えます。

バージョンが異なる旨の表示がされた場合は、「唄詠を再インストールする」ボタンをクリックして、唄詠のダウンロードおよびインストールを行って下さい（バージョンは自動的に最新版になります）。

唄詠の自動更新が中断された場合も、「唄詠を再インストールする」を行って下さい。

音源設定を外部に保存する・外部から読み込む

登録した音源の情報は、OS 再インストールなどを行うと消えてしまいますので、定期的に USB メモリなどの外部メディアに保存すると良いでしょう。

また、複数のパソコンで唄詠を利用している方は、外部保存機能を使うことにより、音源設定を別のパソコンに持ち出すことができて便利です。

音源設定を保存するには、「エクスポート」ボタンをクリックします。表示されるダイアログで、保存するファイル名を指定して下さい。

保存した音源設定を読み込むには、「インポート」ボタンをクリックします。表示されるダイアログで、以前に保存したファイルを指定して下さい。

ファイルに保存されている音源情報と同じ名前の音源が既に登録されていた場合は、インポートが行われませんので注意して下さい。

また、インポート後は、必ず、音源設定画面で、設定内容を確認して下さい。特に、デフォルト調声プラグインの WavTool の場所などは、環境が変わるとそのままでは動かない可能性があります。

ログを保存する

唄詠の動作の記録であるログなどを保存することができます。唄詠に不具合があった場合の原因究明などに役立つ場合があります。

調声プラグインの設定

ダブルフラット調声プラグイン

ダブルフラット調声プラグインを使うと、ストレートな感じの読み上げを行うことができます。一部で能やお経とも言われる、独特の節回しが特徴的な話し方になります。

ダブルフラット調声プラグインを使用した読み上げサンプル：
<a href="http://tmbox.net/pl/845341">【唄詠】Ver 7.11 読み上げサンプル：ダブルフラット（句音コノ。＆唱地ヨエ）</a>
ダブルフラット調声プラグインの設定項目は、やまなみ調声プラグインと同様ですので、やまなみ調声プラグインを参照して下さい。

やまなみ調声プラグイン

やまなみ調声プラグインは、「ニュートラルな読み上げ」をコンセプトとして開発された調声プラグインです。ダブルフラット調声プラグインよりも、少し普通のナレーションに近づいた読み上げをします。

やまなみ調声プラグインを使用した読み上げサンプル：
<a href="http://tmbox.net/pl/845348">【唄詠】Ver 7.11 読み上げサンプル：やまなみ（句音コノ。＆唱地ヨエ）</a>
唄詠の音源登録画面において、調声プラグインを「やまなみ」にしたうえで、「設定」ボタンをクリックすると、右の設定画面が表示されます。

画面の上半分が音源の設定で、下半分がやまなみプラグイン共通設定（音源に関係なくプラグイン自体の動作を設定）です。

やまなみプラグインを使う際は、音源は連続音音源が推奨されています。

音源の設定

「wavtool の場所」には、UTAU に付属している wavtool.exe の場所（フルパス）を入力します。エクスプローラーなどから wavtool.exe をドラッグ＆ドロップすれば、場所が入力されます。標準的な UTAU のインストールをした場合は、自動的に入力されているはずです。また、次回以降の音源登録では、最後に登録した際の wavtool が自動的に入力されます。

「resampler の場所」には、UTAU に付属している resample.exe の場所（フルパス）を入力します。エクスプローラーなどから resample.exe をドラッグ＆ドロップすれば、場所が入力されます。標準的な UTAU のインストールをした場合は、自動的に入力されているはずです。また、次回以降の音源登録では、最後に登録した際の resample が自動的に入力されます。

「resampler のフラグ」は resampler に渡すフラグを指定します。UTAU においては、プロジェクトの設定で「生成時オプション」として指定しているものです。

「モジュレーション」は UTAU の mod に相当するパラメーターで、単位は % です。原音のピッチ揺れをどの程度発声に反映させるかを指定します。モジュレーションを 0 にすると、原音のピッチが不安定でも、一定の音域で発音されます。

「低音」および「高音」は、話す際の上下の音を指定します。アクセントのある音が「高音」、それ以外が「低音」です。初回設定時、音源登録画面の「声質」「年代」から自動的に設定されますが、ここで手動で変更することにより、好みの音の高さにすることができます。「ピアノ」ボタンをクリックすると、ピアノ画面で直感的に音の高さを指定することができます。

やまなみ共通の設定

「音声合成の高速化」は、CPU の性能を活用して高速に音声合成するかどうかを設定します。

音声合成の高速化を「高速化しない」にすると、通常の速度で音声合成します。

音声合成の高速化を「半数のスレッドを使用して高速化」にすると、CPU が同時処理できるスレッドの数のうち、半数のスレッドを使って同時に音声合成することにより、通常よりも高速に音声合成します。例えば、8 スレッド処理が可能な CPU を搭載したパソコンの場合、4 スレッドで同時に音声合成します。

音声合成の高速化を「全スレッドを使用して高速化」にすると、CPU が同時処理できるすべてのスレッドを使用します。「半数のスレッドを使用して高速化」よりもさらに速く音声合成できる可能性がある反面、環境によっては、「半数のスレッドを使用して高速化」よりも遅い場合があります。また、負荷が高くなるので、他のアプリケーションの処理が遅くなる可能性があります。

なお、この設定は、ダブルフラット調声プラグインと共有されます。

対応文字種

唄詠の標準機能として、以下の文字種で構成される文章を読み上げることができます（使用する調声プラグインによって異なる場合があります）。

ひらがな

以下のようなひらがなの文章を読み上げることができます。

はちみつと、りんご。

カタカナ

以下のようなカタカナの文章を読み上げることができます。

コトシモ、カラアゲ、タベル。

SAPI 5 発音記号

XML 方式で記述した文章を扱うことができるテキストスピーチソフトと組み合わせることで、SAPI 5 発音記号を読み上げることができます。

<pron sym="アオ+イ|ソ'ラ+ト|ヒロ+イ|ウ'ミ">青い空と広い海。</pron>

pron タグの sym 要素にて、SAPI 5 発音記号を指定します。発音記号として使用可能な文字については Microsoft のページを参照して下さい。使用可能な文字以外の文字が少しでも混じると読み上げが行われないので注意して下さい。

また、XML 非対応のテキストスピーチソフトで読み上げると、発音記号部分を読み上げた後、通常の文章のうちの読み上げ可能な部分のみが再度発声されますので注意して下さい。

AquesTalk 発音記号

以下の形式を用いることにより、AquasTalk 発音記号を読み上げることができます。

[AquesTalkFormat:あお+い/そ'ら+と/ひろ+い/う'み。]青い空と広い海。

[AquesTalkFormat:] タグにて、AquesTalk 発音記号を指定します。発音記号として使用可能な文字については AquesTalk 音声記号列仕様書（PDF）を参照して下さい。

この形式を用いれば、一般的なテキストスピーチソフトで AquesTalk 発音記号を読み上げることができますが、"]" によって自動的に文章を区切るテキストスピーチソフトを使用すると、発音記号部分を読み上げた後、通常の文章のうちの読み上げ可能な部分のみが再度発声されますので注意して下さい。

漢字

唄詠自体には漢字を読み上げる機能はありませんが、テキストスピーチソフトとの組み合わせにより、漢字を読み上がることが可能です。

漢字を発音記号に変換する機能を持ち、[AquesTalkFormat:] タグに対応しているテキストスピーチソフトを用いて、発音記号として読み上げを行うことにより、漢字を読み上げることができるようになります。詳しくは次章をご覧ください。

動作確認済みテキストスピーチソフト

以下の SAPI 5 対応テキストスピーチソフトの声として唄詠が使用可能であることを確認しています。

テキストスピーチ	テキストスピーチ Ver	動作	漢字	逐次	備考	唄詠 Ver	確認日
ClipReader	1.2.0.4	○	×	○		5.55	2014/03/30
Free NaturalReader	12.0.013	○	×	○		5.55	2014/03/30
SofTalk	1.93.5	○	○	○		6.11	2014/07/26
TextToWav	3.14	○	○	○	漢字読み上げ時は逐次発音がある程度まとまる	6.11	2014/07/26
棒読みちゃん	0.1.11.0 Beta15	○	○	×		5.31	2014/03/16
ゆっくり MovieMaker	3.4.3.0	○	○	×		5.31	2014/03/16

漢字列が「○」になっているテキストスピーチソフトを使うと、漢字かな交じり文を読み上げることができます。[AquesTalkFormat:] タグに対応しているためです。

逐次列が「○」になっているテキストスピーチソフトを使うと、唄詠の設定で逐次合成をすることにより、読み上げ開始までの待ち時間を減らすことができます。

個々のテキストスピーチソフトにおける使い方を以下に記載します。

SofTalk で漢字読み上げ

SofTalk Ver 1.93.5 以降を使用し、［オプション→環境設定］メニューを開きます。

「声質」タブで、唄詠音源の「唄詠」列のチェックボックスをオンにし（自動的に、「平仮名」「抑揚」のチェックも付きます）、ダイアログを閉じます。

SofTalk のメインウィンドウで声として唄詠音源を選択し、読み上げたい漢字かな交じり文を入力して再生すれば、読み上げが行われます。

なお、唄詠の設定で逐次合成を選択している場合、SofTalk の「その他」タブにある「長文に自動で句読点をつける」は無効にするほうが自然な発音になります。

TextToWav で漢字読み上げ

TextToWav 3.14 以降を使用し、［オプション→辞書を開く］メニューを開きます。

「IME」タブで「Use IME as Dictionary」のチェックボックスをオンにし、OK ボタンをクリックします。

TextToWav のメインウィンドウで声として唄詠音源を選択し、読み上げたい漢字かな交じり文を入力して再生すれば、読み上げが行われます。

棒読みちゃんで漢字読み上げ

棒読みちゃん Ver0.1.11.0 Beta15 以降を用いることにより、声質として唄詠を選択すれば、特別な設定不要で漢字かな交じり文の読み上げを行うことができます。

ゆっくり MovieMaker で漢字読み上げ

ゆっくり MovieMaker v3.4.3.0 以降を用いることにより、声質として唄詠を選択すれば、特別な設定不要で漢字かな交じり文をセリフに登録できます。

技術情報

開発者向けの情報です。

AquesTalk 発音記号を読み上げさせる

唄詠に AquesTalk 発音記号を読み上げさせるためには、テキストスピーチソフト側で SAPI の ISpVoice::Speak() をコールする際に、[AquesTalkFormat:] タグを使用します。[AquesTalkFormat:] タグは、

[AquesTalkFormat:音声記号列]元の文章

のように指定します。例えば、C++ で SAPI を使用する場合は、

hr = m_cpVoice->Speak( L"[AquesTalkFormat:にほ'ん/さ'いご+の/せいりゅう、しまんと'がわ。]日本最後の清流、四万十川", SPF_ASYNC, 0 );

のようになるでしょう。

なお、一度の Speak() で複数個の [AquesTalkFormat:] タグを含めることも可能です。

唄詠のように[AquesTalkFormat:] タグに対応した TTS エンジンであれば [AquesTalkFormat:] タグを用いて問題ありませんが、非対応の TTS エンジンに [AquesTalkFormat:] タグを送信すると、意図しない発声が行われます。

TTS エンジンが [AquesTalkFormat:] タグに対応しているかどうかを見分けるためには、TTS エンジンの属性情報「UseAquesTalkFormat」として文字列「Yes」が返ってくるかどうかを検査します。「Yes」が返ってくれば [AquesTalkFormat:] タグ対応です。もちろん、唄詠は [AquesTalkFormat:] タグ対応ですので「Yes」を返します。

【更新履歴】

2014/02/02 複数個の [AquesTalkFormat:] タグを含めること許可。

困ったときは

唄詠のサポートページをご覧ください。

お願い

ニコニコ動画

唄詠を使った動画をニコニコ動画に投稿したら、

sm23168870（唄詠　簡易説明書動画）

をコンテンツツリーの親に登録して頂けると、励みになります。どうぞよろしくお願いします。

カンパ

Amazon でお買い物をする際は、こちらのリンクにあるサーチボックスから商品を検索して頂きますと、収益の一部がカンパとして還元されます。

頂いたカンパは、唄詠などを開発するための資金に充当させて頂きます。

その他

データベース

種類別	フリーソフトウェア
名称	HANASU 支援ツール
ソフトウェア名	唄詠
ダウンロード	http://shinta.coresv.com/soft/UtaYomi_JPN.html#Download（メイン） http://shinta0806be.ldblog.jp/archives/9212448.html（バックアップ）
作者	SHINTA
作者 E メール
製品番号	SHWI-027-F

ライセンス

唄詠には以下のライセンスが適用されます。

クリエイティブ・コモンズ・ライセンス（表示 - 非営利 - 改変禁止 2.1 日本）

※営利目的で使用したい場合は、個別に応じられる場合がありますので事前にご相談下さい。

改訂履歴

唄詠の改訂履歴は以下をご覧ください。

UtaYomi_History_JPN.txt

リンク集

【唄詠使用支援中】をひろめよう！
芋川とロツ様のサイト。音源配布者、唄詠利用者、作品視聴者それぞれに向けて、唄詠を活用しやすいようにナビゲートして下さっている。
唄詠使用支援中タグ（ニコニコ動画）
唄詠での使用を積極的に支援して下さっている音源を見つけやすくするためのタグ @ ニコニコ動画。
唄詠使用支援中ハッシュタグ（Twitter）
唄詠での使用を積極的に支援して下さっている音源を見つけやすくするためのタグ @ Twitter。
唄詠コンテンツツリー（ニコニコ動画）
唄詠を実際に使用した作品を一覧できる。

※タグ類は目安ですので、内容を個別にご確認ください。