はじめに

概要

唄詠(うたよみ)は、テキストスピーチソフト(棒読みちゃんなど)の声として、UTAU 音源(重音テトなど)を当てられるようにするためのソフトです。

テキストスピーチソフトに文章を入力するだけで、お気に入りの音源にしゃべらせる(HANASU)ことができるようになるため、調声が不要で手軽です。棒読み状態となるためリアルな表現には不向きですが、短時間で多くのセリフをしゃべらせたい場合などに力を発揮します。

動作環境

唄詠公式ページのサポート情報をご覧ください。

必要なもの

唄詠を使うためには、唄詠の他に、以下の物が必要となりますので、別途用意して下さい。

インストール

唄詠のインストールは、ダウンロードした zip ファイルを解凍するだけで完了です。

前節の必要なソフトについては、各ソフトのインストール方法に従ってインストールして下さい。

使い方クイックガイド

大きな流れとしては、

となります。

UTAU 音源の登録

UTAU 音源に文章を読み上げさせる(HANASU)ために、まず、UTAU 音源を登録します。

唄詠(UtaYomi.exe)を起動します。メインウィンドウは右のような画面となります。初期状態では、音源は登録されておらず、リストは空欄になっています。

「新規登録」ボタンをクリックすると、音源の新規登録画面となります。

「音源名(設定名)」には、これから登録しようとする UTAU 音源の内容が分かりやすいような名前を入力します。この欄を空欄にしておいても、次の「oto.ini の場所」を入力すると自動的に入力されますので、ひとまず空欄にしておいても構いません。

「oto.ini の場所」には、UTAU 音源に付属している oto.ini ファイルの場所(フルパス)を入力します。エクスプローラーなどから oto.ini をドラッグ&ドロップすれば、場所が入力されます。

UTAU 音源は、日本語音源であれば、単独音音源、連続音音源、CVVC 音源(単独音音源扱い)のいずれも使用可能ですが、発音が滑らかになる連続音音源をおすすめします。

なお、調声プラグインにもよりますが、デフォルトの調声プラグイン「やまなみ」の場合は、サブフォルダにも oto.ini がある音源の場合に音源の最上位フォルダの oto.ini を指定すれば、サブフォルダの oto.ini も自動的に読み込みます。

「声質」および「年代」では、音源の基本的な属性を指定します。デフォルトの調声プラグインの場合、この属性によって声の高さが変わります。

「調声プラグイン」で調声に使用するプラグインを指定します。プラグインによって話し方が変わります。「設定」ボタンをクリックすると、調声プラグイン固有の設定を行うことができます。詳しくは、調声プラグインの設定章を参照して下さい。

すべてを入力し終えたら、「OK」ボタンをクリックします。音源が登録され、メインウィンドウのリストに項目が追加されます。音源登録時には管理者権限が必要ですので、管理者の ID とパスワードを入力して下さい。

なお、まれに、「唄詠音源をシステムに登録しました」と表示されたにもかかわらず、メインウィンドウのリストに項目が追加されない現象が発生することがあります。そのような場合は、トラブルシューティングを参照して下さい。

音源登録前に、どんな感じでしゃべるのか試聴することもできます。「試聴」ボタンをクリックすると、管理者権限登録の後に試聴できます。

まだ自分が持っていない新しい音源を使ってみたいと思ったら、「音源検索」ボタンで、音源検索ウェブサイトにジャンプできます。詳しくは音源の検索章を参照して下さい。

なお、音源の登録が完了したら、唄詠は終了して構いません(文章読み上げの際に唄詠が起動している必要はありません)。

テキストスピーチソフトで読み上げ

音源の登録が完了したら、実際に UTAU 音源で読み上げを行います。

読み上げには、テキストスピーチソフトを使います。

SAPI 5 に対応したテキストスピーチソフトを起動します。ここでは、棒読みちゃんを例として説明します。

「声質」を選ぶドロップダウンリストに、先ほど登録した UTAU 音源が列挙されていますので、UTAU 音源を選択します。

テキストボックスに、読み上げたい文章を入力します。テキストスピーチソフトが棒読みちゃんの場合は、漢字かな交じり文を読み上げることができます。対応文字の詳細については「対応文字種」章をご覧ください。

音声合成ボタンをクリックして、少し待つと、入力された文章が UTAU 音源の声で読み上げられます。

以上で、一通り読み上げまでの操作ができるようになりました。

再生までに時間がかかる場合は、設定の中の発生のタイミングや、プラグイン設定の中の音声合成の高速化を変更すると良いでしょう。

他者の前例(既存の唄詠利用作品)を見て参考にしたい場合は、ニコニコ動画の唄詠コンテンツツリーを参照してみましょう。

しばらく唄詠を使い、操作に習熟した後は、ワンランク上の読み上げを目指してみるのもいいかもしれません。


音源の検索

UTAU 音源は 5,000 種類以上存在すると言われており、唄詠はそのほとんどを使うことができます。UTAU 音源はそれぞれ利用規約がことなるので、目的に合った規約かどうか確認してから使って下さい。

様々な音源があるのは有り難いのですが、多すぎて、何の手がかりもなくイメージ通りの音源を探すのは困難かもしれません。そんな時は、「UTAU 音源 声質検索」サイトを活用してみてはいかがでしょうか。

このサイトは、UTAU 音源を、「しゃべった時の声質」から検索することができます。例えば、「女声」「男声」といった声の性別や、「明るい」「力強い」などの声の雰囲気を表すタグから検索できます。また、UTAU 音源声質アンケートの結果から検索することもできます。

検索結果や音源情報ページでは、唄詠でしゃべらせた時のサンプルボイスも聴けますので、音源をダウンロードしなくても、声の雰囲気を確認することができます。

このサイトは、どなたでも登録・編集ができます。声の雰囲気を表すタグを追加したり、自分がしゃべらせた唄詠ボイスをサンプルボイスとして追加したりして、情報の充実にご協力をお願いします。

唄詠使用支援中

前章で説明した「UTAU 音源 声質検索」サイトは、唄詠使用支援中の音源を対象として検索します。

唄詠使用支援中の音源というのは、文字通り、UTAU 音源の製作者が唄詠を支援する気持ちを表明して下さっている音源です。唄詠使用支援中の音源であれば、安心して唄詠で使うことができるでしょう。なお、唄詠使用支援中でないからといって、唄詠で使えないわけではありません。あくまでも音源の利用規約が正となります。

唄詠使用支援中の詳細については、支援サイト「【唄詠使用支援中】をひろめよう!」を参照して下さい。

唄詠使用支援中の音源は、ニコニコ動画の唄詠使用支援中タグ検索で見つけることができます。新たに唄詠を支援して下さる UTAU 音源製作者の方は、支援サイトをご覧の上、音源配布動画にて「唄詠使用支援中」タグロックをお願いします。

機能説明

音源の登録情報修正

メインウィンドウで音源を選択した後、「修正」ボタンをクリックすると、既に登録した音源の情報を修正することができます。

修正画面での入力方法は、新規登録画面と同様です。

音源の登録抹消

メインウィンドウで音源を選択した後、「登録抹消」ボタンをクリックすると、唄詠で使用する音源としての登録を抹消することができます。

なお、登録抹消を行っても、UTAU 音源のファイル自体が消えるわけではありません。あくまでも、唄詠(ないしはテキストスピーチソフト)で使用できなくなるというだけです。

旧仕様の音源

メインウィンドウの音源一覧において、旧バージョンの唄詠で登録した音源が「旧唄詠仕様」と表示されることがあります(テキストスピーチソフトの声選択時には表示されません)。

旧仕様の音源でも基本的な読み上げを行うことはできますが、最新バージョンの機能を活かせないことがありますので、最新仕様にすることをお薦めします。

旧仕様の音源を最新仕様にするには、音源の修正画面にて、再度登録をするだけで完了します。

設定

メインウィンドウで「設定」ボタンをクリックすると、設定ウィンドウが表示され、唄詠全般の動作に関する設定を変更することができます。

発声のタイミング

「発声のタイミング」では、音声合成と発声を並行で行うかどうかを設定します。

発声のタイミングを「一括合成」にすると、しゃべらせたい文章全体を音声合成してから発声します。発声までのタイミングは長くなります。

発声のタイミングを「逐次合成」にすると、指定した文字の音声合成が終わり次第、発声します。発声までのタイミングが短くなりますので、快適に利用できます。ただし、一部のテキストスピーチソフトは逐次合成に対応していません。また、お使いのパソコンの性能が低いと、途中で発声が一時停止し、プチプチとすることがあります。

最新情報の確認

「唄詠の最新情報・更新版を自動的に確認する」を有効にすると、唄詠のホームページから唄詠関連の最新情報を取得し、更新情報がある場合は、ブラウザで表示します。また唄詠の更新版(新バージョン)がリリースされた場合は、更新版をインストールします。Ver 7.6 現在、最新情報の確認は 3 日ごとに行います。

最新情報表示・更新版のインストール前には、表示・インストールをするかどうかの確認が行われます。表示・インストールをしないを選択した場合、次回以降は表示されませんのでご注意下さい。

「今すぐ最新情報を確認する」ボタンをクリックすると、直ちに確認が行われます。

なお、唄詠に限らず、世の中のアプリケーション全般に言えることですが、最新情報の取得や更新版のインストールを行う設定を有効にしている場合、悪意ある第三者に配信サーバーが乗っ取られた場合など、誤情報や悪意あるアプリケーションなどが紛れ込むリスクがありますのでご注意下さい。しかし一方で、正常に機能していれば、バグ修正が速やかに適用されるなど、安全性が高まるメリットもあります。

唄詠コンポーネントの互換性をチェックする

唄詠は複数のファイル群から構成されており、これらのファイルの互換性(バージョン)が統一されている必要があります。通常はバージョンは統一された状態であるはずですが、何らかの原因で、バージョンが不統一になっていないかを確認するための項目です。

「今すぐ互換性を確認する」ボタンをクリックすると、互換性の確認が行えます。

バージョンが異なる旨の表示がされた場合は、「唄詠を再インストールする」ボタンをクリックして、唄詠のダウンロードおよびインストールを行って下さい(バージョンは自動的に最新版になります)。

唄詠の自動更新が中断された場合も、「唄詠を再インストールする」を行って下さい。

音源設定を外部に保存する・外部から読み込む

登録した音源の情報は、OS 再インストールなどを行うと消えてしまいますので、定期的に USB メモリなどの外部メディアに保存すると良いでしょう。

また、複数のパソコンで唄詠を利用している方は、外部保存機能を使うことにより、音源設定を別のパソコンに持ち出すことができて便利です。

音源設定を保存するには、「エクスポート」ボタンをクリックします。表示されるダイアログで、保存するファイル名を指定して下さい。

保存した音源設定を読み込むには、「インポート」ボタンをクリックします。表示されるダイアログで、以前に保存したファイルを指定して下さい。

ファイルに保存されている音源情報と同じ名前の音源が既に登録されていた場合は、インポートが行われませんので注意して下さい。

また、インポート後は、必ず、音源設定画面で、設定内容を確認して下さい。特に、デフォルト調声プラグインの WavTool の場所などは、環境が変わるとそのままでは動かない可能性があります。

ログを保存する

唄詠の動作の記録であるログなどを保存することができます。唄詠に不具合があった場合の原因究明などに役立つ場合があります。

調声プラグインの設定

ダブルフラット調声プラグイン

ダブルフラット調声プラグインを使うと、ストレートな感じの読み上げを行うことができます。一部で能やお経とも言われる、独特の節回しが特徴的な話し方になります。

ダブルフラット調声プラグインを使用した読み上げサンプル:

ダブルフラット調声プラグインの設定項目は、やまなみ調声プラグインと同様ですので、やまなみ調声プラグインを参照して下さい。

やまなみ調声プラグイン

やまなみ調声プラグインは、「ニュートラルな読み上げ」をコンセプトとして開発された調声プラグインです。ダブルフラット調声プラグインよりも、少し普通のナレーションに近づいた読み上げをします。

やまなみ調声プラグインを使用した読み上げサンプル:

唄詠の音源登録画面において、調声プラグインを「やまなみ」にしたうえで、「設定」ボタンをクリックすると、右の設定画面が表示されます。

画面の上半分が音源の設定で、下半分がやまなみプラグイン共通設定(音源に関係なくプラグイン自体の動作を設定)です。

やまなみプラグインを使う際は、音源は連続音音源が推奨されています。

音源の設定

「wavtool の場所」には、UTAU に付属している wavtool.exe の場所(フルパス)を入力します。エクスプローラーなどから wavtool.exe をドラッグ&ドロップすれば、場所が入力されます。標準的な UTAU のインストールをした場合は、自動的に入力されているはずです。また、次回以降の音源登録では、最後に登録した際の wavtool が自動的に入力されます。

「resampler の場所」には、UTAU に付属している resample.exe の場所(フルパス)を入力します。エクスプローラーなどから resample.exe をドラッグ&ドロップすれば、場所が入力されます。標準的な UTAU のインストールをした場合は、自動的に入力されているはずです。また、次回以降の音源登録では、最後に登録した際の resample が自動的に入力されます。

「resampler のフラグ」は resampler に渡すフラグを指定します。UTAU においては、プロジェクトの設定で「生成時オプション」として指定しているものです。

「モジュレーション」は UTAU の mod に相当するパラメーターで、単位は % です。原音のピッチ揺れをどの程度発声に反映させるかを指定します。モジュレーションを 0 にすると、原音のピッチが不安定でも、一定の音域で発音されます。

「低音」および「高音」は、話す際の上下の音を指定します。アクセントのある音が「高音」、それ以外が「低音」です。初回設定時、音源登録画面の「声質」「年代」から自動的に設定されますが、ここで手動で変更することにより、好みの音の高さにすることができます。「ピアノ」ボタンをクリックすると、ピアノ画面で直感的に音の高さを指定することができます。

やまなみ共通の設定

「音声合成の高速化」は、CPU の性能を活用して高速に音声合成するかどうかを設定します。

音声合成の高速化を「高速化しない」にすると、通常の速度で音声合成します。

音声合成の高速化を「半数のスレッドを使用して高速化」にすると、CPU が同時処理できるスレッドの数のうち、半数のスレッドを使って同時に音声合成することにより、通常よりも高速に音声合成します。例えば、8 スレッド処理が可能な CPU を搭載したパソコンの場合、4 スレッドで同時に音声合成します。

音声合成の高速化を「全スレッドを使用して高速化」にすると、CPU が同時処理できるすべてのスレッドを使用します。「半数のスレッドを使用して高速化」よりもさらに速く音声合成できる可能性がある反面、環境によっては、「半数のスレッドを使用して高速化」よりも遅い場合があります。また、負荷が高くなるので、他のアプリケーションの処理が遅くなる可能性があります。

なお、この設定は、ダブルフラット調声プラグインと共有されます。

対応文字種

唄詠の標準機能として、以下の文字種で構成される文章を読み上げることができます(使用する調声プラグインによって異なる場合があります)。

ひらがな

以下のようなひらがなの文章を読み上げることができます。

はちみつと、りんご。

カタカナ

以下のようなカタカナの文章を読み上げることができます。

コトシモ、カラアゲ、タベル。

SAPI 5 発音記号

XML 方式で記述した文章を扱うことができるテキストスピーチソフトと組み合わせることで、SAPI 5 発音記号を読み上げることができます。

<pron sym="アオ+イ|ソ'ラ+ト|ヒロ+イ|ウ'ミ">青い空と広い海。</pron>
pron タグの sym 要素にて、SAPI 5 発音記号を指定します。発音記号として使用可能な文字については Microsoft のページを参照して下さい。使用可能な文字以外の文字が少しでも混じると読み上げが行われないので注意して下さい。

また、XML 非対応のテキストスピーチソフトで読み上げると、発音記号部分を読み上げた後、通常の文章のうちの読み上げ可能な部分のみが再度発声されますので注意して下さい。

AquesTalk 発音記号

以下の形式を用いることにより、AquasTalk 発音記号を読み上げることができます。

[AquesTalkFormat:あお+い/そ'ら+と/ひろ+い/う'み。]青い空と広い海。
[AquesTalkFormat:] タグにて、AquesTalk 発音記号を指定します。発音記号として使用可能な文字については AquesTalk 音声記号列仕様書(PDF)を参照して下さい。

この形式を用いれば、一般的なテキストスピーチソフトで AquesTalk 発音記号を読み上げることができますが、"]" によって自動的に文章を区切るテキストスピーチソフトを使用すると、発音記号部分を読み上げた後、通常の文章のうちの読み上げ可能な部分のみが再度発声されますので注意して下さい。

漢字

唄詠自体には漢字を読み上げる機能はありませんが、テキストスピーチソフトとの組み合わせにより、漢字を読み上がることが可能です。

漢字を発音記号に変換する機能を持ち、[AquesTalkFormat:] タグに対応しているテキストスピーチソフトを用いて、発音記号として読み上げを行うことにより、漢字を読み上げることができるようになります。詳しくは次章をご覧ください。

動作確認済みテキストスピーチソフト

以下の SAPI 5 対応テキストスピーチソフトの声として唄詠が使用可能であることを確認しています。

テキストスピーチテキストスピーチ
Ver
動作漢字逐次備考唄詠
Ver
確認日
ClipReader1.2.0.4×5.552014/03/30
Free NaturalReader12.0.013×5.552014/03/30
SofTalk1.93.56.112014/07/26
TextToWav3.14漢字読み上げ時は逐次発音がある程度まとまる6.112014/07/26
棒読みちゃん0.1.11.0 Beta15×5.312014/03/16
ゆっくり MovieMaker3.4.3.0×5.312014/03/16

漢字列が「○」になっているテキストスピーチソフトを使うと、漢字かな交じり文を読み上げることができます。[AquesTalkFormat:] タグに対応しているためです。

逐次列が「○」になっているテキストスピーチソフトを使うと、唄詠の設定で逐次合成をすることにより、読み上げ開始までの待ち時間を減らすことができます。

個々のテキストスピーチソフトにおける使い方を以下に記載します。

SofTalk で漢字読み上げ

SofTalk Ver 1.93.5 以降を使用し、[オプション→環境設定]メニューを開きます。

「声質」タブで、唄詠音源の「唄詠」列のチェックボックスをオンにし(自動的に、「平仮名」「抑揚」のチェックも付きます)、ダイアログを閉じます。

SofTalk のメインウィンドウで声として唄詠音源を選択し、読み上げたい漢字かな交じり文を入力して再生すれば、読み上げが行われます。

なお、唄詠の設定で逐次合成を選択している場合、SofTalk の「その他」タブにある「長文に自動で句読点をつける」は無効にするほうが自然な発音になります。

TextToWav で漢字読み上げ

TextToWav 3.14 以降を使用し、[オプション→辞書を開く]メニューを開きます。

「IME」タブで「Use IME as Dictionary」のチェックボックスをオンにし、OK ボタンをクリックします。

TextToWav のメインウィンドウで声として唄詠音源を選択し、読み上げたい漢字かな交じり文を入力して再生すれば、読み上げが行われます。

棒読みちゃんで漢字読み上げ

棒読みちゃん Ver0.1.11.0 Beta15 以降を用いることにより、声質として唄詠を選択すれば、特別な設定不要で漢字かな交じり文の読み上げを行うことができます。

ゆっくり MovieMaker で漢字読み上げ

ゆっくり MovieMaker v3.4.3.0 以降を用いることにより、声質として唄詠を選択すれば、特別な設定不要で漢字かな交じり文をセリフに登録できます。

技術情報

開発者向けの情報です。

AquesTalk 発音記号を読み上げさせる

唄詠に AquesTalk 発音記号を読み上げさせるためには、テキストスピーチソフト側で SAPIISpVoice::Speak() をコールする際に、[AquesTalkFormat:] タグを使用します。[AquesTalkFormat:] タグは、

[AquesTalkFormat:音声記号列]元の文章
のように指定します。例えば、C++ で SAPI を使用する場合は、
hr = m_cpVoice->Speak( L"[AquesTalkFormat:にほ'ん/さ'いご+の/せいりゅう、しまんと'がわ。]日本最後の清流、四万十川", SPF_ASYNC, 0 );
のようになるでしょう。

なお、一度の Speak() で複数個の [AquesTalkFormat:] タグを含めることも可能です。

唄詠のように[AquesTalkFormat:] タグに対応した TTS エンジンであれば [AquesTalkFormat:] タグを用いて問題ありませんが、非対応の TTS エンジンに [AquesTalkFormat:] タグを送信すると、意図しない発声が行われます。

TTS エンジンが [AquesTalkFormat:] タグに対応しているかどうかを見分けるためには、TTS エンジンの属性情報「UseAquesTalkFormat」として文字列「Yes」が返ってくるかどうかを検査します。「Yes」が返ってくれば [AquesTalkFormat:] タグ対応です。もちろん、唄詠は [AquesTalkFormat:] タグ対応ですので「Yes」を返します。

【更新履歴】

困ったときは

唄詠のサポートページをご覧ください。

お願い

ニコニコ動画

唄詠を使った動画をニコニコ動画に投稿したら、

をコンテンツツリーの親に登録して頂けると、励みになります。どうぞよろしくお願いします。

カンパ

Amazon でお買い物をする際は、こちらのリンクにあるサーチボックスから商品を検索して頂きますと、収益の一部がカンパとして還元されます。

頂いたカンパは、唄詠などを開発するための資金に充当させて頂きます。

その他

データベース

種類別フリーソフトウェア
名称HANASU 支援ツール
ソフトウェア名唄詠
ダウンロードhttp://shinta.coresv.com/soft/UtaYomi_JPN.html#Download(メイン)
http://shinta0806be.ldblog.jp/archives/9212448.html(バックアップ)
作者SHINTA
作者 E メール
製品番号SHWI-027-F

ライセンス

唄詠には以下のライセンスが適用されます。


※営利目的で使用したい場合は、個別に応じられる場合がありますので事前にご相談下さい。

改訂履歴

唄詠の改訂履歴は以下をご覧ください。

リンク集

※タグ類は目安ですので、内容を個別にご確認ください。

はじめに
概要
動作環境
必要なもの
インストール
使い方クイックガイド
UTAU 音源の登録
テキストスピーチソフトで読み上げ
音源の検索
唄詠使用支援中
機能説明
音源の登録情報修正
音源の登録抹消
旧仕様の音源
設定
調声プラグインの設定
ダブルフラット調声プラグイン
やまなみ調声プラグイン
対応文字種
ひらがな
カタカナ
SAPI 5 発音記号
AquesTalk 発音記号
漢字
動作確認済みテキストスピーチソフト
技術情報
AquesTalk 発音記号を読み上げさせる
困ったときは
お願い
ニコニコ動画
カンパ
その他
データベース
ライセンス
改訂履歴
リンク集

△ページの先頭へ