白 Be 2010 年 03 月

 BeOS 及びパソコン関連の日記です。といっても毎日書いているわけではありませんが(^^;)。タイトルは「はくび(白眉)」と読んで下さい。BeOS が最も優れた OS になってくれたらいいなぁ、などと期待しながら……。
 各日記の日付の部分は、その日記のアドレスへのリンクになっています。他の雑談や日記からこの日記へリンクを張る際の URL 取得用としてご利用下さい。


<< 前の白 Be ] [ 翔星 Be ランド Home ] [ 次の白 Be >>


PR

2010/03/29 うたりす進捗状況

 うたりすまとめ動画アップ後、またぼちぼち検証をしているのだが、どうやら、HANASU もいけそう。他の原因と重なって気づかなかったが、特異なピッチを手動で修正すると、それっぽくなった。

 UTAU は、エンベロープは先行発声も含めた位置で計算するが、ポルタメントは先行発声を考慮していないらしい。また、ポルタメントの x 軸の位置によってはオーバーフローを起こすが、再現の条件がいまいち不明。

 UTAU Ver 0.2.61 を使っているので、もしかしたら最近のバージョンだとオーバーフローしないのかもしれないけど、Ver 0.2.72 では先行発声 or エンベロープの x 軸の扱いが変わったようで、同じ値を指定しても結果が異なるため、移行できない。


2010/03/28 「うたりす」まとめ動画

 うたりすのこれまでの状況を動画にまとめてみた


2010/03/26 B 再出発

 ピッチ取得がうまくいったように見えたのは幻だったらしい。振り出しに戻る。

 だがしかし、ASAnalyzer というものを発見。これでいけそうだ。


2010/03/26 A うたりす、とりあえず出来た

 いろいろと問題はあるものの、お手本 WAVE の音量(エンベロープ)とポルタメント(ピッチ)を UTAU データに反映させることに成功。

 ちょっと使ってみよう。


2010/03/25 ピッチいじくれそう

 うたりすのピッチ反映は、基礎的な部分についてはできそうな感じになってきた。今週末にある程度形になるといいな……。


2010/03/24 アンテナバグってる?

 翔星 Be アンテナ、やたらとサイトが更新されているのだが。


2010/03/22 音量が設定できるようになったようだ

 うたりすでお手本 WAVE の音量を UTAU に反映できるようになった。

 残念ながら、思っていたほどの効果はない感じ。UTAU のビジュアル上はエンベロープの線が上下していて、パラメータいじってる感があるんだけれども、WAVE にレンダリングしてみると、あんまり違いが出ない。無調声より少し自然になったかなぁ? くらいのもの。

 ピッチいじくる方は効果あるかしらん……。それ以前に、実装できるかが問題だけど。


2010/03/21 B うたりす進捗状況

 まずは簡単そうなところからということで、お手本 WAVE から音量を設定する部分を実装中。

 思ったより大変。UTAU 本体から渡されるエンベロープのパラメータ記述にクセがあり、受け渡しルーチンの記述に時間がかかった。音量の解析も思った以上に大変で、小さくなりすぎたり、大きくなりすぎたり。

 それでもなんとか形になってきて、それっぽい音量を設定できるところまでは到達。

 でもまだまだ、やることは山積み。例えば、UTAU はデフォルトパラメータを渡してくれないので、先行発声などがユーザー指定されていない場合、自力で原音設定を解析して値を取得しなくてはならない。次はその辺の実装かな。


2010/03/21 A 今年も GSoC の季節になったか

 個人的に、テーマの中で是非とも実現して欲しいのは、

で、実装されると面白そう(新しいアプリが登場しそう、可能性が広がりそう)なのは、 かな。


2010/03/15 うたりすを開発してみんとす

 Vocaloid にぼかりすがあるのなら、UTAU にうたりすがあってもいいんジャマイカ。ということで、開発に乗り出してみる。とは言っても、ぼかりすみたいなすんごいのは無理。トレースできそうなのは音量とピッチぐらいかな。手で調声する前の下ごしらえとして使えれば。

 UTAU な方々には、周波数トレーサーの Mode 2 版と説明すればイメージ近いかも。

 普段 Mode 2 で使っているので、やっぱり Mode 2 用の自動調整アシストが欲しいんだよね。Mode 2 は Mode 1 と比べるとピッチを細かく指定できないので、うたりすも「ある程度」のトレースになるはず。それでも歌唱用としては実用レベルになるのでは? HANASU 用としては使えなさそうだけど。

 欠点しかないのではアレなので長所も。うたりすでは、周波数解析や原音設定の作業を行わずに自動調声できるようにするつもり。つまり、前準備無しで、お手本 WAVE を指定して実行ボタンを押すだけで使えると。

 まぁ、実際はどうなるかわからないけど、イメージはこんな感じ。

 開発の進捗状況としては、テストプログラムにて、UTAU 本体との通信、パラメータ解釈、WAVE の再生を確認。これから、うたりすの開発に着手するところ。


2010/03/13 B USB マスストレージ祭り開催

 メイン環境を r35765 に更新したのを機に、家中の USB マスストレージ対応機器を Haiku につないでみた。

 これまでの Haiku は、USB マスストレージを認識しなかったり、認識しても動作が遅かったり KDL へご招待されてしまったりと、USB サポートが弱い部分があったが、今回、だいぶ改善されたのを実感。

 USB メモリは安定して利用できるし、SD などのメモリカードリーダーも読み込み専用ながら利用できる。不安定の極みだった携帯電話も、安定して利用できた。USB ハブ経由でも問題なし。

 認識したりしなかったり、という機器が若干あるのと、メモリカードリーダーが読み込み専用になってしまうのは今後の課題。また、ソニーと相性が悪いらしく、ソニー系の機器は 2 つとも認識しなかった。

 詳細は JPBE.net のハードウェア互換データベースに登録したので、そちらをどうぞ。

【 完全動作・実用十分 】


【 動作するがイマイチ 】

【 動作せず 】

 キヤノンのデジカメ PowerShot S90 は PC と USB 接続できるが、マスストレージ対応では無い模様。Windows でも、ドライブとしてではなくカメラとして認識される。PTP とかいう規格かな?

 皆さんも是非、いろいろな USB 機器を試してみて下さい!


2010/03/13 A ブックマークが bookmarks.html じゃないとな?

 Firefox 2 までは、ブックマークは bookmarks.html として保存されていたけれど、Firefox 3 では違うらしい。Firefox 3 のブックマークを HTML 形式で保存したい場合は、ブックマークの管理でエクスポートする。

 Haiku を入れ替えると、Firefox の設定も消える。通常はプロファイルフォルダを丸ごとバックアップしておいて復元するのだけど、プロファイルも過去の遺産がいっぱいで不要なデータもあるんだろうな〜なんて思って、今回はクリーンな環境を作ることにした。

 ブックマークだけは Windows の Firefox から持ってこようと思って、あれれ? ってなった次第。


2010/03/10 B v.Connect

 Vocaloid 音源や UTAU 音源を、音声処理エンジン「STRAIGHT」を用いてレンダリング(歌唱合成)する v.Connect なるツールを発見。作例を見ると出来が良い。

 v.Connect と v.ConnectVCV、どちらが正式名称なのだろう?


2010/03/10 A UTAU プラグインの起動

 UTAU のプラグインは、プラグインフォルダにある plugin.txt の中にプラグインのファイル名を記述することにより、プラグインを指定する。

 ビルドする度にプラグインフォルダに exe をコピーするのも手間なので、なんとかならないか実験してみたが……。

 まずは、Test.exe をショートカットにしてみた。plugin.txt で Test.exe を指定するが、実は Test.exe はショートカットで、ビルドした別のフォルダにある Test.exe を指しているという。しかし残念ながら、UTAU はショートカットをプラグインとして扱ってくれなかった。Haiku はショートカットの解決がものすごく楽(BEntry の引数を true にするだけ)だが、Windows はかなりの手順を踏まないといけないから、なかなか実装されないのだろう。

 次に、plugin.txt で、Test.exe の場所をフルパスで指定してみた。……が、これもダメ。同じフォルダ内でないと読んでくれない模様。

 むーん、ビルドする度に、いちいちコピーか……と思ったが、逆に、Turbo C++ でビルドする際に、UTAU プラグインフォルダに出力するようにプロジェクト設定することで解決。ふぅ。


2010/03/08 B ぼかりすの UTAU 版は無いのかな?

 調教・調声支援ツールや、自動歌唱ツールを探してみた。

【 ぼかりす(VocaListener) 】

 Vocaloid 調声支援ツール。この手のツールで一番メジャー。というか今までこれしか知らなかった。

 人間が歌った WAVE を食わせると、そのニュアンス通りに Vocaloid を歌わせてくれる。非公開の単体ソフトでスタートし、現在は商用の「Net ぼかりす」として Web サービスになっている。

 開発は産総研の後藤真孝氏。自分の通っていた大学にも一時期在籍していたらしく、友達は顔知ってた模様。曰く、音声処理分野ではかなり有名な方らしい。いわばプロ中のプロが作ったツール。故に、調声結果もかなりのもので、機械っぽさがほとんど無い。歌い方が人間っぽいのに、声がミクでちょっと機械っぽいので、逆に違和感が出てしまう面があり、好き嫌いは分かれるようだ。

【 Sinsy 】

 完全自動歌唱ツール。無料の Web サービスとして公開されており、MusicXML という形式で楽譜データを渡すと、歌唱音声ファイルを返してくれるらしい。開発は名古屋工業大学の徳田恵一教授(?)。

 デモを聞いてみると、こちらも自然に聞き取れるクオリティとなっている。音源が思いっきりロボ声だが、清々しいほどロボ声に振ってあるので、ぼかりすと違ってロボと人間の狭間という意味の違和感は無い。

 アルゴリズムとしては隠れマルコフモデル(HMM)を使っている模様。と言っても、それが何なのか分からん(笑) 昔お手伝いしていた手書き文字認識ソフトも HMM 使ってたし、HMM って応用範囲広いのね。こんなことなら授業でちゃんと HMM 勉強しておけば良かった……。

以上。


 他にもこの手のツールをご存じでしたら教えて下さい。

 ぼかりすの UTAU 版みたいなツールは無いのかな? おま☆かせはどちらかといえば Sinsy に近い使い勝手で、これはこれですごいんだけども。それから、テキスト読み上げについてはピグマリオン計画というすごいのがある。

 ぼかりすの UTAU 版が無いなら、ちょっと実験してみようかな? 音声処理の知識全くないけど。音量とピッチくらいを自分の歌唱に合わせることができるようになれば、調声のベースとして使えそう。今は Haiku の開発環境が使えない状態だし、久しぶりに Windows プログラミングもいいかも。


2010/03/08 A 最速 SSD 登場

 SATA 3.0 (6Gbps) SSD の「Real SSD C300」が登場。こことかここによれば、

というスピードが出ている。シーケンシャルライトは公称の 215MB/s に届いてなくて、SATA 3.0 HDD にちょっと負けてる気がしないでもないけど、他は圧倒的。夢のデバイスだ。


2010/03/07 r35765 に更新

 メイン環境の Haiku を r32040 から r35765 に更新。半年以上振りの更新だと、隔世の感すらただよう。

 NTFS パーティションにもアクセスできるようになって、データ共有が楽になった。

 installoptionalpackage というコマンドが用意されていて、オプショナルパッケージを簡単にインストールできる。

installoptionalpackage -a BeZillaBrowser
とかね。これまでは自分で Haiku をビルドする際に UserBuildConfig でオプショナルパッケージを指定したり、あるいは、Haiku インストール後に手動でダウンロード・解凍していたのが、これを使えば簡単。ただ、Haiku に不慣れな人は、初期状態でブラウザが無い時点で使うのやめてしまう気がするので、ブラウザだけは配布イメージに入れておくべきのような。

 起動時間(OS 読み込み始めてから DeskBar が表示されるまで)は 32 秒。ちょっと長い。また、eSATA や SoundBlaster Audigy4 は相変わらず認識してくれない。

 困ったのは、開発環境が配信停止になっていること。オプショナルパッケージの Development が無い。Anthy のビルドもエラーになる。


2010/03/06 画面変なの直った

 r35765 を起動してみたら、描画が変なのが直っていた。

 eSATA は相変わらず認識してくれないけれど、eSATA 繋いでいると起動が遅くなる現象は直っているので、メイン環境を最新版に更新しよう。


2010/03/05 OSC 2010 Tokyo/Spring

 オープンソースカンファレンス 2010 Tokyo/Spring に行ってきた。今回は都心ではなく多摩での開催で、会場は明星大学。京王線多摩動物公園駅から歩いてちょっとのところ。

 今回はセッションを聞いてみた。最初は ZFS の話。サーバー向きのファイルシステム(?)で、ディスクの追加の際の手間が少ないらしい。BFS を越える 128 ビットファイルシステム。スナップショット(ある時点でのディスクの中身の論理的なコピー)も撮れるんだとか。

 2 つ目は、Endian Firewall の話。ファイアーウォールというと、個々の PC に載っているソフトを思い浮かべてしまうが、今回の話は、業務用のハードウェアファイアーウォール。といっても、中身は Linux で、そこでファイアーウォール関連のいろんなソフトが動いている。ファイアーウォール専用 PC みたいな感じ。Endian Firewall は Linux なのでいろいろいじれるよ〜的な。

 インストールマニアックス 3 というイベントの決勝戦も行われていた。これは、Windows サーバーにいくつ OSS をインストールできるかを競う競技。制限時間 2 時間。最初の方しか見てないけど、ソフトのダウンロードから始めるので、結構時間かかる感じ。



<< 前の白 Be ] [ 翔星 Be ランド Home ] [ 次の白 Be >>


最初前先頭次最後ホーム