Loop Tuner 2 Alpha版 をおいておきます。
まだドキュメント書いてません。どうか、気合いで使ってください。
この日記のRSS にContentモジュールとdescription要素を含めるようにしました。
これでRSSリーダで、より簡単に内容がチェックできるようになると思います。
結局のところ、声優さんがちゃんと口を開けてしゃべっているのを音声にしたのを、また口の形に戻すってのは二度手間ですよね。やっぱりレコーディング中に口の動きをキャプチャしたほうが現実的な気がしてきました。
ちなみに、他の事例とか調べるべきなんでしょうけど、最初がお遊びから始まった企画なのであんまりよく調べてません。
未練がましくもうちょっと頑張ってみました。
口パクシーケンス生成ソフト(Julius含む) 詳しくは展開後の readme.txt を読んでください。
うーん。難しい。
本日の19:00〜20:30にかけて、kikyou.infoサーバに障害が発生し、アクセスできない状態が続きました。
大変ご迷惑をおかけしました。
原因はHDDが熱で逝った……のかなぁ。ARAID99 1000LというハードウェアRAID1ドライブを使っているのですが、両方のHDDがFailとなっていました。両方一度に逝ったわけですか?コントローラがおかしくなったのかしら。
とりあえず再起動させたら何事も無かったかのように起動しています。
ほんと、めちゃくちゃ毎日暑いですね。
これまでの成果物をおいておきます。
口パクシーケンス生成ソフト(Julius含む) 詳しくは展開後の readme.txt を読んでください。
実行に当たっては Windows XP か 2000 ぐらいのコンピュータと Perl が必要になります。
結局の所、音声から自動的に音素を拾うようにしました。こちらから「読み」を指定する必要はないです。
読みに関しては、日本語の50音+濁音、半濁音約230音が、無秩序に並ぶ、と仮定して認識を行います。普通の音声認識では、「ありがちな発音」を、日本語の実際の文章の統計や発音の統計からひっぱってきて、それに照らし合わせるのですが、これはそれをあえてやりません。もちろん、認識結果はさんざんで、
<s> みー にぇ あ さ ふ <sp> あ <sp> あ は い りゃー あ ぶ ぜ へ あ が つ え だ <sp> ん <sp> け お むー ぎ じゅ にー ちー ぎ かー は ば り お ら しぇ </s>
これ何言ってるか分かりますか?(笑)
これは「みなさん、おはよう御座います。 今日も一日 頑張りましょう」と言っているのを、これで認識させた結果です。
けれども、口パク程度には十分な認識です。
適当に画像を用意して口パクさせてみましたが、そこそこいい感じです。
微妙にタイミングがずれたり、無音部分が続くとそこがあたかも無かったかのように扱われてずれまくると言った問題は残っていますが、こればっかりやってると他のことができないので_| ̄|○ ここで挫折します。
だれかあとやってーーー!!
ボイスから口パク(クチパク)のシーケンスを自動で認識して生成できないかと結構前から思っていたのですが、大語彙連続音声認識システムJuliusを使って、いろいろとやってみています。
とりあえず Juliusディクテーション実行キット を使ってそこらのボイスをつっこんでみます。Google で「ボイス サンプル」で出てきた一番最初のページ(注:2005年6月21現在では http://moe.product.co.jp/moeos/product/huta/cg.htm [18禁] でした)にあったサンプルを入れてみましたが。
まあ、ほとんど喘ぎ声なんで認識無理ですね(^^; いや Julius が悪い訳じゃないです。
読みを与えれば、その音素の区切りを認識させるキットが Julius応用キット にあったので、それを使ってサンプルの一部を認識させてみました。
微妙にずれてますが、そこそこ認識できる模様。でも読みを指定しないといけないのがなんとも。
もっとも口パクにこれほどまでの認識精度は必要なくて、母音が大まかにどうなっているかと、特徴的な子音(mなど) が分かればよく、いわゆる「日本語で何を言ってるのか」の認識は必要ありません。Julius の 音響モデル部分だけをつかえばいいのかな。
ちなみに Loop Tuner 2 でこんな風にボイスにラベルを貼っておけば、吉里吉里で再生したときに各ラベル位置でイベントを拾えるので、口パクの同期が簡単にできるようになると思います (KAGの標準の機能として搭載するかどうかは微妙ですが )。
ちょっと仕様変更を行いたいと思います。
編集をできなくしたいと思います。記事を途中で変更されてしまうと、どこがどう変わったのかがわかりづらいためです。変更を行いたいときは、ご自分の記事に返信する形で変更点を書いてください。また、投稿するときはよく推敲し、確認をしてから投稿してください。
それと、これは諸事情有るのですが、投稿者のお名前が変わったときは、(システム側で検知できる範囲内で) 元のお名前を自動的に表示するようにします。
よろしくお願い致します。
開発を続けています。
Loop Tuner 2 ではループのための前方へのジャンプだけでなく、後方に飛ぶジャンプもサポートしていて、再生位置のジャンプを行うもの全般をリンクと呼んでいます。
で、そのリンクの調整用のウィンドウを作りました。
下側のウィンドウはリンクチューナと呼んでいますが、このウィンドウでは、中央を境に、左側にリンク前の波形、右側にリンク後の波形を表示しています。また、お互いの波形に重ね合わせて見られるようになっているので、より調整がしやすくなっていると思います。
波形のすぐ下に並んでいる12個のボタンは、波形の移動のためのボタンです。クロッシング・ポイントを探せるようにもなっています。波形はマウスによるドラッグでも移動できるようになっています。
Loop Tuner 2 については、もうそろそろアルファ版を公開できるとおもいます。
ここまでつくって吉里吉里だけに使うのはもったいないので、Loop Tuner が生成するループ情報を使って再生制御するライブラリを整備して、他の用途でも使えるようにしようかな、、、とか思っていますが。しかしTLG6の時もそうでしたが、やっぱり時間がないので、とりあえず使いたいとなったら、ソースを吉里吉里から適切に引き抜いて使ってください(^^;
サーバのメンテ終了しました。といってもDebian GNU/Linux を woody から sarge にしたというだけですが。
一カ所自分でいれたパッケージと公式のパッケージが衝突をしてたのと、md5sumの出力形式が変わっていたのを除けば、それほど大きなトラブル無く移行できました。