W.Deeの2005年6月の日記

kikyou.info»日記
最新月 : 2008年10月
2003年 [             3    4    5    6    7    8    9   10   11   12  ] 月
2004年 [   1    2    3    4    5    6    7    8    9   10   11   12  ] 月
2005年 [   1    2    3    4    5    6    7    8    9   10   11   12  ] 月
2006年 [   1    2    3    4    5    6    7    8    9   10   11   12  ] 月
2007年 [   1    2    3    4    5    6    7    8    9   10   11   12  ] 月
2008年 [   1    2    3    4    5    6    7    8    9   10   11   12  ] 月
2009年 [   1    2    3    4    5    6    7    8    9   10   11       ] 月
前月の日記  次月の日記

2005年6月28日

Loop Tuner 2 alpha

Loop Tuner 2 Alpha版 をおいておきます。

まだドキュメント書いてません。どうか、気合いで使ってください。

  • 2005-06-30 23:55 DauGe : http://pianosdauge.org/BGM/LoopTunerHint.zip  ドキュメントってほどじゃないですけど、サンプルつきで書いてみました。
  • 2005-06-30 23:59 DauGe : ありゃ。セーブするとフラグはリセットされるんですね。失礼しました。
  • 2005-07-01 16:09 W.Dee : ウホッ

2005年6月27日

日記のRSSにcontentとdescription追加

この日記のRSSContentモジュールとdescription要素を含めるようにしました。

これでRSSリーダで、より簡単に内容がチェックできるようになると思います。

2005年6月26日

口パクシーケンスの自動生成 その4

結局のところ、声優さんがちゃんと口を開けてしゃべっているのを音声にしたのを、また口の形に戻すってのは二度手間ですよね。やっぱりレコーディング中に口の動きをキャプチャしたほうが現実的な気がしてきました。

ちなみに、他の事例とか調べるべきなんでしょうけど、最初がお遊びから始まった企画なのであんまりよく調べてません。

  • 2005-06-28 05:17 たにみちNON : うーむ。ゲームとかだとズレまくりが基本っすね(コンシューマーですら)所謂リップシンクは手間がかかるせいで日本だとAKIRAぐらいしか思い浮かびません。平成狸合戦ぽんぽこもプレスコ(音声先取り)だったはずだけどリップシンクしてた記憶はあまりないなあ。
  • 2005-06-28 05:19 たにみちNON : ちなみにゲームならではで思いついたのですが、テキストの表示速度を音の時間から逆算してシンクロさせる、ってぇのもこの派生でできませんかね? 生理的に気持ちいいような気がする。
  • 2005-06-28 05:21 たにみちNON : テキストスピードによる演出は逆転裁判とかで(古くはToHeartとかでもやってたな)効果的にやってましたが、ボイスの所はどうしようもないのがネックでして。
  • 2005-06-28 10:39 W.Dee : ボイスとテキストの同期ですか、おもしろそうですね。Juliusに「アラインメント」という機能があって、音素や単語ごとに音の境界を探してくれます ( その応用として、 http://kikyou.info/diary/?200506#i21_1 こっちでも書いた「Julius応用キット - 読みを与えれば、その音素の区切りを認識させるキット」ってのがあります )。
  • 2005-06-28 10:45 W.Dee : ただ、読みを指定しないといけない (漢字は認識しない) ので、テキストを自動で認識させる場合、前段に茶筌( http://chasen.naist.jp/hiki/ChaSen/ )のような形態素解析ソフトウェアを挟んで、読みをださないとならないと思います。ただ、茶筌は茶筌で、辞書に載ってない単語は誤変換しますから、総合的にこれらを支援する環境を整えないと自動化、半自動化は難しいっすね。ただ目の前に目的のソフトウェアはすでにあるっ!
  • 2005-06-28 19:03 たにみちNON : 面白い面白い。ていうかいっそマンパワーに頼って全ての漢字にルビをふるという手もありますわな。テキストの分量の少ない同人だったらそう非現実的ではないし、お金のある企業ならそれはそれで大したことはないでしょう。
  • 2005-06-28 19:07 たにみちNON : ちょっとテストスクリプト書いてみるか……マスターアップが終わったらな!(ていうか今やってるの吉里吉里ですよ
  • 2005-06-28 21:59 W.Dee : ちょっと応用キットつかってやってみましたが 息継ぎの声とか、セリフに書いてないであろう音が入るとダメですね。相当研究が必要かも。茶筌で認識できない単語はライターのIMEの辞書から拾ってくるとよさそうですね。あるいはIMEの再変換機能を利用するとか。
口パクシーケンスの自動生成 その3

未練がましくもうちょっと頑張ってみました。

口パクシーケンス生成ソフト(Julius含む) 詳しくは展開後の readme.txt を読んでください。

うーん。難しい。

2005年6月25日

kikyou.infoが逝ってました

本日の19:00〜20:30にかけて、kikyou.infoサーバに障害が発生し、アクセスできない状態が続きました。

大変ご迷惑をおかけしました。

原因はHDDが熱で逝った……のかなぁ。ARAID99 1000LというハードウェアRAID1ドライブを使っているのですが、両方のHDDがFailとなっていました。両方一度に逝ったわけですか?コントローラがおかしくなったのかしら。

とりあえず再起動させたら何事も無かったかのように起動しています。

ほんと、めちゃくちゃ毎日暑いですね。

口パクシーケンスの自動生成 その2

これまでの成果物をおいておきます。

口パクシーケンス生成ソフト(Julius含む) 詳しくは展開後の readme.txt を読んでください。

実行に当たっては Windows XP か 2000 ぐらいのコンピュータと Perl が必要になります。

結局の所、音声から自動的に音素を拾うようにしました。こちらから「読み」を指定する必要はないです。

読みに関しては、日本語の50音+濁音、半濁音約230音が、無秩序に並ぶ、と仮定して認識を行います。普通の音声認識では、「ありがちな発音」を、日本語の実際の文章の統計や発音の統計からひっぱってきて、それに照らし合わせるのですが、これはそれをあえてやりません。もちろん、認識結果はさんざんで、

<s> みー にぇ あ さ ふ <sp> あ <sp> あ は い りゃー あ ぶ ぜ へ あ が つ え だ <sp> ん <sp> け お むー ぎ じゅ にー ちー ぎ かー は ば り お ら しぇ </s>

これ何言ってるか分かりますか?(笑)

これは「みなさん、おはよう御座います。 今日も一日 頑張りましょう」と言っているのを、これで認識させた結果です。

けれども、口パク程度には十分な認識です。

適当に画像を用意して口パクさせてみましたが、そこそこいい感じです。

微妙にタイミングがずれたり、無音部分が続くとそこがあたかも無かったかのように扱われてずれまくると言った問題は残っていますが、こればっかりやってると他のことができないので_| ̄|○ ここで挫折します。

だれかあとやってーーー!!

2005年6月21日

口パクシーケンスの自動生成

ボイスから口パク(クチパク)のシーケンスを自動で認識して生成できないかと結構前から思っていたのですが、大語彙連続音声認識システムJuliusを使って、いろいろとやってみています。

とりあえず Juliusディクテーション実行キット を使ってそこらのボイスをつっこんでみます。Google で「ボイス サンプル」で出てきた一番最初のページ(注:2005年6月21現在では http://moe.product.co.jp/moeos/product/huta/cg.htm [18禁] でした)にあったサンプルを入れてみましたが。

まあ、ほとんど喘ぎ声なんで認識無理ですね(^^; いや Julius が悪い訳じゃないです。

読みを与えれば、その音素の区切りを認識させるキットが Julius応用キット にあったので、それを使ってサンプルの一部を認識させてみました。

すすきったらホントに変態さんね

微妙にずれてますが、そこそこ認識できる模様。でも読みを指定しないといけないのがなんとも。

もっとも口パクにこれほどまでの認識精度は必要なくて、母音が大まかにどうなっているかと、特徴的な子音(mなど) が分かればよく、いわゆる「日本語で何を言ってるのか」の認識は必要ありません。Julius の 音響モデル部分だけをつかえばいいのかな。

ちなみに Loop Tuner 2 でこんな風にボイスにラベルを貼っておけば、吉里吉里で再生したときに各ラベル位置でイベントを拾えるので、口パクの同期が簡単にできるようになると思います (KAGの標準の機能として搭載するかどうかは微妙ですが )。

  • 2005-06-24 18:20 DauGe : http://www.lostmarble.com/papagayo/index.shtml で、「パパガヨ」という口パクソフトを見かけました。Moho作ってるとこです。何かの足しになれば……。
  • 2005-06-24 20:03 たにみちNON : おー、リップシンクいけますか。昔3DCGアニメの仕事でリップシンクをやったことがありますが、母音と口を閉じるタイミング(カンで入れた方が早かったけど)を指定するとそれっぽかったです。ただまあ2Dゲームの場合ですとこれまたやったことありますが(色々やってんなおい)「大口」「中口」「閉じ」をある程度ランダムにやるだけでそれっぽく見えますガ
  • 2005-06-24 20:16 たにみちNON : どもっす。おー、リップシンクいけますか。昔3DCGアニメの仕事でリップシンクをやったことがありますが、母音と口を閉じるタイミング(カンで入れた方が早かったけど)を指定するとそれっぽかったです。
  • 2005-06-24 20:17 たにみちNON : ぎゃ。かぶった。続き……「大口」「中口」「閉じ」をある程度ランダムにやるだけで結構それっぽく見えましたが、声がない所や「ん」で閉じるという設定をするとかなりいいかんじになると思います。
  • 2005-06-24 20:19 たにみちNON : ボイス一つ一つに手を加えるというのは手間的に現実性はありませんが、一定音量以下でボイスラベルを入れるソフトがあれば一気に自動化できて……あ、これ実は結構すごくないか。コンシューマーとかでもリップシンクしてないやつ多いし。
  • 2005-06-25 01:17 W.Dee : ああ、これみたことあります < papagayo こっちでセリフを指定してやらないといけないんですよね.... どうもです!
  • 2005-06-25 01:21 W.Dee : 今回作った奴の利点は、セリフにない音も拾ってくれるってところでしょうか。息継ぎなんかがいい例です。普通にしゃべっていて、口を閉じて息継ぎする人いないですものね。
  • 2005-06-25 01:23 W.Dee : リアルな口パクは怖いといった意見を聞いたことがあります。我々がランダムな口パクに慣れてしまってるのかな? でも「ふー、ふー」 (物をさますセリフ) ではちゃんと u の口の形しててくれないと変。

2005年6月17日

吉里吉里サポート掲示板

ちょっと仕様変更を行いたいと思います。

編集をできなくしたいと思います。記事を途中で変更されてしまうと、どこがどう変わったのかがわかりづらいためです。変更を行いたいときは、ご自分の記事に返信する形で変更点を書いてください。また、投稿するときはよく推敲し、確認をしてから投稿してください。

それと、これは諸事情有るのですが、投稿者のお名前が変わったときは、(システム側で検知できる範囲内で) 元のお名前を自動的に表示するようにします。

よろしくお願い致します。

2005年6月15日

Loop Tuner 2 (その2)

開発を続けています。

Loop Tuner 2 ではループのための前方へのジャンプだけでなく、後方に飛ぶジャンプもサポートしていて、再生位置のジャンプを行うもの全般をリンクと呼んでいます。

で、そのリンクの調整用のウィンドウを作りました。

Loop Tuner 2 before alpha

下側のウィンドウはリンクチューナと呼んでいますが、このウィンドウでは、中央を境に、左側にリンク前の波形、右側にリンク後の波形を表示しています。また、お互いの波形に重ね合わせて見られるようになっているので、より調整がしやすくなっていると思います。

波形のすぐ下に並んでいる12個のボタンは、波形の移動のためのボタンです。クロッシング・ポイントを探せるようにもなっています。波形はマウスによるドラッグでも移動できるようになっています。

Loop Tuner 2 については、もうそろそろアルファ版を公開できるとおもいます。

ここまでつくって吉里吉里だけに使うのはもったいないので、Loop Tuner が生成するループ情報を使って再生制御するライブラリを整備して、他の用途でも使えるようにしようかな、、、とか思っていますが。しかしTLG6の時もそうでしたが、やっぱり時間がないので、とりあえず使いたいとなったら、ソースを吉里吉里から適切に引き抜いて使ってください(^^;

2005年6月12日

kikyou.infoメンテ終了

サーバのメンテ終了しました。といってもDebian GNU/Linux を woody から sarge にしたというだけですが。

一カ所自分でいれたパッケージと公式のパッケージが衝突をしてたのと、md5sumの出力形式が変わっていたのを除けば、それほど大きなトラブル無く移行できました。

  • 2005-06-22 19:18 W.Dee : テスト。そういやDBがちゃんと動いているかテストしてなかった。