|
| Japan Worldwide |
Steps
全台新環境!「お前はすでにビルドしている」 Javaによる音声認識ソフト「Sphinx-4」は、ソルデベことSolaris Express Developer Editionでゴアヒャアーッと(※1)動いた。おまけに、本来コマンドを打って起動させる必要があるデモプログラムを、NetBeansでチョチョイと操ることができた。これはもう何かチャチャを入れずにオリャリャリェリョーカ。 とロレツがアイドルしているうちにソルデベも2008年1月(ほんとは2月)バージョンアップした。そのアップぶりときたらもう、インストール後の最初のログインで無線LANにつながるなど、これがあのアレでナニだったがそこがまたソレでもあったSolarisだとは信じられないほどの変わりッぷりだ。 11月12月は気持ち悪いほどの暖冬だったが1月2月は凍り付く寒さでプラマイ平年並みでしたと言われても拳を握りしめて笑うしかない今年の冬もいよいよ終わり春本番だと思われる今日このごろ、ワタクシも雨後のタケノコのようにあっちゃこっちゃに入れてあったソルデベを、心機一転全台一斉入替した!これまでのソルデベ音声プロジェクトの敢行環境(ブラックボデーのカッチョいいAthlon6000+マシン「クロ子さん」)も、「ソルデベ9/07+NetBeans5.0」から「ソルデベ1/08+NB6.0」に移行した。 NBは6.0.1が出てるけどいーのッ!それはバリバリとJava(とかRubyとかCとか)開発をする人にドンドンと導入していただくことにして、ここではあーんまJavaとかやりたくないけどまぁーあんまめんどくないならちょっと使ってみるぶんにはいーけどぉーという感じの人を対象にしているので、最初っからメニューに入っているものをそのまま使うのッ。
さて同様に、「sphinx4-1.0beta」の「ソース版」フォルダを「既存のAntプロジェクトを使用するJavaプロジェクト」に取り込んだ。
デベロッパーはみんなトモダチ このように新しい環境でもプロジェクトのビルドやデモプログラムの実行などが以前の環境と同じようにできることを確かめたので、さてカスタマイズの方法はと思ってSphinx-4のホムペに行こうと思ったら新しい環境のブラウザだからブックマークもマッチャラだ。あーURL忘れちったヨ以前の設定フォルダをリストアしなきゃナでもそれよか「Sphinx-4」でググりゃいんだヨ、とそれをしたところ、モノグサ転じて福(※2)というかこんな関連文書が見つかった。 これは、サン様とは「とも」とフリガナのふれる関係にあるともないとも言われるあの大手IT企業さんの開発者用ドキュメントだ!そして歯ごたえのキツそうなタイトルにニワわず、わかりやすく具体的で、本記事ではこれをもとにカスタマイズをやってみた。大手IT企業さんありがとう。共に明るい情報社会を築いて行こうネ。 本当に気に入った「お気に入り」
さて、カスタマイズしようというのが前回やった「HelloWorld」のデモプログラムだ。これはNetBeansの「Files」という画面で、sphinx4project-sphinx4-1.0betaというフォルダの「demo」>「sphinx」>「helloworld」というところにあるのだが、これをいちいち開くのはなかなかめんどくさい。 こういうときにタイヘン便利な画面がある。 ソレは日本語版では「お気に入り」と訳すのが世界の常識になっている。選ぶと「Projects(日本語版では通常『プ....』と表示される)」とか「Files」とタブで切り替える関係になるが、Javaに全く関係なく機能するファイルブラウザなのだ。 最初は自分のホームディレクトリが上がっていて、ノードを開くとJavaに関係あろうがなかろうが(隠し物件以外)ファイルやフォルダが全部表示される。そこで「sphinx4-1.0beta」ファイルをどんどん開いて「helloworld」フォルダに行ったらそこで「Add fo Favorites」、そう「お気に入りに追加」するのだ。
これで「Home」と並んで「helloworld」フォルダがお気に入りウィンドウに登録されるから、開く手間がタイヘン省ける。ホームディレクトリ以外の場所を登録するには、この画面の適当な場所を右クリックすると、「Add to Favorites」という項目が出てくるのでそれを選ぶと、ファイル参照画面が現れるのでそこから自由に選んで登録する。
ビシャモンとか言う人の名前がなんで聞き分けられるの
さてこの「HelloWorld」デモだが、なぜケンとかメリーとか簡単な名前じゃなくて、ビシャモンとかエバンゲとか難しい名前を言わせようとするのだろうか。その秘密は図7にも見える「hello.gram」というファイルだ。 図9のように「お気に入り」画面に表示されているファイルをダブルクリックすると、編集画面にその内容が表示される。もちろん、編集することもできる。
図10の文法はよくワカンナイ。けど「Good morning」か「Hello」、それから例の五人衆がリストになっていることがわかる。つまり、Sphinxに「Good morningかHello、それからこの5人の名前しか言わないからネ」と教えてやっているというわけだ。 だったら図10を編集して「Noniko」を加えてやれば、「ヘローノニコ」を認識してくれるかというとそれはできない。なぜなら「辞書」にないからだ。 オー監督のオーはどう書くの 辞書とは、「sphinx4-1.0beta」全体を一度ビルドしないとできない「bld」フォルダの中にあるファイルだ。
というワソ長い名前のディレクトリ、この中に「ナントカ.dict」みたいな名前のついたファイルが埋まっている。 なぜそんなところにあるのがわかるかというと、「helloworld」パッケージ内にあるファイル「helloworld.config.xml」に書いてあるのだ。
「The Dictionary configuration」と書いた部分に、使っている辞書ファイルの名前が具体的に指定してある。
といってもやたら長い設定でよくわかんないけどッ。とにかく「6800ナントカフォルダ」の「cmudict.0.6d」というファイルだということがわかりゃいーのッ。 図11からその「cmudict.0.6d」というアイコンをつついて中身をあけてみる。すると、「このファイル容量は4MBを超過しているので開くとIDEがアップアップになるかも知れませんがどうしますか」 という警告が出る。心配な人は別途テキストエディタで開いてみよう。ワタシはいいってことヨ止まりゃそれまでどうせ人生一度きり(※3)と思ってそのままNB画面に開けた。フツーにひらいてフツーにスクロールして見れた。
なるほどこのように各語の音節がひとつひとつ指定されているのだ!「AA」まででこんなにある。こりゃあ気の長い文書だ。 だからきっとここに「NONIKO N OW N IH K OW」と登録して、「ヌォウヌィクオゥ」と吹き込んでやればハローノニコと認識してくれるのだろうが、どうせなら辞書ファイル自体をもっと簡単にする。
本記事は、サンのユーザ様自らの体験をお寄せいただいたものであり、サン・マイクロシステムズ社としての公式情報ではありません。
| Sun Fun Times
|
||||||||||||||||||||||||||||||||||||||||||||||||||||