From nishimotz @ gmail.com Thu Nov 12 14:20:23 2009 From: nishimotz @ gmail.com (Takuya Nishimoto) Date: Thu, 12 Nov 2009 14:20:23 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?dWJ1bnR1IDkuMTAgGyRCQlAxfk09GyhC?= =?iso-2022-jp?b?GyRCRGokSiRJGyhC?= Message-ID: <7a8ca8f20911112120s42dd5b95jdd2bcd2643947a50@mail.gmail.com> galatea-users の皆様 西本です。 先日 Ubuntu Linux 9.10 がリリースされました。 まだ十分にテストをしていませんが、私のテストマシンの1台を アップグレードしたところ、ノートパソコンのビデオドライバが改善され、 これまで Galatea for Linux の FSM と「外観の設定>>視覚効果>>追加効果」が 非互換であった問題が解決したようです。 その他についてはいまのところ、現在公開中のパッケージで不具合は 起きていないように見えます。 今後、定期的に互換性の確認を行い、 パッケージを更新していきたいと思っています。 Windows も "7" というバージョンがリリースされましたが、 動作報告、障害報告などを伺えれば幸いです。 なお、ご報告が遅れましたが、これまで Galatea4Win の開発に 関わってこられた豊橋技科大の桂田先生に、 sourceforge.jp の galatea プロジェクトメンバーとして 登録をしていただきました。(ログイン名 katurada) 随時 windows 関連パッケージの更新にご協力いただける予定です。 ちなみに現在 Galatea for Linux の galatea-engine パッケージでは julius 4.1.2 を使用していますが、 ( /usr/local/galatea-engine/SRM/bin/julius -version ) 先日 julius 4.1.3 がリリースされました。 http://sourceforge.jp/projects/julius/ Galatea は Julius 3.x 時代に設計されており、 Julius 4 系の機能を有効に活用することも今後の課題です。 -- Takuya Nishimoto nishi @ hil.t.u-tokyo.ac.jp http://hil.t.u-tokyo.ac.jp/~nishi/ 2009/10/25 Takuya Nishimoto : > 西本です。 > > 御報告ありがとうございます。 > ちょっとお時間をいただくかも知れませんが、 > こういう情報を管理するために、 > チケットシステムを使いたいと思います。 > http://sourceforge.jp/projects/galatea/ticket/ > > 現在の Galatea プロジェクトはオープンなコミュニティです。 > たとえ動作確認の報告、バグ報告だけであっても歓迎です。 > また今後は、バージョンアップや大きな仕様変更の際に > 過去に動いていたタスクに影響がないことを確認するための、 > テストスイートを整備する必要があります。 > > 今後の活動方針についていくつかの案: > ・修正の差分を随時リリース > ・一ヶ月ごと(例えば毎月第3日曜日)に差分を適用したパッケージ更新 > ・半年くらいの周期で大きな改良・拡張のマイルストーンを設定する > ・各パッケージやWiki文書について著作者や貢献者のクレジットを整備する > > 具体的な作業についての案: > ・Linux版はUbuntuのリリースごとに互換性確認 > ・Windows版はWindows7互換性の確認 > ・Linux/Windowsともに64bit環境の互換性検討 > ・音声合成は現在のバージョンとUnidic非使用版を選択可能に > ・声と顔のカスタマイズに関連する機能整備・改良 > ・Linux版は内部処理をUTF-8に徐々に移行する > ・Ruby, Python, JavaScriptなどアプリ開発例の蓄積 > ・次世代のAPI模索 > > そんなわけですので、今後とも積極的に御発言いただければ幸いです。 > メンバーとしてご参加いただける方も歓迎します。 > > -- > Takuya Nishimoto > nishi @ hil.t.u-tokyo.ac.jp > http://hil.t.u-tokyo.ac.jp/~nishi/ > > _______________________________________________ > Galatea-users mailing list > Galatea-users @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/galatea-users > From nishimotz @ gmail.com Sun Nov 15 18:08:03 2009 From: nishimotz @ gmail.com (Takuya Nishimoto) Date: Sun, 15 Nov 2009 18:08:03 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?PEFQQi8+GyRCJT8lMCRyO0gkJiRIGyhC?= =?iso-2022-jp?b?Z3RhbGsbJEIkLE1uJEEkaxsoQg==?= In-Reply-To: <4AE4187C.5070800@petile.com> References: <4AE4187C.5070800@petile.com> Message-ID: <7a8ca8f20911150108g36e79948j3d3ba2a8c337f899@mail.gmail.com> 西本です。 表題の件、私がもたもたして遅くなったのですが、 http://sourceforge.jp/ticket/browse.php?group_id=1547&tid=19337 に御報告し、 http://sourceforge.jp/projects/galatea/releases/44454/note のとおり chaone-win の差し替え版をリリースしました。 御確認いただければ幸いです。 問題がなければ対応完了として、正式版に反映させたいと思います。 Linux 版と Windows 版で依存する XML プロセッサが異なるので、 Linux 版で同じ差し替えを行うべきかどうかは、 別途検討したいと思います。 なお、もう一つの件は未対応です。 http://sourceforge.jp/ticket/browse.php?group_id=1547&tid=19336 -- Takuya Nishimoto nishi @ hil.t.u-tokyo.ac.jp http://hil.t.u-tokyo.ac.jp/~nishi/ 2009/10/25 マーチン : > マーチンです。 > (登録してあるのとは別のメールアドレスで送信して、お騒がせしました) > > クレーマーのようになりつつありますが、プログラムの内容は分からない > ので、ユーザとしての意見しか言えません。ご理解ください。 > > galatea4win-istc-2009-02.zip + chaone-win-1.3.2-091012.zip で、 > タグを使ったあとでは、必ず gtalkが落ちます。Windows Vista SP2 > と XP SP3 で確認しました。 > > set Text = あいうえお > set Speak = NOW > set Text = あいうえお > set Speak = NOW > set Text = あいうえお > > ここで落ちます。 > > 他のタグ > > > > > > では、タグを正しく閉じていないと落ちます。正しく書けば問題ないので、 > 対処はできます。 > > ちなみに、 > だけは、” is NOT found input.”と表示されました。 > このタグだけ別のルーチンで処理しているのかなぁ? > > また、現象の報告だけです。 > > _______________________________________________ > Galatea-users mailing list > Galatea-users @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/galatea-users > From masa @ petile.com Mon Nov 16 02:18:41 2009 From: masa @ petile.com (=?ISO-2022-JP?B?GyRCJV4hPCVBJXMbKEI=?=) Date: Mon, 16 Nov 2009 02:18:41 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?PEFQQi8+GyRCJT8lMCRyO0gkJiRIGyhC?= =?iso-2022-jp?b?Z3RhbGsbJEIkLE1uJEEkaxsoQg==?= In-Reply-To: <7a8ca8f20911150108g36e79948j3d3ba2a8c337f899@mail.gmail.com> References: <4AE4187C.5070800@petile.com> <7a8ca8f20911150108g36e79948j3d3ba2a8c337f899@mail.gmail.com> Message-ID: <4B0037F1.3030001@petile.com> マーチンです。 西本さん。対応、ありがとうございました。 タグについては、確認が取れました。 現象が同じだったので、1つのメールに2つの不具合を報告して しまったのがいけないと思いますが、メールの後半の不具合は、 解消できていないようです。 >> 他のタグ >> >> >> >> >> >> では、タグを正しく閉じていないと落ちます。 set Text = 私は、東京へ行きます。 set Speak = NOW set Text = 私は、東京へ行きます。 loadXML error (error code 0) set Text = あいうえお ここで落ちます。 以上、よろしくお願いします。 Takuya Nishimoto さんは書きました: > 西本です。 > > 表題の件、私がもたもたして遅くなったのですが、 > http://sourceforge.jp/ticket/browse.php?group_id=1547&tid=19337 > に御報告し、 > http://sourceforge.jp/projects/galatea/releases/44454/note > のとおり chaone-win の差し替え版をリリースしました。 > 御確認いただければ幸いです。 > 問題がなければ対応完了として、正式版に反映させたいと思います。 From masa @ petile.com Mon Nov 16 02:32:18 2009 From: masa @ petile.com (=?ISO-2022-JP?B?GyRCJV4hPCVBJXMbKEI=?=) Date: Mon, 16 Nov 2009 02:32:18 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?GyRCJU8lJCVVJXMkLEZ+JEMkP0o4GyhC?= =?iso-2022-jp?b?GyRCO3pOcyRHGyhCZ3RhbGsbJEIkLE1uJEEkaxsoQg==?= Message-ID: <4B003B22.3010106@petile.com> マーチンです。 galatea4win-istc-2009-02.zip + chaone-win-1.3.2-091113.zip で、 ハイフンが入った文字列があると、gtalk が落ちることがあります。 ハイフンが入った文字列を無理やり日付と解釈するみたいで、 ”123-45”と入力すると、”123年45月”と読み上げます。 さらに、それにアルファベットが混じると、特定の組み合わせで、 gtalk が落ちることがあります。 set Text = 1A2-B rep Speak.stat = PROCESSING loadXML error (error code 0) rep Text.text = 1A2-B rep Speak.text = rep Text.pho = sil[10] sil[10] rep Speak.pho = sil[10] sil[10] rep Text.dur = 20 rep Speak.dur = 20 rep Speak.stat = READY set Text = はい rep Speak.stat = PROCESSING   <--- ここで落ちる 標準エラーの方には、”* arranged_text”の内容が 変な値になっていました。 ---------------------------- * text 1A2-B * arranged_text 一 A二年ワス B loadXML error (error code 0) ---------------------------- 以上、またまた不具合報告だけです。 From masa @ petile.com Mon Nov 16 02:41:28 2009 From: masa @ petile.com (=?ISO-2022-JP?B?GyRCJV4hPCVBJXMbKEI=?=) Date: Mon, 16 Nov 2009 02:41:28 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?GyRCRkNEaiROSjg7eiRyRkkkXiQ7GyhC?= =?iso-2022-jp?b?GyRCJGgkJiRIJDkkayRIISIbKEJndGFsaxskQiQsTW4kQSRrGyhC?= Message-ID: <4B003D48.7050001@petile.com> マーチンです。 galatea4win-istc-2009-02.zip + chaone-win-1.3.2-091113.zip で、 以下のような特定の文字を単独で読ませようとすると、gtalkが 落ちます。他の文字と組み合わせると落ちないことが多いです。 1.ヴ,ァ,ヵ,ヶ 2.ギリシャ文字の大文字 3.ロシア文字 4.TEL (Shift-JISで 0x8784)などの機種依存文字 set Text = ヴ rep Speak.stat = PROCESSING   <--- ここで落ちる set Text = ヴァ set Text = バァ でも落ちました。 set Text = ヴァです とすると、”ヴァ”を読み上げませんが落ちはしません。 ---------------------------- * text ヴ * arranged_text ヴ * chasen result * tag data - n_tag: 0 ---------------------------- 以上、よろしくお願いします。 From nishimotz @ gmail.com Mon Nov 16 11:56:28 2009 From: nishimotz @ gmail.com (Takuya Nishimoto) Date: Mon, 16 Nov 2009 11:56:28 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?Z2FsYXRlYXRhbGsbJEI0WE8iSVQbKEI=?= =?iso-2022-jp?b?GyRCNnE5ZyRONURPQBsoQg==?= Message-ID: <7a8ca8f20911151856q28299891id3e29ebb84dbb501@mail.gmail.com> galatea-users 各位 cc: galateaプロジェクト関係者各位 西本です。 新たにご報告いただいた不具合2件をチケットに登録しました。 また、チケット #19337 APBタグを使ったあとでgtalkが落ちる について、私も見落としていましたので、 別の不具合としてチケット登録しました。 ただ、valid なタグを使うことは利用者の責任、 という考えもありそうなので、 「サポートリクエスト」にしています。 (とはいえ落ちるのはよくないことですが。。) http://sourceforge.jp/projects/galatea/ticket/ 19577 : gtalkでタグを正しく閉じていないと落ちる 19576 : 特定の文字を読ませようとするとgtalkが落ちる 19575 : ハイフンが入った文字列でgtalkが落ちることがある 個別の問題に対応するだけでなく、 きちんと実装テストスイートを整備して、 バージョンアップの際にテストをする必要がありますね。 今後考慮したいと思います。 -- Takuya Nishimoto nishi @ hil.t.u-tokyo.ac.jp http://hil.t.u-tokyo.ac.jp/~nishi/ 2009/11/16 マーチン : > マーチンです。 > > 西本さん。対応、ありがとうございました。 > タグについては、確認が取れました。 > > 現象が同じだったので、1つのメールに2つの不具合を報告して > しまったのがいけないと思いますが、メールの後半の不具合は、 > 解消できていないようです。 > >>> 他のタグ >>> >>> >>> >>> >>> >>> では、タグを正しく閉じていないと落ちます。 > > set Text = 私は、東京へ行きます。 > set Speak = NOW > set Text = 私は、東京へ行きます。 > loadXML error (error code 0) > set Text = あいうえお > > ここで落ちます。 > > 以上、よろしくお願いします。 > > Takuya Nishimoto さんは書きました: >> 西本です。 >> >> 表題の件、私がもたもたして遅くなったのですが、 >> http://sourceforge.jp/ticket/browse.php?group_id=1547&tid=19337 >> に御報告し、 >> http://sourceforge.jp/projects/galatea/releases/44454/note >> のとおり chaone-win の差し替え版をリリースしました。 >> 御確認いただければ幸いです。 >> 問題がなければ対応完了として、正式版に反映させたいと思います。 > > From yama @ media.ritsumei.ac.jp Mon Nov 16 20:52:26 2009 From: yama @ media.ritsumei.ac.jp (Yoichi YAMASHITA) Date: Mon, 16 Nov 2009 20:52:26 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?Z2FsYXRlYXRhbGsbJEI0WE8iSVQbKEI=?= =?iso-2022-jp?b?GyRCNnE5ZyRONURPQBsoQg==?= In-Reply-To: Your message of "Mon, 16 Nov 2009 11:56:28 +0900" <7a8ca8f20911151856q28299891id3e29ebb84dbb501@mail.gmail.com> References: <7a8ca8f20911151856q28299891id3e29ebb84dbb501@mail.gmail.com> Message-ID: <20091116205226F.yama@slp.is.ritsumei.ac.jp> 西本先生 山下です。 「gtalkでタグを正しく閉じていないと落ちる」のは, chaone での処理ではじかれてしまっているようですね。 > ただ、valid なタグを使うことは利用者の責任、 > という考えもありそうなので、 ということになるでしょうか。 山下洋一@立命館大学情報理工学部メディア情報学科 〒525-8577 滋賀県草津市野路東1-1-1 TEL:077-561-3906 (直通) yama @ media.ritsumei.ac.jp FAX:077-561-5203 (学部事務室) From: Takuya Nishimoto Subject: galateatalk関連不具合の議論 Date: Mon, 16 Nov 2009 11:56:28 +0900 > galatea-users 各位 > cc: galateaプロジェクト関係者各位 > > 西本です。 > > 新たにご報告いただいた不具合2件をチケットに登録しました。 > また、チケット #19337 > APBタグを使ったあとでgtalkが落ちる > について、私も見落としていましたので、 > 別の不具合としてチケット登録しました。 > ただ、valid なタグを使うことは利用者の責任、 > という考えもありそうなので、 > 「サポートリクエスト」にしています。 > (とはいえ落ちるのはよくないことですが。。) > > http://sourceforge.jp/projects/galatea/ticket/ > 19577 : gtalkでタグを正しく閉じていないと落ちる > 19576 : 特定の文字を読ませようとするとgtalkが落ちる > 19575 : ハイフンが入った文字列でgtalkが落ちることがある > > 個別の問題に対応するだけでなく、 > きちんと実装テストスイートを整備して、 > バージョンアップの際にテストをする必要がありますね。 > 今後考慮したいと思います。 > > -- > Takuya Nishimoto > nishi @ hil.t.u-tokyo.ac.jp > http://hil.t.u-tokyo.ac.jp/~nishi/ > > > > > 2009/11/16 マーチン : > > マーチンです。 > > > > 西本さん。対応、ありがとうございました。 > > タグについては、確認が取れました。 > > > > 現象が同じだったので、1つのメールに2つの不具合を報告して > > しまったのがいけないと思いますが、メールの後半の不具合は、 > > 解消できていないようです。 > > > >>> 他のタグ > >>> > >>> > >>> > >>> > >>> > >>> では、タグを正しく閉じていないと落ちます。 > > > > set Text = 私は、東京へ行きます。 > > set Speak = NOW > > set Text = 私は、東京へ行きます。 > > loadXML error (error code 0) > > set Text = あいうえお > > > > ここで落ちます。 > > > > 以上、よろしくお願いします。 > > > > Takuya Nishimoto さんは書きました: > >> 西本です。 > >> > >> 表題の件、私がもたもたして遅くなったのですが、 > >> http://sourceforge.jp/ticket/browse.php?group_id=1547&tid=19337 > >> に御報告し、 > >> http://sourceforge.jp/projects/galatea/releases/44454/note > >> のとおり chaone-win の差し替え版をリリースしました。 > >> 御確認いただければ幸いです。 > >> 問題がなければ対応完了として、正式版に反映させたいと思います。 > > > > > From studioarc @ gmail.com Tue Nov 17 00:47:09 2009 From: studioarc @ gmail.com (Atsushi YAMADA) Date: Tue, 17 Nov 2009 00:47:09 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?Z2FsYXRlYXRhbGsbJEI0WE8iSVQbKEI=?= =?iso-2022-jp?b?GyRCNnE5ZyRONURPQBsoQg==?= In-Reply-To: <7a8ca8f20911151856q28299891id3e29ebb84dbb501@mail.gmail.com> References: <7a8ca8f20911151856q28299891id3e29ebb84dbb501@mail.gmail.com> Message-ID: <4B0173FD.4030701@gmail.com> 西本先生 皆様 山田です。 これらは新しいバグというよりも,以前からあっ たバグが顕在化したもののようですね。ただ, complete testはしていませんから,いずれにし ろ,テストスイートは必要でしょうね。 > 19577 : gtalkでタグを正しく閉じていないと落ちる 山下先生も書かれているように,chaoneはxml処 理系なので,validでない入力は処理できません。 この対策としては,gtalkのtext.cで,入力テキ ストをパースする際に,タグをスタックしてい き,最後にスタックに残っているタグの終了タ グを強制的に追加するということをすれば解決 できます。同様に, ......... のようなクロスしているタグについても,スタッ クの処理で異常が見つかるので,そのような入 力はエラーメッセージを出して受け付けないと いうことができます。 ただ,現状でgtalkがなぜ次の入力で落ちるのか はよくわかりません。入力として意味はありま せんが,たとえvalidなxmlであっても ...... のように空タグの省略表記があると,chaoneの 処理は成功しますが,gtalkで落ちるようです。 > 19576 : 特定の文字を読ませようとするとgtalkが落ちる 対応する発音がない文字について,gtalkがその 場で落ちるようです。 > 19575 : ハイフンが入った文字列でgtalkが落ちることがある 私の環境では落ちるという現象が再現しません でした。 なお,読みの不具合の原因は,readmeの4.1に書 かれているとおり,ISO 8601形式の日付,時刻 表記について,処理をして読み上げるようにす るルーチンがtext.cに入っているのですが,こ れの判定が甘いために,おかしな読み方になる ことがあります。個人的には,日付として読ま せたければ,CONTEXTタグでtype="DATE"を指定 すればよいので,設定ファイル (ssm.conf) に おいて DATE: NO TIME: NO と指定して,ISO 8601形式の処理を無効にすれ ばよいと思います。 ISO 8601形式の読み上げをきちんとするために は,text.c内の処理を精緻化する必要がありま す。これについては,unidicの同梱物として, XSLTで実装したnumtransというツールを公開し ていますので,このロジックをCに移植していた だくというのが一つの方法です。 以上,いずれもgtalkのソースに手を入れる必要 があるため,今の私の手には余りますので,Cに 堪能な方の参加を期待します。 Takuya Nishimoto さんは書きました: > galatea-users 各位 > cc: galateaプロジェクト関係者各位 > > 西本です。 > > 新たにご報告いただいた不具合2件をチケットに登録しました。 > また、チケット #19337 > APBタグを使ったあとでgtalkが落ちる > について、私も見落としていましたので、 > 別の不具合としてチケット登録しました。 > ただ、valid なタグを使うことは利用者の責任、 > という考えもありそうなので、 > 「サポートリクエスト」にしています。 > (とはいえ落ちるのはよくないことですが。。) > > http://sourceforge.jp/projects/galatea/ticket/ > 19577 : gtalkでタグを正しく閉じていないと落ちる > 19576 : 特定の文字を読ませようとするとgtalkが落ちる > 19575 : ハイフンが入った文字列でgtalkが落ちることがある > > 個別の問題に対応するだけでなく、 > きちんと実装テストスイートを整備して、 > バージョンアップの際にテストをする必要がありますね。 > 今後考慮したいと思います。 > From studioarc @ gmail.com Thu Nov 19 00:42:34 2009 From: studioarc @ gmail.com (Atsushi YAMADA) Date: Thu, 19 Nov 2009 00:42:34 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?Z2FsYXRlYXRhbGsbJEI0WE8iSVQbKEI=?= =?iso-2022-jp?b?GyRCNnE5ZyRONURPQBsoQg==?= In-Reply-To: <4B0173FD.4030701@gmail.com> References: <7a8ca8f20911151856q28299891id3e29ebb84dbb501@mail.gmail.com> <4B0173FD.4030701@gmail.com> Message-ID: <4B0415EA.7030909@gmail.com> 西本先生 皆様 山田です。 # コンソーシアムが終了し,gtalk関係の開発は # 本業の業務時間外に行っているため,レスポ # ンスが遅くなることをご容赦ください。 >> 19576 : 特定の文字を読ませようとするとgtalkが落ちる に関するその後のバグ追跡報告です。 当初, > 対応する発音がない文字について,gtalkがその > 場で落ちるようです。 と考えていたのですが,違っていました。 gtalkは 「の下にが存在しなければ落ちる」 という仕様のようです。 そして,解析結果が未知語のみから成る入力の 場合に,W2が生成されなかったというのが,上 記の現象の原因でした。 さらに詳しく言うと,gtalkでは名前空間を認識 してくれないので,その処理をchaoneで行って いるのですが,未知語についてはその設定がう まくいっていませんでした。 添付のprep.xslに置き換えていただくと,gtalk が落ちることはなくなると思います (ただし, 大文字のギリシャ文字などは読み上げてはくれ ません)。 同梱のpos_sys.xmlはついでに変更したものです が,いずれにしても,gtalkでは「未知語」とい う品詞はunknownになるようです。 -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: prep091118.zip 型: application/zip サイズ: 2426 バイト 説明: 無し URL: http://lists.sourceforge.jp/mailman/archives/galatea-users/attachments/20091119/b294723f/attachment.zip From masa @ petile.com Fri Nov 20 05:17:44 2009 From: masa @ petile.com (=?Shift_JIS?B?g32BW4Ngg5M=?=) Date: Fri, 20 Nov 2009 05:17:44 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?Z2FsYXRlYXRhbGsbJEI0WE8iSVQbKEI=?= =?iso-2022-jp?b?GyRCNnE5ZyRONURPQBsoQg==?= In-Reply-To: <4B0415EA.7030909@gmail.com> References: <7a8ca8f20911151856q28299891id3e29ebb84dbb501@mail.gmail.com> <4B0173FD.4030701@gmail.com> <4B0415EA.7030909@gmail.com> Message-ID: <4B05A7E8.2040003@petile.com> TO 山田さん CC 皆様 マーチンです。 山田さん、対応ありがとうございました。 19576 : 特定の文字を読ませようとするとgtalkが落ちる の件で、添付 prep.xsl で解決できることの確認ができました。 「解析結果が未知語のみから成る入力の場合に,W2が生成されなかった」 の説明で、今回の現象がよく理解できました。 また、 DATE: NO TIME: NO の設定で、 19575 : ハイフンが入った文字列でgtalkが落ちることがある の不具合も解決できました。 ありがとうございました。 From masa @ petile.com Mon Nov 23 23:12:23 2009 From: masa @ petile.com (=?ISO-2022-JP?B?GyRCJV4hPCVBJXMbKEI=?=) Date: Mon, 23 Nov 2009 23:12:23 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?MTYgGyRCJEgbKEIgMjYgGyRCJEgbKEIg?= =?iso-2022-jp?b?MC41NiAbJEIkSiRJJCwhIkpRJEpGSSRfPmUkMiRyJDckXiQ5GyhC?= Message-ID: <4B0A9847.30100@petile.com> クレーマーのマーチンです。 変な現象を見つけたので報告させてもらいます。 なぜか 16 と 26 と 0.56 などが、変な読み上げをします。 0.36 0.46 0.56 0.66 0.76 0.86 0.96 0.56 としても変わりません。 6 の前の数字は、日にちを読み上げるときの読み方になります。 「世界のナベアツ」のネタみたい。 galatea4win-istc-2009-02.zip   + chaone-win-1.3.2-091118.zip   + DATE: NO TIME: NO で確認しています。 From studioarc @ gmail.com Tue Nov 24 00:33:52 2009 From: studioarc @ gmail.com (Atsushi YAMADA) Date: Tue, 24 Nov 2009 00:33:52 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?MTYgGyRCJEgbKEIgMjYgGyRCJEgbKEIg?= =?iso-2022-jp?b?MC41NiAbJEIkSiRJJCwhIkpRJEpGSSRfPmUkMiRyJDckXiQ5GyhC?= In-Reply-To: <4B0A9847.30100@petile.com> References: <4B0A9847.30100@petile.com> Message-ID: <4B0AAB60.8000703@gmail.com> ChaOne開発者の山田です。 ご指摘ありがとうございます。 この問題は十分予測できたことなのですが,実 はバグフィックス版のChaOneは最新版のUniDic にあわせて作成しています (現在,2009年7月リ リースのversion 1.3.12)。このため,UniDicの 解析結果に変更があった部分については,おか しな結果になることがあります。 現在,ChaOneはUniDicのリリースとともに最新 バージョンを配布しているため,バージョンの ミスマッチは起こりにくいと考えていたのです が,古いバージョンのUniDic用のChaOneをメン テナンスしていくことは,現実的に不可能なの で,できれば最新版のUniDicを使っていただけ ればと思います。 マーチン さんは書きました: > クレーマーのマーチンです。 > > 変な現象を見つけたので報告させてもらいます。 > なぜか 16 と 26 と 0.56 などが、変な読み上げをします。 > 0.36 0.46 0.56 0.66 0.76 0.86 0.96 > > 0.56 としても変わりません。 > > 6 の前の数字は、日にちを読み上げるときの読み方になります。 > 「世界のナベアツ」のネタみたい。 > > > > > > > > > > > > > > > > > silence="NON"> > > galatea4win-istc-2009-02.zip >   + chaone-win-1.3.2-091118.zip >   + DATE: NO TIME: NO > で確認しています。 From studioarc @ gmail.com Tue Nov 24 23:30:54 2009 From: studioarc @ gmail.com (Atsushi YAMADA) Date: Tue, 24 Nov 2009 23:30:54 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?MTYgGyRCJEgbKEIgMjYgGyRCJEgbKEIg?= =?iso-2022-jp?b?MC41NiAbJEIkSiRJJCwhIkpRJEpGSSRfPmUkMiRyJDckXiQ5GyhC?= In-Reply-To: <4B0AAB60.8000703@gmail.com> References: <4B0A9847.30100@petile.com> <4B0AAB60.8000703@gmail.com> Message-ID: <4B0BEE1E.4060002@gmail.com> ChaOne開発者の山田です。 >> なぜか 16 と 26 と 0.56 などが、変な読み上げをします。 >> 0.36 0.46 0.56 0.66 0.76 0.86 0.96 について,原因のご説明をしておきます。 ChaOneはUniDicに記述されている様々な属性値を みて動作するのですが,古いバージョンのUniDic において,ここに誤った値が混入していたのが今 回ご報告いただいたエラーの原因です。 具体的には,「六」のfConTypeの値に,日付読み を指定するDという値が誤って記述されていました。 このため,「六」の直前の数詞が日付読みになっ てしまいます。 この不具合は最新のUniDicでは修正されています ので,UniDicの置き換えでこの現象は回避できま す。 From nishimotz @ gmail.com Wed Nov 25 12:28:37 2009 From: nishimotz @ gmail.com (Takuya Nishimoto) Date: Wed, 25 Nov 2009 12:28:37 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?MTYgGyRCJEgbKEIgMjYgGyRCJEgbKEIg?= =?iso-2022-jp?b?MC41NiAbJEIkSiRJJCwhIkpRJEpGSSRfPmUkMiRyJDcbKEI=?= =?iso-2022-jp?b?GyRCJF4kORsoQg==?= In-Reply-To: <4B0BEE1E.4060002@gmail.com> References: <4B0A9847.30100@petile.com> <4B0AAB60.8000703@gmail.com> <4B0BEE1E.4060002@gmail.com> Message-ID: <7a8ca8f20911241928o518b9ee1j1efbfbd097837e29@mail.gmail.com> 西本です。 下記のやりとりはチケット #19675 として登録しました。 私は unidic-users のメーリングリストも読んでいるのですが、 8月1日のリリース報告には下記のような問題について 触れられておらず、アップデートの必要なしと判断していました。 こういった情報は unidic-users で質問すれば教えていただけるのでしょうか? あるいは unidic-users で不具合報告をした方がよいのでしょうか? GalateaTalk のチームは unidic に見切りをつけたと聞いています。 私も unidic に依存しない TTS が必要だと考えています。 特に再配布の制約に関する不満が大きいですが、 オープンソースプロジェクトが基盤の部分で閉鎖的なプロジェクトに 依存してしまっているとしたら、致命的です。 unidic がなければ実現できない要素もあるので、 unidic ベースの TTS も引き続きメンテナンスしたい、 そのために unidic プロジェクトにも積極的に関わりたい、 というのが galatea プロジェクトとしての私の希望です。 -- Takuya Nishimoto nishi @ hil.t.u-tokyo.ac.jp 2009/11/24 Atsushi YAMADA : > ChaOne開発者の山田です。 > >>> なぜか 16 と 26 と 0.56 などが、変な読み上げをします。 >>> 0.36 0.46 0.56 0.66 0.76 0.86 0.96 > > について,原因のご説明をしておきます。 > ChaOneはUniDicに記述されている様々な属性値を > みて動作するのですが,古いバージョンのUniDic > において,ここに誤った値が混入していたのが今 > 回ご報告いただいたエラーの原因です。 > 具体的には,「六」のfConTypeの値に,日付読み > を指定するDという値が誤って記述されていました。 > このため,「六」の直前の数詞が日付読みになっ > てしまいます。 > この不具合は最新のUniDicでは修正されています > ので,UniDicの置き換えでこの現象は回避できま > す。 > > _______________________________________________ > Galatea-users mailing list > Galatea-users @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/galatea-users > From studioarc @ gmail.com Wed Nov 25 23:52:20 2009 From: studioarc @ gmail.com (Atsushi YAMADA) Date: Wed, 25 Nov 2009 23:52:20 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?MTYgGyRCJEgbKEIgMjYgGyRCJEgbKEIg?= =?iso-2022-jp?b?MC41NiAbJEIkSiRJJCwhIkpRJEpGSSRfPmUkMiRyJDckXiQ5GyhC?= In-Reply-To: <7a8ca8f20911241928o518b9ee1j1efbfbd097837e29@mail.gmail.com> References: <4B0A9847.30100@petile.com> <4B0AAB60.8000703@gmail.com> <4B0BEE1E.4060002@gmail.com> <7a8ca8f20911241928o518b9ee1j1efbfbd097837e29@mail.gmail.com> Message-ID: <4B0D44A4.9090009@gmail.com> 西本先生 山田です。 > 私は unidic-users のメーリングリストも読んでいるのですが、 > 8月1日のリリース報告には下記のような問題について > 触れられておらず、アップデートの必要なしと判断していました。 > こういった情報は unidic-users で質問すれば教えていただけるのでしょうか? > あるいは unidic-users で不具合報告をした方がよいのでしょうか? おそらく,個々のエントリの細かな修正については書 かれていないのでしょうね。 また,明らかにunidicがおかしいと考えられる場合に は,報告していただいたほうがよいと思います。 以前に西本先生も指摘されていたように,テストベッ ドが必要だと思うのですが,chaoneについても,不具 合を指摘していただいて,やっと気がつくというのが 実情です。 > GalateaTalk のチームは unidic に見切りをつけたと聞いています。 > 私も unidic に依存しない TTS が必要だと考えています。 > 特に再配布の制約に関する不満が大きいですが、 > オープンソースプロジェクトが基盤の部分で閉鎖的なプロジェクトに > 依存してしまっているとしたら、致命的です。 そうですね。私も早くunidicが完全にオープンソース になればよいと思っています。 一方で,GatateaTalk自体はunidicに依存した設計には なっていないはずですので,chasen + unidic + chaone の部分を他の解析器に置き換えるだけでよいと思いま す。そのためには,後で述べるように,gtalkが受け付 ける解析結果の書式を明らかにする必要がありますが。 音声合成の立場からは,unidicの短単位もあまり評判 がよくないので,音声合成用の単位を設計されたほう がよいと思います。 このとき,chaoneは完全にオープンソースですので, 必要ならば改変して使っていただいても何の問題もあ りません (誰もXSLTなんて使う気にならないかもしれ ませんが)。 いずれにしろ,linux版はパイプでつなげるだけですむ のに対し,windows版の場合は若干面倒ですが, set ParsedTextを利用して,他の解析器の解析結果を 取り込めば,合成は可能です。 実は私もここのgtalkが受け付けてくれるParsedTextの 仕様がよくわかっていません。品詞体系については, unidicの品詞を後処理で簡略化していますが,その他 の出力値についてもunidic + chaoneの出力のすべてが 必要ではないはずです。一方で,先日のW2のように, これがないとgtalkが落ちてしまうというものもあるよ うです。たとえば,AP (アクセント句)という単位がな くてもよいか,アクセント型がなくても動くのかといっ た情報があれば,後処理で,他の辞書を用いた解析結 果を,gtalkが受け付けてくれる形に変形することがで きると思います。 > unidic がなければ実現できない要素もあるので、 > unidic ベースの TTS も引き続きメンテナンスしたい、 > そのために unidic プロジェクトにも積極的に関わりたい、 > というのが galatea プロジェクトとしての私の希望です。 一応,unidicにも関わっている身としては,ユーザか らどんどん声を出していただきたいと思っています。 chaoneについても,これまでユーザからの声がほとん ど聞こえてこなかったのが,このmailing listでいろ いろとご指摘いただけるようになって助かっています。 From masa @ petile.com Thu Nov 26 03:05:23 2009 From: masa @ petile.com (=?ISO-2022-JP?B?GyRCJV4hPCVBJXMbKEI=?=) Date: Thu, 26 Nov 2009 03:05:23 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?GyRCJFIkaSQsJEokTiEhJEUhJiQhGyhC?= =?iso-2022-jp?b?GyRCISYkIyEmJCUhJiQnISYkKSEhJHJGSSReJEokJCQzJEgkLCQiGyhC?= =?iso-2022-jp?b?GyRCJGsbKEI=?= Message-ID: <4B0D71E3.9070103@petile.com> マーチンです。 重箱の隅をつつくような報告ばかりで申し訳ありません。 ひらがなの づ・ぁ・ぃ・ぅ・ぇ・ぉ を読まないことがあります。 どれも、使用頻度の少ない文字ばかりで、平仮名で使うことも ほとんどないので、実用上問題となる場面は少ないでしょうけど。。。 じぇっとき きゃびてぃ づぼらや ちぇっく を じっとき きびて ぼらや ちぇく と読み上げます。 「yomi is NOT katakana ... ぃ」 のようなメッセージが表示されています。 でも、これらをカタカナにすると、読んでくれます。 unidic-139 では、  ろけっと も読まなかったけど、unidic-1312 ではOKでした。 galatea4win-istc-2009-02.zip  + chaone-win-1.3.2-091118.zip  + DATE: NO TIME: NO  + unidic-chasen1312_sjis で確認しています。 From studioarc @ gmail.com Fri Nov 27 01:38:20 2009 From: studioarc @ gmail.com (Atsushi YAMADA) Date: Fri, 27 Nov 2009 01:38:20 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?GyRCJFIkaSQsJEokTiEhJEUhJiQhGyhC?= =?iso-2022-jp?b?GyRCISYkIyEmJCUhJiQnISYkKSEhJHJGSSReJEokJCQzJEgkLCQiGyhC?= =?iso-2022-jp?b?GyRCJGsbKEI=?= In-Reply-To: <4B0D71E3.9070103@petile.com> References: <4B0D71E3.9070103@petile.com> Message-ID: <4B0EAEFC.5040103@gmail.com> 山田です。 マーチンさん, いつも面白い例をありがとうございます。 > ひらがなの づ・ぁ・ぃ・ぅ・ぇ・ぉ を読まないことがあります。 > どれも、使用頻度の少ない文字ばかりで、平仮名で使うことも > ほとんどないので、実用上問題となる場面は少ないでしょうけど。。。 > > じぇっとき > きゃびてぃ > づぼらや > ちぇっく > > を > > じっとき > きびて > ぼらや > ちぇく > > と読み上げます。 ひらがな表記にすると,辞書にないため,未知語 になることが多いのですよね。 そして,unidicでは じぇっとき -> じ/ぇ*/っ/とき きゃびてぃ -> き/ゃ*/び/て/ぃ* づぼらや -> づ*/ぼら/や ちぇっく -> ちぇ/っ/く のような解析結果 (*の部分が未知語) になり (な かなかむちゃくちゃですが,*のついていない部分 は無理矢理何らかの語を割り当てています),未知 語の発音が原形のままひらがなになっているので, > 「yomi is NOT katakana ... ぃ」 > のようなメッセージが表示されています。 となって,gtalkに受け付けてもらえないようです ね。では,単純に未知語の発音をカタカナにすれ ばよいかというと,それである程度は救えるかな とは思いますが,それでもだめな例が出てきそう です。 後,「っ」に関しては未知語ではないのですが, 発音無しの補助記号という扱いなので,読み上げ られていません (「じぇっとき」の「っ」も読み 上げられないように思うのですが,log.chasenの 解析結果はどうなっていますか?)。 > でも、これらをカタカナにすると、読んでくれます。 これはカタカナ表記の未知語は全体で一語にする というchasenの仕様のおかげです。 > unidic-139 では、 >  ろけっと > も読まなかったけど、unidic-1312 ではOKでした。 たまたま,「ろけっと」は辞書に登録されていま した。 とりあえず,時間ができたら,上に述べた「未知 語の発音でひらがなのものは強制的にカタカナに 変換する」という後処理を入れてみようと思いま すが,これはあくまでも小手先の対応ですね。 ちなみにgtalkでは使えませんが,mecab版unidic だとまた違った結果になります。 いずれにしても形態素解析をすると,ひらがなが 読めなくなるという妙な現象が起きるわけです。 ひらがな表記をきちんと解析できる辞書を作ると いうのが一つの方法ではありますが,未知語問題 というのは決してなくならないので,あまり嬉し くはありませんね。 というわけで,小手先ではない解決は今後の課題 ということにしておいてください。 From masa @ petile.com Fri Nov 27 21:08:09 2009 From: masa @ petile.com (=?ISO-2022-JP?B?GyRCJV4hPCVBJXMbKEI=?=) Date: Fri, 27 Nov 2009 21:08:09 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?GyRCJFIkaSQsJEokTiEhJEUhJiQhGyhC?= =?iso-2022-jp?b?GyRCISYkIyEmJCUhJiQnISYkKSEhJHJGSSReJEokJCQzJEgkLCQiGyhC?= =?iso-2022-jp?b?GyRCJGsbKEI=?= In-Reply-To: <4B0EAEFC.5040103@gmail.com> References: <4B0D71E3.9070103@petile.com> <4B0EAEFC.5040103@gmail.com> Message-ID: <4B0FC129.8010404@petile.com> TO 山田さん マーチンです。 いつもお世話になっています。 > いずれにしても形態素解析をすると,ひらがなが > 読めなくなるという妙な現象が起きるわけです。 なるほど、そういうところが難しいんですね。  > というわけで,小手先ではない解決は今後の課題 > ということにしておいてください。 もちろん、それで構いません。よろしくお願いします。 From masa @ petile.com Sat Nov 28 14:25:56 2009 From: masa @ petile.com (=?ISO-2022-JP?B?GyRCJV4hPCVBJXMbKEI=?=) Date: Sat, 28 Nov 2009 14:25:56 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?GyRCRkNEaiROSjg7ek5zJE44ZSROGyhC?= =?iso-2022-jp?b?GyRCRklFQCRHOygyOyQsRn4kaxsoQg==?= Message-ID: <4B10B464.1000600@petile.com> マーチンです。 以下のような文字列があると、の最後の 、のところで ”ザー”という雑音が入ります。 ・ユーザ名、 ・そのまま、 ・虎の穴、 ・カタカナ、 ・(57) ・あな、 ・あま、 ・かな、 ・かま、 共通点は、ana や ama で終わることでしょうか? 、 を ) や 】 や > に換えても同じでした。 Windows Vista機 と Windows XP機 で確認しているので、 ハードの原因ではないと思います。 galatea4win-istc-2009-02.zip   + chaone-win-1.3.2-091118.zip   + DATE: NO TIME: NO   + unidic-chasen1312_sjis で確認しています。 From masa @ petile.com Sat Nov 28 15:17:10 2009 From: masa @ petile.com (=?ISO-2022-JP?B?GyRCJV4hPCVBJXMbKEI=?=) Date: Sat, 28 Nov 2009 15:17:10 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?R2FsYXRlYSBUYWxrIBskQiRHJVUbKEI=?= =?iso-2022-jp?b?GyRCJSElJCVrJE5GSSRfPmUkMiUiJVclahsoQg==?= Message-ID: <4B10C066.4010409@petile.com> マーチンです。 Galatea Talk を使って、テキスト、PDF、XLSファイルなどを 読み上げるアプリケーションを作ってみました。 まだ、バグはあると思いますが、ある程度の形まで出来たので 公開します。プログラミング初級者なので、恥ずかしくてソースは 公開できません。(^^; ソフト名は、「使ってみようGaleteaTalk」です。 http://mahoro-ba.net/e1105.html http://mahoro-ba.net/e1281.html に従ってインストールしてください。 「Visual C# 2008 Express Edition」で書いています。素人でも それなりのプログラムが出来てしまいます。 「xdoc2txt」というソフトで、ExcelファイルやPDFファイルを読み込み 「nkf」というソフトで、日本語EUC、UTF-8 のテキストファイルを読み込み 「LAME」というソフトで、MP3 ファイルに変換し、 「GalateaTalk」で読み上げるという、他人のふんどしで相撲を取っている だけのソフトです。 このメーリングリストで報告した不具合のいくつかは、 事前に文字列を変換  ・半角カタカナを全角カタカナに置き換え  ・改行以外の制御文字を削除  ・読めない単漢字を置き換え などをしたり、標準エラーの ”loadXML error (error code 0)”などを 検出して、GalateaTalk を再起動したりして、避けています。 試していただけて、感想・バグ報告などをお寄せいただけ たら幸いです。 From masa @ petile.com Sun Nov 29 14:34:36 2009 From: masa @ petile.com (=?ISO-2022-JP?B?GyRCJV4hPCVBJXMbKEI=?=) Date: Sun, 29 Nov 2009 14:34:36 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?GyRCRkNEaiROSjg7ek5zJE44ZSROGyhC?= =?iso-2022-jp?b?GyRCRklFQCRHOygyOyQsRn4kaxsoQg==?= In-Reply-To: <4B10B464.1000600@petile.com> References: <4B10B464.1000600@petile.com> Message-ID: <4B1207EC.7000500@petile.com> マーチンです。 この現象は、話者モデルが female01 の時だけのようです。 male01 では発生しませんでした。 失礼しました。 > 以下のような文字列があると、の最後の 、のところで > ”ザー”という雑音が入ります。 > > ・ユーザ名、 > ・そのまま、 From masa @ petile.com Sun Nov 29 14:57:28 2009 From: masa @ petile.com (=?ISO-2022-JP?B?GyRCJV4hPCVBJXMbKEI=?=) Date: Sun, 29 Nov 2009 14:57:28 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?GyRCISkkTjhlJE5KOEBhJHJGSSReGyhC?= =?iso-2022-jp?b?GyRCJEokJCQzJEgkLCQiJGsbKEI=?= Message-ID: <4B120D48.5090206@petile.com> マーチンです。 毎度、重箱の隅をつついています。 ?の後の文節を読まないことがあります。 ○ どうですか? 今日は天気です。 × どうですか? 私は元気です。 上の2文で、上の文は正常に読み上げますが、下の文は、”私は” を読みません。 ログファイルを見ると、上の文は、”?” と ”今日”は が分離 されているけど、下の文は、”?私は”でひとつとして扱われて いるようです。 ?マークの後の単語によるようですが、よくわかりません。 ○ どうですか? 今日は天気です。 ---------------------------------- × どうですか? 私は元気です。 ---------------------------------- ○ ですか? あしたははれです × ですか? あなたはばかです ○ ですか? 冬は好きです ○ ですか? 冬になりました ○ ですか? 冬の約束 ○ ですか? 冬で終わりです ○ ですか? 冬を知っています × ですか? 山は好きです × ですか? 山に登ります × ですか? 山の天気 × ですか? 山へ行きます × ですか? 山で遊びます × ですか? 山を知っています galatea4win-istc-2009-02.zip   + chaone-win-1.3.2-091118.zip   + DATE: NO TIME: NO   + unidic-chasen1312_sjis で確認しています。 From studioarc @ gmail.com Mon Nov 30 00:01:54 2009 From: studioarc @ gmail.com (Atsushi YAMADA) Date: Mon, 30 Nov 2009 00:01:54 +0900 Subject: [Galatea-users] =?iso-2022-jp?b?GyRCISkkTjhlJE5KOEBhJHJGSSReGyhC?= =?iso-2022-jp?b?GyRCJEokJCQzJEgkLCQiJGsbKEI=?= In-Reply-To: <4B120D48.5090206@petile.com> References: <4B120D48.5090206@petile.com> Message-ID: <4B128CE2.4060702@gmail.com> 山田です。 > ?の後の文節を読まないことがあります。 これは,今まで見過ごされてきたのが不思議な バグです。 > ログファイルを見ると、上の文は、”?” と ”今日”は が分離 > されているけど、下の文は、”?私は”でひとつとして扱われて > いるようです。 > ?マークの後の単語によるようですが、よくわかりません。 はい,これが原因です。 対策としては,chaoneのap_rule.xmlの一つめ, rule id="1"を無効にしてください。 「?」の品詞は補助記号-句点なので,id="3-1" が働くべきなのですが,規則の優先順位として, ので,id="1"が邪魔しています。 昔のgtalkでは,これに意味があったのかもしれ ませんが,現状ではおそらく不要です。 -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: ap_rule.xml 型: text/xml サイズ: 6445 バイト 説明: 無し URL: http://lists.sourceforge.jp/mailman/archives/galatea-users/attachments/20091130/57e49df3/attachment.bin