Takuro Ashie
ashie****@homa*****
2006年 11月 13日 (月) 14:24:13 JST
足永です。 On Sun, 29 Oct 2006 23:01:10 +0900 Takuro Ashie <ashie****@homa*****> wrote: > 後で、今回の変更点の意義や問題点、今後の展望などについてもう少し詳しく説 > 明します。 大変遅くなりましたが、Google Summer of Codeの成果報告も兼ねてて少し説明 を加えてみます。今回のGoogle SoCでのハーダーさんの成果により、 tomoe-0.3.0及びlibtomoe-gtk-0.3.0の組み合せで、新たに以下のようなことが 可能となりました。 * 複数辞書の同時使用/GUIでの辞書セットの編集 * XSLTによる他形式辞書の変換 * GUIでの新たな手書きデータの登録 * 既存の手書きデータの閲覧 * 「読み」での文字検索 * その他、各種文字情報の表示 無事、Google Summer of Codeでの目標を達成することができました。 ハーダーさんお疲れさまでした。また、Google、FSIJに感謝致します。 一方で、元々のコードの未熟さや、開発期間の短さ、コミュニケーション不足等 から、以下のような課題も残されています。ひとまず当面はこれら問題の解消が 急務だと考えています。 * 起動が非常に遅い(XML/XSLTデータベース初期化) - 事前のマージやコンパイルが必要? * 「読み」検索でひらがな/カタカナ(訓読み/音読み)を区別してしまう - すぐ修正可能 * 新規文字の登録方法が分かりづらい - 候補文字リストのとなりに「新規登録ボタン」を置くのが良いか? * 全体的に情報の表示方法がこなれていない - 文字テーブルウィジェットを追加 - 文字情報の編集はダイアログの階層が深すぎる? - 色々トライしてユーザーからのフィードバックが必要 * APIが不安定 - データ構造の表現方法に問題あり - 命名規則に問題あり - バージョニング規則を決めていない 新規登録が分かりづらい点に関しては、内海さんが解説ページを作成して下さい ました。ありがとうございます。 http://www.geocities.jp/ep3797/tomoe_01.html ただし、今後の修正でこの辺のUIは大きく変更される可能性が高いです。今回の 成果はまだまだ通過点に過ぎず、今後以下のような拡張を考えています。 * JIS第2水準文字以降の手書きデータの収集 - 不足文字を一覧できるようなインターフェースが必要 - 出来ればバザールモデルでやりたい (協力者の方々にそれぞれ担当領域を割り振って確実に埋めていきたい) * 日本語以外の手書き文字データの収集 * 「手書き」「読み」以外の手段での文字検索 - 画数検索 - CHISEの成果を利用した、文字の部品による検索 - UNIHANデータベースの利用? * インターフェースの洗練 - 文字テーブルウィジェット - 文字情報ツールチップウィンドウ - 手書き文字のアニメーション * libgucharmapの利用、あるいはコードの取り込み * 手書き認識エンジンのプラグイン化 * データベースバックエンドのプラグイン化 * Qt用インターフェース * Ajaxインターフェース ただし目標としてはシンプルで、以下の2点のみを考えています。 * MS-IME並の単漢字検索 * 文字情報データベースをバザール的コラボレーションで整備できるような 仕組みの提供