2014.1jp にむけたテキスト解析辞書の更新内容を記録のためにチケット化します。
チケット #29508 日本語テキスト解析の辞書登録機能 の実装と並行して行ったもので、テストケースとして以下が追加され、これらをカバーするように mecab 辞書および点訳エンジンのチューニングが行われました。
diff --git a/jptools/mecabHarness.py b/jptools/mecabHarness.py index 1757128..b3317d9 100644 --- a/jptools/mecabHarness.py +++ b/jptools/mecabHarness.py + {'text':'足手纏い', 'braille':'アシデ マトイ'}, + {'text':'来る3月には', 'speech':'キタルサンガツニワ'}, diff --git a/jptools/harness.py b/jptools/harness.py index 0435cb3..f13c889 100644 --- a/jptools/harness.py +++ b/jptools/harness.py { + 'text': '貴商店', + 'input': 'キ ショーテン' + }, + { + 'text': '故池上先生', + 'input': 'コ イケガミ センセイ' + }, + { + 'text': '前校長', + 'input': 'ゼン コーチョー' + }, + { + 'text': '全5巻', + 'input': 'ゼン 5カン' + }, + { + 'text': '超現実的', + 'input': 'チョー ゲンジツテキ' + }, + { + 'text': '当施設', + 'input': 'トー シセツ' + }, + { + 'text': '反社会的', + 'input': 'ハン シャカイテキ' + }, + { + 'text': '非人道的', + 'input': 'ヒ ジンドーテキ' + }, + { + 'text': '満3年', + 'input': 'マン 3ネン' + }, + { + 'text': '新時刻表', + 'input': 'シン ジコクヒョー' + }, + { + 'text': 'ご挨拶かたがた', + 'input': 'ゴアイサツ カタガタ' + }, + { 'text':'久代さん', 'input':'ヒサヨ サン'}, + { 'text':'新家さん', 'input':'シンケ サン'}, + { 'text': '大慌て', 'input': 'オオアワテ'}, + { 'text': '大いなる', 'input': 'オオイナル'}, + { 'text': '大男', 'input': 'オオオトコ'}, + { 'text': '大川', 'input': 'オオカワ'}, + { 'text': '大阪', 'input': 'オオサカ'}, + { 'text': '大旦那', 'input': 'オオダンナ'}, + { 'text': '大づかみ', 'input': 'オオヅカミ'}, + { 'text': '大人数', 'input': 'オオニンズー'}, + { 'text': '大田', 'input': 'オオタ'}, + { 'text':'久代', 'input':'ヒサヨ'}, + { 'text':" 御園 ", 'input':' ミソノ'}, + { 'text':'参加者 御園、田中、中原、御園', 'input':'サンカシャ ミソノ、タナカ、ナカハラ、ミソノ'},
2014.1jp にむけたテキスト解析辞書の更新内容を記録のためにチケット化します。
チケット #29508 日本語テキスト解析の辞書登録機能 の実装と並行して行ったもので、テストケースとして以下が追加され、これらをカバーするように mecab 辞書および点訳エンジンのチューニングが行われました。