Description du projet

NHocr is a command line OCR (Optical Character Recognition) program for Japanese language, etc. It has been designed to recognize machine-printed Japanese characters and some ASCII characters/symbols in an image. NHocr is probably the first Open Source Japanese OCR software (offline, machine-printed), except some experimental, partial codes open to academic communities.

The main repository, originally at Google Code, has been migrated to here. Older versions can be found at Google Code.

You can test-drive NHocr using the following:
* Japanese character recognition WeOCR service
* Capture2Text

2015-01-02 00:32
Évaluation de どんぐり

Évaluation :
(1$ de 17 personnes ont trouvé cet avis utile)
Windows 上でビルドしました。 ・MinGW 上です。 ・freetype 2.5.4 は何故かgzipあたりでリンクエラーになるのでソースをコメントしました。(たぶん使ってないところだろうと思いました?) ・NHOCR 0.22 はシンボリックリンク関係を手動でコピー(ヘッダとLIB)しました。  以上でWindows上でも動作することを確認しました。 ・辞書のディレクトリを環境変数だけでなく、引数指定もあればうれしいかと・・  (いやはい、自分でやります) ・makechar 等のusage関係は読みましたが、今一つ辞書の取扱いがわからないです。  文献を探したのですが見当たらず・・  これもソースみるかと思いましたが、そのまえにレビューに書いとくと何かアップされるかな?^^;; と思ったり。(えぇまぁソース見ます) 15倍も早くしなくていいのですが、今後もよろしくお願いします。

2014-12-13 09:51
Évaluation de y_araki

Évaluation :
(1$ de 15 personnes ont trouvé cet avis utile)
本のスキャン画像のページ番号(主に縦書き漢数字)を認識する、という限られた用途で試してみました。 ・Linux(CentOS6)上で、すんなりビルドできて動きました。 ・画像ファイルはPPMに変換しました(ImageMagickを使用)。 ・標準出力に出力する機能が意外と便利です。 ・縦書き漢数字の認識は、うまく行ったり行かなかったりでした。"一二三"等の縦書きは人の目で見ても識別しづらいので、仕方ないところでしょう。

2013-08-29 00:11
Évaluation de Anonyme

Évaluation :
(1$ de 14 personnes ont trouvé cet avis utile)
