[Scim-imengine-dev 1127] [OT] zip での日本語ファイル名の文字化けについて

Back to archive index

UTUMI Hirosi utuhi****@yahoo*****
2006年 5月 19日 (金) 09:33:45 JST


内海です。

> [OT 2]
> Windows で作った 日本語 zip ファイルを解凍すると文字化けするのですが、
> convmv で文字コードを変更しても修正できません。
> sjis でも eucjp でもない、壊れたファイル名を出力しているような気がする。

p7zip の作者 "my space" さんから丁寧な返事をいただきました。
(thanks "my space")
https://sourceforge.net/tracker/?func=detail&atid=660493&aid=1490683&group_id=111810

-------c-------c-------
zip は ファイル名を byte の配列としてしか保存できない。
この byte の配列 は、ファイルを圧縮したときの (今回の場合は Windows の)
codepage でエンコードされている。
http://msdn.microsoft.com/library/default.asp?url=/library/en-us/intl/unicode_81rn.asp

zip 形式では codepage が何であるかの情報が保存されていないので、
解凍プログラム側でファイル名の codepage を推測することができない。
従って 非ASCII文字 (英語以外の文字) を使うときは、
別の圧縮形式を使うべきだ。
RAR, 7z はファイル名を Unicode 形式でエンコードする。

wine で日本語 zip ファイルを正しく開けるのは、
正しい codepage を使うように wine が設定されているからだと思う...

p7zip や他のどの unzip プログラムもこの問題を修正できない。
なので、このとても古い形式 (zip) を使うのはあきらめて。
-------c-------c-------c-------

"丁寧な返事をくれてありがとう" と書こうとしたが、
既にバグが閉じられていて返信できなかった。


--------------------------------------
Yahoo! JAPAN 10th Anniversary Special Feature
--- Enjoy Yahoo! Auction with Yahoo! Mail !! ---
http://pr.mail.yahoo.co.jp/auction/



Scim-imengine-dev メーリングリストの案内
Back to archive index