エケペディア (2016/04/17) | 2016-04-17 12:18 |
Assassin's Creed (2016/04/17) | 2016-04-17 18:58 |
Brain Wiki (2023.06.01) | 2023-06-01 21:04 |
EnglishWikipedia (2023.06.01) | 2023-06-04 20:09 |
Enpedia (2016/04/03) | 2016-04-03 08:41 |
EsperantoWikipedia (2022.03.01) | 2022-03-09 16:33 |
Minecraft (2017.07.03) | 2017-07-03 23:21 |
Monapedia (2016/04/17) | 2016-04-17 19:26 |
ONE PIECE (2016/04/17) | 2016-04-17 19:27 |
Uncyclopedia (2020.03.06) | 2020-03-06 14:58 |
UncyclopediaImage (2023.02.28) | 2023-03-02 17:20 |
Wikibooks (2022.03.01) | 2022-03-09 16:09 |
Wikinews (2022.03.01) | 2022-03-09 15:18 |
Wikipedia (2022.09.01) | 2022-09-02 23:54 |
Wikiquote (2022.03.01) | 2022-03-09 16:37 |
Wikisource (2022.03.01) | 2022-03-09 16:38 |
Wikispecies (2022.03.01) | 2022-03-09 16:43 |
Wikitravel (2016/04/17) | 2016-04-17 12:54 |
Wiktionary (2022.03.01) | 2022-03-09 16:50 |
ファイナルファンタジーXIV (2016/03/29) | 2016-03-29 18:31 |
Yourpedia (2016/04/03) | 2016-04-03 08:39 |
唐澤貴洋wiki (2016/04/17) | 2016-04-17 12:20 |
以下のワークフローに従って変換を行います。
各 Wiki サイトが公開している XML ダンプをダウンロードするか、Wikix や Wikiteam 等のツールを使用して取得します。
Wikimedia 財団は運営している Wiki の XML ダンプを公開しており、下記のリンクからダウンロード可能です。他言語のファイルはリンクの "jawiki" を変更することで入手可能です。例えば、英語版は "enwiki" です。
Wikipedia 日本語版 | WikiBooks 日本語版 | Wikinews 日本語版 | Wikiquote 日本語版 | Wikisource 日本語版 | Wiktionary 日本語版 | Wikiversity 日本語版 | Wikispecies | Wikidata |
Uncyclopedia 日本語版は https://download.uncyc.org/ja-wiki.zip からダウンロード可能です。ダウンロード可能な全ファイルを表示する場合は https://download.uncyc.org/ にアクセスします。ただし、2019 年以降データが破損しています。
ダウンロードしたファイルが圧縮されている場合は、7-Zip 等を用いて解凍します。
変換は MkXTBWikiplexus の build.unix フォルダ内で行います。ここではこの build.unix フォルダを BUILD と表現します。コマンド等は環境に合わせて置き換えてください。
ダウンロードした XML ファイルを BUILD フォルダに移動します。その後以下のコマンドを実行してください。PC の性能や Wiki の規模によりますが、変換には数十分から数時間かかります。
"output name" には出力するファイルの名前を指定します。下記の規則を参考に入力します。
Wiki名-変換日.xtbdict Wiki名は "言語 + Wiki 省略名" となります。 例えば、Wikipedia 日本語版は jawiki、Uncyclopedia 英語版は enunwiki、Wiktionary 日本語版は jawiktionary となります。 変換日は YYYYMMDD の 8 桁です。 例えば、2023 年 1 月 1 日は "20230101" となります。 よって、2023 年 1 月 1 日の Wikipedia 日本語版を変換する場合は "jawiki-20230101.xtbdict" と入力します。 つまり、2023 年 1 月 1 日の Wikipedia 日本語版を変換する場合は以下のようなコマンドとなります。 $ ./MkXTBWikiplexus-bin -o jawiki-20230101.xtbdict < jawiki-latest-pages-articles.xml
なお、このコマンドでは大量の出力が出ます。これを表示させないようにするには、コマンド末尾に
を追加します。ただし、これを使うとエラーも表示されなくなるので注意が必要です。
完了したら次のコマンドを実行します。以降、コマンドの先頭に付けるドットが 2 つになる (../) ので注意してください。これも数十分から数時間かかります。
完了したら以下のコマンドを実行します。
変換によって作成された Articles.db は XTBook 専用の rax ファイルに圧縮可能です。rax は透過的圧縮であるため、解凍することなくそのまま辞書として使用できます。Articles.db を rax 形式に圧縮するには次のコマンドを実行します。圧縮後は元の Articles.db は削除しても構いません。
なお、パイプを用いて MkXTBWikiplexus-bin と圧縮を同時に行うこともできます。Articles.db ファイルを介さない分、ストレージ使用量と変換速度の向上が期待できます。
最後に辞書ファイルの情報を記述したファイルを作成します。BOM なし UTF-8 を指定可能なテキストエディタを用意してください。最新の Windows 10/11 を使っているならメモ帳でも構いません。
例として Wikipedia 日本語版で使用している Info.plist ファイルです。
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE plist PUBLIC "-//Apple//DTD PLIST 1.0//EN" "http://www.apple.com/DTDs/PropertyList-1.0.dtd"> <plist version="1.0"> <dict> <key>XTBDictionaryIdentifier</key> <string>com.nexhawks.XTBook.Wikipedia.ja</string> <key>XTBDictionaryScheme</key> <string>jawiki</string> <key>XTBDictionaryTypeIdentifier</key> <string>com.nexhawks.XTBook.Wikiplexus</string> <key>XTBWikiplexusArticlesFile</key> <string>Articles</string> <key>XTBWikiplexusTemplatesFile</key> <string>Templates</string> <key>XTBWikiplexusSiteInfoFile</key> <string>SiteInfo.plist</string> <key>XTBWikiplexusSearchFile</key> <string>Search</string> <key>XTBWikiplexusSchemeForImages</key> <string>jawikiimg</string> <key>XTBDictionaryDisplayName</key> <string>ウィキペディア 日本語版</string> </dict> </plist>
色がついている部分を辞書ごとに書き換えます。緑色の部分は Wikipedia 日本語版であれば com.nexhawks.XTBook.Wikipedia.ja、Uncyclopedia 日本語版は com.nexhawks.XTBook.Uncyclopedia.ja となります。水色の部分は output name を決めたときの Wiki 名 (jawiki や jawiktionary) となり、黄色の部分はそれに img を付け足したものとなります。赤色の部分は表示される辞書名を入力します。書き換えが完了したら文字コードを UTF-8 にして、ファイル名 Info.plist で Articles.db (圧縮した場合は Articles.db.rax) 等のファイルがあるフォルダに保存します。
これで辞書ファイルの作成は完了です。
[PageInfo]
LastUpdate: 2022-10-08 16:55:44, ModifiedBy: watamario15
[Permissions]
view:all, edit:members, delete/config:members