wikipediaを持ち歩く

wikipediaをインターネットからではなく、電子辞書のようにオフラインで利用したい。
携帯電話が圏外の場所とか、インターネットのレスポンスに不満があるときは、wikipediaを電子辞書のように持ち歩くのが一番!

「windows mobile」「ipod」に入れてwikipediaを持ち歩く方法が、ネット上に数多く紹介されています。ここもそんな1つです。

wikipediaのデータをダウンロードして、電子辞書形式の「EPWING」と呼ばれる形式に変換します。
EPWING形式のファイルを扱えるソフト(検索、閲覧)、EBWin、EBPocket、iDicなどを利用します。

wikipediaをダウンロードする

wikipedia日本語版のアーカイブ(XML版)をダウンロード
-abstract.xml – ページの最初の段落とリンクのみを抽出
-pages-articles.xml – ノートページ、利用者ページを除く最新版のダンプ
-meta-current.xml – 全ページの最新版のダンプ
-pages-meta-history.xml – 全ページの全ての版のダンプ

EPWING形式に変換する

変換に利用するソフトは、「FreePWING(1.6以降)
と「wikipedia-fpw」をダウンロードする。
* perl5.8以降
* Perlは、64ビットintとlarge fileをサポート(HONMONファイルが2Gを超えるため)→perl -Vコマンドで確認可
* 数式を収録には、mimeTeX及びImage::Magickモジュールが必要
* wikipedia-fpw.confを必要に応じて書き換える(数式を用いない場合は、’enable_math’を0にする)
ダウンロードしたwikipediaのXMLファイルをwikipedia-fpwのディレクトリに’wikipedia.xml’名で置く。
変換するXMLファイルがあるディレクトリで下記コマンドを実行(fpwmakeは数時間かかる)

# fpwmake
# fpwmake catalogs
# fpwmake package

できあがるファイル
|-WIKIP/
| |-DATA/
| | |-HONMON.ebz
| |
| |-GAIJI/
|
|-CATALOGSファイル
|-GFDLファイル
|-README.PKGファイル

ebzipに圧縮する

EBWin Unicode版(windowsで動くEPWING形式の辞書検索閲覧ソフト)
付属しているEBShrinkで辞書を圧縮できる。

HTML5