Nim ウェブサイトのローカライズ方法

執筆開始 - 2022年05月18日(水)

この記事は未完成です。

Nim ウェブサイトのリポジトリ

Github はリジュームダウンロードに対応していない。通信速度制限下では、安全性が確認されているフリー WiFi 経由でのダウンロード、

または OSDN シェルアカウントでダウンロード後に WinSCP などで自分のホームディレクトリをダウンロードする (所要時間は三時間ほど)。

なお、 シェルアカウントログインできない場合は Pagent に鍵が登録されていない場合がある (Paget の Add Key から登録)。

master.zip

現在のところ、 OSDN へミラーリングを行う予定はない。また、定期的に更新されるので、月に一度はダウンロードし直したほうがいい。

Jekyll のインストール方法 (Windows)

master.zip の展開と RubyInstaller と必要なモジュールのインストールは済ませてあるものとする (新しいハイエンド PC を現金一括で購入する機会に恵まれたら改めて追記する)。

  1. スタートメニューから Start Command Prompt with Ruby を選ぶ。
  2. ネットワークに接続後、以下のコマンドを入力する。こうしなければ正常に動作しない。
gem install jekyll bundler
gem install wdm
gem install webrick

動作確認

  1. master.zip の展開先のルートディレクトリに移動する。
  2. ネットワークに接続後、以下のコマンドを入力する (そうしなければ正常に表示されない)。
cd jekyll
jekyll serve
  1. しばらくすると Server address が表示されるので、そのアドレスをウェブブラウザで開く。
  2. 正常に表示されたら Jekyll と Nim ウェブサイトのローカライズ環境 (簡易) は準備完了である。あとはコマンドプロンプト側で Ctrl+C をしてサーバを停止する。

より専門的な翻訳環境の構築

前述したとおりの環境構築を終えたら、テキストエディタでサイト関連のデータを編集してもよいが、

今時のオープンソース翻訳ではそんなことをせず翻訳メモリを使うのが一般的になりつつある (と信じたい)。

ここでは OmegaT の簡単な導入方法を Nim ウェブサイトのローカライズの連携方法を記しておきます。

1. OmegaT のインストールと初期設定

  1. 公式サイトから通常版をダウンロードする。通常は 64 bit JRE 付きを選ぶ。
  2. ダウンロードが終わったらインストラーをクリックして手順を進めていく。
  3. Okapi Framework の OmegaT プラグインを導入する。後で加筆する。
  4. OmegaT を起動後、プロジェクトメニュー → 新規作成を選択する
  5. 任意の空フォルダを作成して選択し、保存ボタンを押す。
  6. プロジェクトの新規作成ウィンドウが表示されるので、保存ボタンを押す。
  7. 翻訳対象ファイル一覧のウィンドウが表示されるので Esc を押して閉じる。
  8. プロジェクトメニューからプロジェクト構成物 → プロジェクトフォルダを選択する。
  9. エクスプローラのウィンドウが開くので、 Nim ウェブサイト (master.zip) の内容を source ディレクトリへ展開またはコピーする。 この場合、 website-master ではなく、その配下の内容を source へ配置する。そうしないと target フォルダで jekyll serve --incremental による確認ができない。 9 . コピーし終えたら、 OmegaT のウィンドウに戻り F5 を押す。これで作業対象ファイルが表示……されない (feed.xml でエラーになる)。
  10. しかたないので、このファイルをリネームして一時的に除外する。
  11. これで翻訳準備は完了です。

良くある誤解: 翻訳されてないぞ!

OmegaT は機械翻訳ソフトやサービスではないので、読み込んだら自動的に翻訳されるわけではない (一応、有料のウェブ翻訳サービスを参考訳文として使うこはできる)。

翻訳メモリという名前が指すとおり、人間側で訳文を入力、あるいは汎用対訳データ形式を取り込むことで再利用可能な対訳データを蓄積していくわけです。

蓄積されたデータは人間が手を入れたデータのなので、割と精度の高いだけでなく、ほかのプロジェクトで流用することができる。

とはいえ、導入初期は対訳データ用語集の構築は煩雑であり、なかなか面倒に感じるかもしれない (とはいえ、当方が公開している翻訳データから流用できるので、ある程度は気が楽だと思う)

このように使い込むと非常に強力な武器となるが、対訳データの整備を怠ると対訳文の一致率が下がったり、質の悪い対訳データが紛れ込んで汚染を招くなど欠点もあるため、運用には高度な技能が必要である面も否めない。

本業の翻訳者は翻訳メモリに対して強い抵抗感を持つ者も多いとはいえ、産業翻訳分野では主流となっている。

2. 実際の作業について

アライメントエディタや機械翻訳ソフト、OmegaTの使い方や設定方法、そしてTMXファイルの作成方法は検索すれば見つかりますので、おおまかな流れのみ記しておきます。

初期段階:

  • 原著の下読み
  • 参考訳文など TMX 形式の対訳データ作成 (Maxprograms TMXEditor など)
  • 用語集の整備
  • プリエディット、校正

中期段階

  • OmegaT での翻訳作業、(jekyll とブラウザで訳文データの確認)
  • Jekyll 関連ファイルの翻訳・改訳 (今回は過去の対訳データを使用可能)
  • ニュースページの翻訳 (一気に揃える場合は機械翻訳で暫定対処、段階的に差し替える。または最新記事から翻訳していく)

最終段階

  • 一般公開(ウェブサーバ)
  • 校正作業
  • 誤訳などの確認
  • OmegaT で出力した訳文ファイルの調整 (必要に応じて)

公開後:

  • ユーザのバグレポートに基づく修正
  • 原著の更新に伴う更新作業
  • 可能であれば、公式サイトとの統合運営

スペルチェックと報告

実際の作業に入る前にプリエディットをしておくことで原著の信頼性、作業時間のわずかな短縮に加えて翻訳精度を上げることができる。

原著の誤字脱字衍字、文法やスタイルの誤り指摘を酷く嫌いグラマーナチ呼ばわりする者も多くいるだろうが、 修正しないまま放置され続けたことにより致命的な誤訳を招いたり、ソフトウェアの支持を失いかねないことも理解しておく必要がある。

スペルチェック用のツールとしては LibreOffice Writer や HelpNDoc などを使うほか、 OmegaT にもスペルチェック機能がある。

参考文献