Skip to Content Java Solaris コミュニティ パートナー 開発者 マイ・アカウント ご購入について (0120-33-9096) Japan Worldwide

Feed Feed RSS 1.0 Feed RSS 2.0 Feed ATOM 1.0
オープンソースプロジェクトの翻訳作業を支援するサン 第1回 ~翻訳支援ツールをコミュニティと共に育てていきたい~
  次号へ  
多くのソフトウェアは、主として英語を使って作られている。そのために、国際化や地域化といった作業が欠かせない。このレポートでは、オープンソースの地域化 (l10n - ローカリゼーション)/国際化 (g11n - グローバリゼーション) について紹介すると共に、サンが公開している翻訳支援ツールについて解説する。

現在、新しい優れたソフトウェアが世界中で作られている。特に、オープンソースソフトウェア (以下、OSS) の躍進が著しい。これらのソフトウェアを使うためには、その国際化と地域化 (日本では日本語対応) が欠かせない。

ソフトウェアを特定の言語で使用できるようにする地域化作業を「ローカリゼーション」と呼ぶ。業界では「l10n (エルテンエヌ)」と呼ぶこともある。これは「localization」(地域化) の "l" と最後の "n" の間に10個の文字があることに由来している。同様に、国際化作業を「g11n (ジーイレブンエヌ)」(globalization)、「i18n (アイエイティーンエヌ)」(internationalization) と呼ぶこともある。国際化/地域化では、次のような作業が必要になる。

g11n: 国際化 (多くの言語を取り扱えるようにする)
  • メニューやメッセージ
  • 内部データやファイル形式
  • オンラインヘルプ

l10n: 地域化 (特定の言語に対応/翻訳する)
  • メニューやメッセージ
  • 内部データやファイル形式
  • オンラインヘルプ
  • ドキュメント
  • 各言語の独自ルールに対応する (例: 日本語の縦書き、ふりがな対応)

OSSでは、このような作業をコミュニティ主導で行なってきた。十分な作業量と質をカバーするためには、多くの自発的な作業者を集める必要がある。日本でも、多くの有志により作業が行われてきたが、ソフトウェアごとの対応では不足する部分も多々ある。そのため、OSSをビジネス利用するのに合わせて、企業がこのような作業を行い、それをコミュニティに還元する例も増えてきた。

サンでは、多くのソフトウェアの国際化/地域化を行なっており、このような作業について、多くの支援ツールとノウハウを持っている。そして、これを誰でも自由に利用できるよう、その一部を公開している。


翻訳作業を効率よく進めるために、次のようなツールが利用される。

  • Glossary : 訳語集
  • 翻訳メモリー、翻訳メモリーツール : 過去の翻訳例を集めたデータベース、および、そのデータベースから翻訳例を自動的に探し出すツール

「Glossary」(グロッサリ)は、これまで翻訳した用語のデータベースである。たとえば「extension」という言葉は、ソフトウェアによって「拡張」「拡張子」「拡張機能」といった異なる訳語が用いられている。「Glossary」を使うと、どのツールでどのような訳語が使われているか素早く検索できる。

「翻訳メモリー」は、過去の翻訳例文を自動的に探し出すツールである (参考リンク、Wikipedia : 翻訳メモリー)。機械翻訳のように、自動的に訳文を作り出すのではない。以前に訳した同様の文章を素早く検索し、その一部またはすべてを流用することで、翻訳作業の効率アップと品質を一定に保つ効果がある。プロの翻訳者の間では、TRADOSという商用翻訳メモリーツールが幅広く使われている。また、オープンソースの翻訳メモリーツールも登場している。


SunGloss」は、サンがリリースしているソフトウェアのGlossaryである。Java、Solaris、StarSuiteといったソフトウェアの用語を網羅している。Webアプリケーションとなっており、ユーザー登録を行えば、誰でも利用できる。

では、簡単に使い方を説明しよう。
最初に、ユーザー登録を行う。login 画面で「If you are a new user you can register here」というリンクをクリックすると、ライセンス条項画面と、ユーザー登録画面が表示されるので、必要な情報を入力する。登録したユーザー名でログインするとSunGloss のメイン画面が表示される。

ログインするとSunGloss のメイン画面が表示される
SunGloss
クリックで拡大

用語を検索するには、次のように操作する。まず、メイン画面で [Searching] -> [Search for Term] をクリックする。「Term Search」画面が表示されたら、必要事項を入力する。

  • Search for:検索語を入力 (例) 『extension』
  • Search Language: 検索語の言語を選択
  • Target Language: 検索したい訳語の言語を選択
  • Product Lines: 検索対象となるソフトウェア
「extension」の訳例を検索する
SunGloss
クリックで拡大

最後に [Start To Search] をクリックすると、訳語 (Term) が一覧表示される。訳語の右端に表示されている赤い四角をクリックすると、コメントが表示される。

「extension」の訳語を一覧表示する
SunGloss
クリックで拡大

SunGlossでは、ユーザーごとに3つの権限 (Role) が設定されている。登録したばかりのユーザーは "End user" となる。この権限では、訳語の登録や修正などの編集作業はできない。より上位の権限は、サン内部の管理者がデータベースの管理に使用している。

このような大規模Glossaryは、他のソフトウェアの地域化に際しても、参考資料として利用できる。また、日本語訳がないドキュメントを読む際にも、参考になる。SunGloss の管理者である、日本語Language Leadのブログにも SunGloss の使い方について紹介がある。


「OLT - Open Language Tools」は、サンが開発した翻訳支援ツールSunTransを、オープンソースライセンスのひとつであるCDDL(Common Development and DistributionLicense)で公開したものである。現在も、サンの翻訳作業で利用している。

なお、現在のOLTは、スタンドアローンで動作する。サーバー側で翻訳情報 (翻訳メモリー、TM とも呼ぶ) を共有する機能を持っているが、サーバー側のツールはまだ公開されていない。

OLTは、java.net で開発/公開されている
OLT
クリックで拡大

OLTでは、翻訳の作業用ファイルとしてXLIFF (XML Localization Interchange File Format、「エックスリフ」) というファイルフォーマットを使用する。このファイルは、翻訳情報をやりとりするためのXMLベースのファイルフォーマットで、OASISにより標準化されている。

OLTは、「XLIFF Filters」と「XLIFF Translation Editor」という2つのツールで構成されている。XLIFF Filtersは、HTMLファイルやOpenOffice.org形式ファイルといった翻訳対象のファイルをXLIFFに変換するフィルタツールである。変換作業は、ファイルをドラッグ&ドロップするだけで行われる。

多くのファイルをXLIFF形式に変換するXLIFF Filters

XLIFF Filtersは、次のファイル形式を変換できる。

ドキュメントのファイル形式
  • HTML
  • Docbook SGML
  • JSP
  • XML (汎用 - 個々の XML タイプに応じた構成ファイルが必要)
  • OpenOffice.org : sxw、sxc、sxi
  • Open Document Format : odt、ods、odp
  • プレーンテキスト

メッセージのファイル形式
  • PO (gettext)
  • Msg/tmsg (catgets)
  • Java .properties
  • Java ResourceBundle
  • Mozilla .DTD リソースファイル

XLIFF Translation Editor (以下、XLIFF Editor) は、翻訳メモリーツールにあたる。XLIFFファイルを読み込んで、その翻訳情報を管理/編集する。入力した訳文は、そのまま保管され、同様の文が登場したときにすぐに利用できる。また、翻訳済みの文書を元のファイル形式で出力できる。

オリジナルの文書 (左側) に対応する訳文 (右側) を効率よく扱うXLIFF Translation Editor
XLIFF Translation Editor
クリックで拡大

XLIFF Editorの使い方は、それほど難しくない。事前に、翻訳対象となるドキュメントをXLIFF FiltersでXLIFFファイルに変換しておく。XLIFF Editorを起動したら、まず最初に [File] -> [New Project] でプロジェクト (Project) を作成する。このプロジェクト単位で翻訳情報が miniTM (ミニティーエム) として管理される。

XLIFF Editorは、文の "." (ピリオド) または ":" (コロン) を区切りとして、セグメント (Segment) という単位で文章を取り扱う。

"Open File"ボタンで、変換しておいたXLIFFファイル (*.xlif、*.xliff) を開くと、XLIFF EditorはminiTMを調べて、セグメントの行頭にタグを表示する。以前にまったく同じ英文 (訳文) があれば、100%マッチとして自動的に適用してくれる。一部だけ一致したセグメントには「Fuzzy」タグが表示される。

ユーザーは、まったく一致のなかったセグメント、または、Fuzzy マッチの中で実際の英語と対応していない部分の訳文を、右側のTarget Windowsに入力していく。訳文を入力するごとに、"Confirm and Translated Next" ボタンをクリックする。

翻訳が完了したら、"Save File" ボタンで、XLIFFファイルを保存する。さらに、[Tools] -> [Convert to Original] で、翻訳結果を元のファイル形式に変換できる。

以前に訳したことのある文章を見つけ出し、100%マッチとして適用する
XLIFF Translation Editor
クリックで拡大

このような翻訳支援ツールは、小説やコラムのように文章のスタイルが一定でない文書の翻訳には向かないが、コンピュータのドキュメントや企業文書のように、文書のスタイルがほとんど同じ場合には効果を発揮する。しかし、翻訳メモリー (ツール) については、プロの翻訳家の間ではよく知られているが、研究者や技術者が必要に迫られて文書を翻訳する場合にはまだまだ使われていない。このようなツールが幅広く使われたり、訳文を共有できるようになれば、翻訳に慣れていない人の作業効率も上がる。

サンの東京ソフトウェア本部 日本語製品開発統括部でサン製品の日本語化の品質に責任を持つ斎藤玲子は、「このツールをコミュニティといっしょに育てていきたい」と語っている。そのために、日本Linux協会といっしょに「サン翻訳支援環境に関するセミナー」を開催している。

そこで次号では、サンの具体的な翻訳作業について取り上げると共に、コミュニティとの共同作業について解説する。

※著者のタイトル、所属等は、執筆当時のものであり、現在と異なる場合があります。
また、日本サン・ユーザ・グループは2007年6月をもって休会しております。

  次号へ  
ご意見・ご感想をお聞かせください
この記事は参考になりましたか?
     

コメントがございましたらご記入ください


ページ先頭へ

Sun Fun Times


※著者のタイトル、所属等は、執筆当時のものであり、現在と異なる場合があります。
また、日本サン・ユーザ・グループは2007年6月をもって休会しております。

 

お問い合わせ 会社情報 ニュース 採用情報 プライバシー 利用規定 商標 Copyright  Sun Microsystems, Inc.