有限会社ドットワン

多言語対応の文字コード

2007年1月28日

この記事は書かれてから3年以上経過しています。内容が古くなっている可能性があります。

複数言語の混在したサイト

世界中の様々な人が使うツールとなったインターネット。
以前から、国内外を問わず商品やサービスを展開している企業や団体のサイトでは、日本語の他に英語や韓国語、中国語など、言語ごとに違ったページを用意するという手段が取られてきました。
しかし、様々な言語を併記する必要がある場合もあります。

  • 対訳を併記した文章
  • CIマニュアル
  • 広報資料
  • 著作権表示などのアナウンス
  • 外国語学習サイト
  • 地名・人名など固有名詞

現在、一般的に使用されているWindows XPでは、オプションを設定することで設定、英語と日本語以外の言語を表示することが可能です。また、Mac OS Xでは、表示だけではなく、入力も行うことができます。

これは、Mac OS Xの文字処理にユニコード(Unicode)が採用されており、世界の主要な言語の文字を扱えるようになったためです。ユニコードは、Apple社、IBM社、Microsoft社などが中心となって提唱し、1993年に国際標準化機構(ISO)で標準化された文字コード体系です。

ドットワンでは、Mac OS Xでの多言語入出力が実現したことから、ユニコードのウェブ上での一般的なエンコーディングであるUTF-8を使用することで、複数言語を使用したサイトの制作を開始いたしました。
現在、制作を承る場合は、特に指定がない限りUTF-8エンコーディングで制作しています。

たとえば、中国語

以下の例文は中国語学習の参考書からの引用です。

3.“可以”
広く言えば可能ですが、どちらかというと許可に近く、日本語の「〜してもよい、〜してもかまわない、〜してもさしつかえない」の意味で使われます。

这儿可以照相吗?
訳:ここは写真をとってもかまいませんか?

北京居民现在可以自由买卖外汇了。
訳:北京市民は自由に外貨を売買してもよいことになりました。

『やさしくくわしい中国語文法の基礎』P.35より

簡体字と呼ばれる独特な文字を使用する中国では、日本語と同じ漢字でも異なる字体があり、これまで日本の制作者が使用してきたShift-JISでは、きちんと表示することができません。

二つ目の例文の「买卖」は日本語では「売買」となります。
また、台湾や香港などの地域で使用されている繁体字では「買賣」となり、さらに異なった字体を持ちます。
このような書き分けはそれぞれのローカルコードに依存しているため、1ページの中に全てを表記するにはユニコード系のエンコーディングでサイトを制作する必要があります。

日本語の漢字に置き換えが可能な場合はまだしも、「深圳」(中国広東省の都市)や「鄧小平」(現代中国の政治家)のように、Shift-JIS環境では「深セン」「トウ小平」と表記しなければならないものもあります。これらは都市名であったり、一般的な姓であったりと、決して稀な漢字ではありません。

国境のないウェブ上。言葉の壁も取り払ってしまいましょう。

参考資料

  • 関西大学外国語教育研究機構:視聴覚教室第29号・二階堂善弘 著
    『Unicodeを使った多言語Webサイトの構築』(PDF
  • オライリージャパン:Ken Lunde 著・小松章、逆井克己 訳
    『CJKV日中韓越情報処理』

※中国語IME未導入のWindows、Chinese Language Kits未導入のMac OS 9では、このページの一部が正常に表示できない場合があります。

記:内田未来