前回は、各種ツールによって中国の地名の英語表記を得る方法を紹介しました。今回は「簡体字を日本語の漢字に変換する方法」と「どうしても見つからない漢字を入力、表示する方法」を検討したいと思います。
簡体字を日本語の漢字に変換する
前回のエントリの最後に「次は中国の人名の英語表記の調べ方、日本の漢字を中国の漢字に変換する方法などなどを考える」と書きましたが、ひとつめの「中国の人名の英語表記の調べ方」は、地名の英語表記を得る方法とほぼ同じです。変換ツールやオンライン辞書、部首画数による検索などを駆使し、中国語の単語をピンインに直し、最後に検索エンジンなどで検証作業を行います。詳しくは前回のエントリを参照下さい。
次に中国語の漢字を日本語の漢字に変換する、またはその逆の処理を行う、を考えてみましょう。どういう場面でこの処理が必要になるかというと、中国の地名や人名、商品名といった固有名詞を日本語の文書で紹介する場合です。「广东省东莞市沙田镇」に自社の工場があったりして、それを日本国内向けパンフレットやホームページに記載することになった場合、簡体字を日本語の漢字に変換する必要が生じます。簡体字部分を全て画像にして、簡体字のまま掲載するという方法もありますが、印刷にしてもWEBにしても、その部分だけ浮いたようになるので見栄えはよくありません。そのまま簡体字を表示するという思い切った解決方法もありますが、それでは中国語を読めない人に不親切です。
この簡体字から日本語への変換には、手前味噌になりますがPinConv+の使用をおすすめします。元の簡体字データを貼り付けて、変換ボタンを押すだけですので特に難しいところもありません。
上図のように「广东省东莞市沙田镇」は、「广東省東莞市沙田鎮」と変換されます。「广」については手作業で「広」に修正する必要がありますが、それ以外の簡体字は、日本の漢字に変換されていますので、このまま日本語テキストにコピー&ペーストをすれば、作業は完了です。
ただし、繁体字から現在の中国の漢字に簡化される際に、複数の漢字をひとつにまとめた「复、发、后」などを変換する際は注意が必要です。詳細は長くなるので割愛しますが、「复」を日本語の漢字に変換したいのであれば、文脈に応じて「復」や「複」に、「发」なら「発」か「髮」に、「后」は「后」か「後」にしなければなりません。この問題は現在のところPinconvでは解決できませんし、中国語の知識が必要となります。ご注意下さい。
また、日本の漢字に、変換前の簡体字と対応する漢字がない場合(あっても一般的なフォントには含まれていない場合)、Pinconvが特殊な表記でこれを表現する点についても注意が必要です。例えば「另外(『そのほか』という意味の接続詞)」の「另」という漢字などは、Pinconvで処理すると[ロ/力]という風に変換されます。この漢字が日本語用フォントに含まれていないため、このような表示となっています。この手の漢字に遭遇した場合は、該当部分を簡体字のままにするか、ピンインに変換したり、テキストではなく画像を挿入したりするといった対応が必要になります。
この「中国語の漢字を日本語の漢字に変換する」という処理でも、変換前の漢字がコピーできる状態になければ、Pinconvのようなツールを利用することができません。手作業で1文字ずつ置き換えていくことになりますが、見慣れない字が含まれている場合、例えば東莞の莞の字などは、入力するのが難しいので、Chinese Character Dictionaryなどで1文字ずつ調べることになります。読み方が分からない漢字については、MS-IMEやATOKなどの日本語入力ソフトにも、部首や手書き入力による検索ツールが付属していますので、それらを利用するのもいいでしょう。
日本語の漢字を中国の簡体字に変換する場合も、Pinconvで処理することができます。日本語の文書を中国語に翻訳する時などに必要になりますが、データをPinconvに貼り付けて、ツールバーの「C」ボタンを押せば、ほとんどの場合はなんとかなります。
どうしても見つからない漢字を入力、表示する
さて、こういう処理をしていると、手元のパソコン環境で入力できない、表示できない漢字に出会うことがあります。先日、以下の漢字を入力する方法について質問をいただきました。
それぞれkai3とnai4という漢字ですが、これらはUnicodeに含まれていますのでChinese Character Dictionaryを使えば調べることが可能です。では次の漢字はどうでしょう?
これは筆者も今日初めて目にした漢字です。何と読むのかも分かりませんし、どういう場面で使われるのかも定かではありませんが、こういう漢字を探し出して、入力しなければならないことだって人生にはあります。
そうした時に便利なのが今昔文字鏡です。「諸橋大漢和辞典」に収録されている約5万の見出し漢字のほか、甲骨文字、西夏文字、中国で使われている簡体字などを含む12万字のフォントとその入力支援ツールで、上の3つの漢字も、今昔文字鏡の Mojikyo Character Map を利用してGIF画像を参照するIMGタグを作成したものです。
操作も簡単で、ツールの左側に表示される部首から適当なものを選択すると、右側にその部首を含む漢字一覧が画数順に表示されます。その一覧から漢字を探して、漢字を右クリックし、コピーする形式を選択すれば、あとは任意のアプリケーションに貼り付けるだけです。Truetype Fontも提供されていますので、MS-Wordや一太郎などを使った文書作成にも、今昔文字鏡の12万字が利用できますし、ホームページ作成に便利なUnicode数値参照形式のコピーも可能です。
入力できない漢字があった場合、外字を作成してなんとかその字を入力するというのも1つの解決方法ではありますが、外字データを他人と共有するのは面倒です。今昔文字鏡を利用すれば、データの共有で頭を悩ませることもありません(文字鏡はWindowsとMACに対応しています)。
なお、ここでは簡単な説明しかしませんので、詳しい使用方法は今昔文字鏡のサイトやヘルプでご確認下さい。また、今昔文字鏡のサイトからダウンロードできるのは無償提供されているフォントと入力支援ツールですが、検索機能が充実した製品版もあります。興味のある方は今昔文字鏡CD-ROMを参照下さい。
関連:パソコン悠悠漢字術〈2002〉今昔文字鏡徹底活用
以上、「簡体字を日本語の漢字に変換する方法」と「どうしても見つからない漢字を入力、表示する方法」でした。