Pinconvのバージョンアップを行い、日本の新字体を繁体字に変換するためのデータファイルを追加しました。
- ダウンロード:
- pinconv4.exe (インストーラ形式 – 3.44MB)
- pinconv4.zip (zip形式 – 3.09MB)
Pinconvの紹介はこちらのエントリ、詳しい使い方についてはPinconvの使い方を参照下さい。窓の杜による紹介記事はこちらです。
新字体から繁体字への変換
日本語の文章を中国語に翻訳する際、意外に面倒なのが地名や人名、組織名などの固有名詞の翻訳です。同じように漢字を使っているとはいえ、簡体字、繁体字、新字体など漢字にも種類がありますので適当にごまかそうとするとまず間違いなくクレームがつきます。たとえば原文に「広島地方検察庁呉支部(広島県呉市)」とあった場合、台湾で使われている繁体字にすると「廣島地方檢察廳吳支部(廣島縣吳市)」となります。
漢字15文字の内、7文字を繁体字に直さなければならず、日本の新字体に対応する繁体字を1字ずつ調べていく地道な作業が必要となります。10文字程度ならなんとかやっつけることはできても、組織名と住所がずらっと並んだエクセルファイルなどが対象だとしたらどうでしょう。うんざりしますね。
さらに1例をあげれば、「戸内」という日本人名を繁体字にすると「戶內」となります。新字体と繁体字に違いはないように見えるかも知れませんが「戸」と「戶」、「内」と「內」にはそれぞれ異なる文字コードが振られています。日本語をそのままコピー&ペーストして一丁上がりとはいきません。「呑(U+5451)」と「吞(U+541E)」などこうした字はほかにもいくつかあり、目を皿にして1字1字チェックしていく必要があります。
今回公開したPinconv用の「日繁.dat」は、こうした変換作業の負担を大きく軽減します。日本語のテキストが表示された状態で、このデータファイルを用いて変換を行うと、日本語の漢字が一瞬で繁体字に変換されます。あとは変換結果が妥当かどうか確認するだけ。1字ずつ調べることを考えれば随分楽です。
国字の扱いや制限事項などについて
- 「込」や「辻」などのいわゆる国字(和製漢字)は、繁体字に変換することができないため、変換後は「★」が出力されます。国字をそのまま出力したい場合などは、用語集の編集を行って下さい。1
- 日繁.datは、日本の新字体を台湾で使われている繁体字に変換することを目指しているため、「闘」は「鬥」に変換され、「竃」は「灶」に変換されます。いわゆる旧字体への変換とは処理結果が異なります。
- 「狢」から「貉」への変換など、繁体字に変換する際に異体字や別字に置き換える漢字のうち、作者が注意が必要と判断した漢字は、出力時にアスタリスクが付加されます。作者のデータ管理用に設けたマークですので不要であれば編集して下さい。
- 変換データの登録を暫時保留している漢字は、「〓」が出力されます。
- 現行バージョンのPinconvにはU+9FA6以降の漢字データを扱えないという制限があります。そのため、この範囲に含まれる漢字を変換しようとしても「〓」が表示されます。ご了承下さい。
予、台、弁、干などの処理について
新字体では、繁体字の「瓣、辮、辯」などが「弁」で代替されています。「花瓣」は「花弁」に、「辮髮」は「弁髪」、「辯護」は「弁護」という風に本来は異なる漢字で表現すべきところを「弁」の1字で済ませているため、これを繁体字に変換するには単語ごとに処理を切り替える必要があります。「日繁.dat」には、こうした単語がいくつか登録されていますが(詳細は以下の一覧を参照)、正しく変換されなかったデータを見つけた場合は、お手数ですがご自分で追加してください。2
表1 日繁.datに登録されている単語一覧
日本語 | 繁体字 |
---|---|
台風 | 颱風 |
台頭 | 抬頭 |
安全弁 | 安全瓣 |
花弁 | 花瓣 |
支弁 | 支辨 |
能弁 | 能辯 |
雄弁 | 雄辯 |
思弁 | 思辨 |
勘弁 | 勘辨 |
自弁 | 自辨 |
抗弁 | 抗辯 |
陳弁 | 陳辯 |
答弁 | 答辯 |
詭弁 | 詭辯 |
口弁 | 口辯 |
多弁 | 多辯 |
駄弁 | 馱辯 |
訥弁 | 訥辯 |
熱弁 | 熱辯 |
単弁 | 單瓣 |
僧帽弁 | 僧帽瓣 |
合弁 | 合辦 |
買弁 | 買辦 |
東北弁 | 東北辯 |
関西弁 | 關西辯 |
弁官 | 辨官 |
弁慶 | 辨慶 |
弁済 | 辨濟 |
弁財天 | 辨財天 |
弁事 | 辨事 |
弁識 | 辨識 |
弁償 | 辨償 |
弁証 | 辨証 |
弁知 | 辨智 |
弁天 | 辨天 |
弁別 | 辨別 |
弁明 | 辨明 |
弁円 | 辨圓 |
弁当 | 辨當 |
弁内侍 | 辨內侍 |
弁座 | 瓣座 |
弁膜 | 瓣膜 |
弁鰓 | 瓣鰓 |
弁髪 | 辮髮 |
弁解 | 辯解 |
弁護 | 辯護 |
弁口 | 辯口 |
弁巧 | 辯巧 |
弁才 | 辯才 |
弁士 | 辯士 |
弁者 | 辯者 |
弁舌 | 辯舌 |
弁疏 | 辯疏 |
弁難 | 辯難 |
弁論 | 辯論 |
弁説 | 辯說 |
弁公室 | 辦公室 |
予備 | 預備 |
予報 | 預報 |
予防 | 預防 |
予定 | 預定 |
予断 | 預斷 |
予告 | 預告 |
予感 | 預感 |
予後 | 預後 |
予見 | 預見 |
予期 | 預期 |
予習 | 預習 |
予想 | 預想 |
予選 | 預選 |
予知 | 預知 |
予兆 | 預兆 |
予測 | 預測 |
予算 | 預算 |
予言 | 預言 |
予約 | 預約 |
猶予 | 猶豫 |
干物 | 乾物 |
干害 | 旱害 |
干魚 | 乾魚 |
干姜 | 乾薑 |
干繭 | 乾繭 |
干天 | 旱天 |
干瓢 | 乾瓢 |
防御 | 防禦 |
素晴らしいソフトを作ってくださりありがとうございます。
ずっとpinconv+を使わせていただいていましたが、バージョンアップ後、機能が大幅に増え、さらに使い勝手が良くなったと思います。
特に繁体字と簡体字間の相互変換機能が素晴らしいです。
ところで一つ質問をよろしいでしょうか?
「変換」→「データファイルの切り替え」から「声調」を選択後、エディタ部分に中国語の文章を貼り付けghostボタンを押しますと、ピンインには変換されず元の中国語が2行ずつ表示されてしまいます。
上記メニューで「ピンイン」を選択後した場合は問題なく数字付きのピンインが下の行に表示されます。
もし「声調」選択時の動作につきまして設計と異なる動作でしたら、ご確認・修正のご対応をお願いできるでしょうか?
よろしくお願いします。
ctrans さま
返信ありがとうございます。
ご説明を読んで、現状の仕様について理解することができました。
ありがとうございます。
ただ、これは私個人の要望なのですが、出力されたピンインが間違っているかどうかはあまり重要ではなく、(間違っているかどうかを知る術がないというのが正直なところですが、)声調符号の付いたピンインが一発で出るオプションがありますと大変助かります。
少なくとも中国語初心者に限って言えば、このようなオプションがありますと大変助かるのですが、追加していただくことはできるでしょうか?
厚かましいお願いではありますが、ご検討をお願いします。
ctrans さま
ご検討いただけるとのこと、ありがとうございます。
よろしくお願いいたします。
ctrans さま
ご対応ありがとうございます。
動作を確認しました。
声調符号への直接変換だけでなくて汎用的に使えるあたり、作者様の知性を感じます。
助かりました。
ところで、もう一点要望をよろしいでしょうか?
本ソフト起動時に、前回終了時の表示形式で表示することは可能でしょうか?
例えば、convertボタンを押すと下に一行メニューが表示されますが、このメニューを起動時に表示させるようにしたいのです。
何か良い方法があれば教えてください。
よろしくお願いします。
web版の同じのようなツールを作っていますが
予、台、弁、干などの処理を参考にさせていただきました
http://ekykan.freehostia.com/tools/tenkan.php?lang=ja
もし問題などありましたら元に戻りします