文字認識APIにデータ提供

ドコモの文字認識APIに中国語データを提供しました。詳細は公式サイトに譲りますが、文字認識APIは、画像に含まれる文字を認識して単語を抽出するサービスです。今回は当方が構築しているデータベースから簡体字データと繁体字デー...

異体字同一視検索

オンライン辞書の北辞郎には、利用者が検索した際、データベースにその語句が含まれていないと候補の単語を提示する機能を設けてある。 今回システムの更新を行い、異体字を同一視して候補を表示する機能を追加した。備忘録をかねて内部...

講談社中日辞典第三版レビュー

講談社中日辞典第三版を入手した。発売とほぼ同時に本屋に走ったわけで、何もそんなに急がなくても良さそうなものだが、この辞典はネットに接続して「現代中国語新語辞典」を1冊丸ごとダウンロードできる上、更新機能で新語・流行語など...

注音符号とフォント

Pinconv用にピンインと注音符号の変換データを作成しているのだが、注音についてほとんど知識がないので「ㄧ」の表示にとまどっている。なんでフォントによって縦になったり横になったりするんだ。 関連:注音符號 &#8211...

LCMapStringと潟

WindowsにはLCMapStringという関数が用意されている。文字列の全角/半角やひらがな/カタカナの変換機能を提供する関数で、簡体字/繁体字の変換もサポートしているのだが、この関数の変換テーブルには間違いがあるよ...