更新日: $Date: 2005-11-20 08:29:56 $ UTC ($Revision: 1.2 $)
公開日: 2004/04/01
「Shift_JISで『あ』のコードってなんだっけ?」とか「UCS-2のU+3042ってどの文字だっけ?」といった際に、 ターミナルで手軽に確認できるようにするツールである。
標準入力もしくはコマンドライン引数から、
文字そのものか文字エンコーディングの16進数表記を受け取り、
各種文字エンコーディングでの16進数表記とUnicode, IncのUnihan DatabaseのURLを出力する。
出力する16進数表記の文字エンコーディングの種類は以下の通り。
グリフを確認するにはUnihan DatabaseのURLにアクセスすればよい。
確認していないがPerl-5.005でも動くかもしれない。
Encodeがあればそれを使う。
EncodeがなければJcodeを使う。EncodeもJcodeもない場合は動作しない。
Perl-5.8以降ならばEncodeは付属している。
Perl-5.6以前ならば以下のようにしてCPANからJcodeをインストールする必要がある。
# perl -MCPAN -e 'install Jcode'
以下のような環境で開発しているので、これらと同じような環境であれば動作すると思われる。
name | version | date | size |
---|---|---|---|
kcode-1.0.gz | 1.0 | 2004-04-01 16:50:05 | 2.4 KB |
$ echo 'あ' | kcode
euc-jp : あ (あ)
======================================================================
cp932 : 82A0 "\x82\xa0"
euc-jp : A4A2 "\xa4\xa2"
iso-2022-jp : 1B244224221B2842 "\x1b\x24\x42\x24\x22\x1b\x28\x42"
ucs-2be : 3042 "\x30\x42"
utf8 : E38182 "\xe3\x81\x82"
http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=3042
using Encode
$ kcode -i ucs2 -x 3042
ucs-2be : 3042 (あ)
======================================================================
cp932 : 82A0 "\x82\xa0"
euc-jp : A4A2 "\xa4\xa2"
iso-2022-jp : 1B244224221B2842 "\x1b\x24\x42\x24\x22\x1b\x28\x42"
ucs-2be : 3042 "\x30\x42"
utf8 : E38182 "\xe3\x81\x82"
http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=3042
using Encode
kcode [ -d level ] [-x] [-i CES] [-o CES] char|hex
例えば、0x82a0をShift_JISとして渡し、その結果をUTF-8で表示するには以下のようにする。
kcode -x -i sjis -o utf8 82a0