kconv.rb

trap::Kconv

文字コードエンコーディングを変換するためのモジュール。 KconvNKFのラッパーです。

使用例

 

newstring = Kconv::kconv(string, Kconv::JIS, Kconv::AUTO);
newstring = Kconv::tojis(string);
newstring = Kconv::toeuc(string);
newstring = Kconv::tosjis(string);
guessed_code = Kconv::guess(string);

または

newstring = string.kconv(Kconv::JIS, Kconv::AUTO);
newstring = string.tojis
newstring = string.toeuc
newstring = string.tosjis

モジュール関数

Kconv.kconv(str, out_code, in_code = Kconv::AUTO)

文字列 str のエンコーディングを out_code に変換したものを 返します。in_code も指定されていたら str のエンコーディングが in_code だとして動作します。

out_code in_code は定数で指定します。

Kconv.tojis(str)

文字列 str のエンコーディングを iso-2022-jp に変換して返します。 以下と同じです。

Kconv.kconv(str, Kconv::JIS)
Kconv.toeuc(str)

文字列 str のエンコーディングを euc-jp に変換して返します。 以下と同じです。

Kconv.kconv(str, Kconv::EUC)
Kconv.tosjis(str)

文字列 str のエンコーディングを shift_jis に変換して返します。 以下と同じです。

Kconv.kconv(str, Kconv::SJIS)
Kconv.guess(str)

文字列 str のエンコーディングを判定します。戻り値は Kconv の定数です。

ruby 1.8.2 feature

Kconv.toutf8(str)

文字列 str のエンコーディングを utf8 に変換して返します。 以下と同じです。

Kconv.kconv(str, Kconv::UTF8)
Kconv.toutf16(str)

文字列 str のエンコーディングを utf16 に変換して返します。 以下と同じです。

Kconv.kconv(str, Kconv::UTF16)
Kconv.iseuc(str)

以下と同じです。

Kconv::RegexpEucjp.match( str )
Kconv.issjis(str)

以下と同じです。

Kconv::RegexpShiftjis.match( str )
Kconv.isutf8(str)

以下と同じです。

Kconv::RegexpUtf8.match( str )

String に追加されるメソッド

String#kconv(out_code, in_code = Kconv::AUTO)

self のエンコーディングを out_code に変換したのを 返します。out_code in_codeKconv の定数で 指定します。

String#tojis

self のエンコーディングを iso-2022-jp に変換した文字列を 返します。

String#toeuc

self のエンコーディングを euc-jp に変換した文字列を 返します。

String#tosjis

self のエンコーディングを shift_jis に変換した文字列を 返します。

ruby 1.8.2 feature

String#toutf8

self のエンコーディングを utf8 に変換した文字列を 返します。

String#toutf16

self のエンコーディングを utf16 に変換した文字列を 返します。

String#iseuc

以下と同じです。

Kconv.iseuc(self)
String#issjis

以下と同じです。

Kconv.issjis(self)
String#isutf8

以下と同じです。

Kconv.isutf8(self)

定数

AUTO

エンコーディングを自動検出する。 入力の指定でのみ有効。

JIS

iso-2022-jp を表す。

EUC

euc-jp を表す。

SJIS

shift_jis (シフト JIS / MS 漢字コードとも言う) を表す。

BINARY

JIS EUC SJIS 以外

UNKNOWN

出力においては「エンコーディングを判定できなかった」 入力においては AUTO と同様に「自動検出」を表す。

NOCONV

変換されないことを表す。

ruby 1.8.2 feature

ASCII

ASCII を表す。

UTF8

UTF8 を表す。

UTF16

UTF16 を表す。

UTF32

UTF32 を表す。

Iconv_Shift_JIS
Iconv_UTF8
RegexpShiftjis

SJIS にマッチする正規表現です。

RegexpEucjp

EUCJP にマッチする正規表現です。

RegexpUtf8

UTF8 にマッチする正規表現です。