| 変数: 文字セットを表現する定義済みシンボル | |
| 以下の各シンボルは、定義済み文字セットを表現する。 | |
| MSymbol | Mcharset_ascii | 
| ASCII 文字セットを表現するシンボル. | |
| MSymbol | Mcharset_iso_8859_1 | 
| ISO/IEC 8859-1:1998 文字セットを表現するシンボル. | |
| MSymbol | Mcharset_unicode | 
| Unicode 文字セットを表現するシンボル. | |
| MSymbol | Mcharset_m17n | 
| 全文字を含む文字セットを表現するシンボル. | |
| MSymbol | Mcharset_binary | 
| 正しくデコードできない文字の文字セットを表現するシンボル. | |
| 変数: mchar_define_charset 用のパラメータ・キー | |
| これらは、関数 mchar_define_charset() 用のパラメータ・キーとして 使われるシンボルである。 詳しくはこの関数の解説を参照のこと。 | |
| MSymbol | Mmethod | 
| MSymbol | Mdimension | 
| MSymbol | Mmin_range | 
| MSymbol | Mmax_range | 
| MSymbol | Mmin_code | 
| MSymbol | Mmax_code | 
| MSymbol | Mascii_compatible | 
| MSymbol | Mfinal_byte | 
| MSymbol | Mrevision | 
| MSymbol | Mmin_char | 
| MSymbol | Mmapfile | 
| MSymbol | Mparents | 
| MSymbol | Msubset_offset | 
| MSymbol | Mdefine_coding | 
| MSymbol | Maliases | 
| 変数: 文字セットのメソッド指定に使われるシンボル | |
| これらは、文字セットの メソッド を指定するための定義済みシンボ ルであり、文字セットの Mmethod パラメータの値となることができる。 この値は関数 mchar_define_charset() の引数として使われる。 
メソッドとは、コードポイントと文字コードを相互変換する際の方式のこ とである。詳しくは関数 mchar_define_charset() の解説を参照のこと。  | |
| MSymbol | Moffset | 
| オフセット型のメソッドを示すシンボル. | |
| MSymbol | Mmap | 
| マップ型のメソッドを示すシンボル. | |
| MSymbol | Munify | 
| ユニファイ型のメソッドを示すシンボル. | |
| MSymbol | Msubset | 
| サブセット型のメソッドを示すシンボル. | |
| MSymbol | Msuperset | 
| スーパーセット型のメソッドを示すシンボル. | |
| マクロ定義 | |
| #define | MCHAR_INVALID_CODE | 
| 無効なコードポイント. | |
| 関数 | |
| MSymbol | mchar_define_charset (const char *name, MPlist *plist) | 
| 文字セットを定義する. | |
| MSymbol | mchar_resolve_charset (MSymbol symbol) | 
| 文字セット名を解決する. | |
| int | mchar_list_charset (MSymbol **symbols) | 
| 文字セットを表わすシンボルを列挙する. | |
| int | mchar_decode (MSymbol charset_name, unsigned code) | 
| コードポイントをデコードする. | |
| unsigned | mchar_encode (MSymbol charset_name, int c) | 
| 文字コードをエンコードする. | |
| int | mchar_map_charset (MSymbol charset_name, void(*func)(int from, int to, void *arg), void *func_arg) | 
| 指定した文字セットのすべての文字に対して関数を呼ぶ. | |
| 変数 | |
| MSymbol | Mcharset | 
| シンボル Mcharset. | |
m17n ライブラリは、以下の概念を区別している:
unsigned 型によって表される。無効なコードポイントはマクロ MCHAR_INVALID_CODE で表される。
| 
 | 
| マクロ MCHAR_INVALID_CODE は無効なコードポイントを与える。 | 
| 
 | ||||||||||||
| 関数 mchar_define_charset() は新しい文字セットを定義し、それを name という名前を持つシンボル経由でアクセスできるようにする。 plist は定義される文字セットのパラメータを以下のように指定する。 
 
 
 
 
 | 
| 
 | 
| 関数 mchar_resolve_charset() は symbol が文字セットを示していれ ばそれを返す。 そうでなければ、symbol を文字セット名として正規化し、それが文字セッ トを示していていれば正規化したものを返す。そうでなければ、Mnil を 返す。 | 
| 
 | 
| 関数 mchar_list_charsets() は、文字セットを示すシンボルを並べた配 列を作り、symbols でポイントされた場所にこの配列へのポインタを置 き、配列の長さを返す。 | 
| 
 | ||||||||||||
| 関数 mchar_decode() は、シンボル charset_name で示される文字セッ ト内の code というコードポイントをデコードして文字コードを得る。 
 
 | 
| 
 | ||||||||||||
| 関数 mchar_encode() は、文字コード c をエンコードしてシンボル charset_name で示される文字セット内におけるコードポイントを得る。 
 
 | 
| 
 | ||||||||||||||||
| 関数 mcharset_map_chars() は charset_name という名前を持つ文字セッ ト中のすべての文字に対して func を呼ぶ。呼び出しは一文字毎ではな く、連続した文字のまとまり単位で行なわれる。 関数 func にはfrom, to, arg の3引数が渡される。from と to は charset 中の文字コードの範囲を指定する。arg は func_arg と同 じである。 
 
 
 | 
| 
 | 
| 
デコードされた M-text は、キーが  | 
| 
 | 
| 
シンボル Mcharset_ascii は  | 
| 
 | 
| 
シンボル Mcharset_iso_8859_1 は  | 
| 
 | 
| 
シンボル Mcharset_unicode は  | 
| 
 | 
| 
シンボル Mcharset_m17n は  | 
| 
 | 
| 
シンボル Mcharset_binary は  詳細は コード変換 参照のこと。 | 
| 
 | 
| 関数 mchar_define_charset() 用のパラメータ・キー. | 
| 
 | 
| 関数 mchar_define_charset() 用のパラメータ・キー. | 
| 
 | 
| 関数 mchar_define_charset() 用のパラメータ・キー. | 
| 
 | 
| 関数 mchar_define_charset() 用のパラメータ・キー. | 
| 
 | 
| 関数 mchar_define_charset() 用のパラメータ・キー. | 
| 
 | 
| 関数 mchar_define_charset() 用のパラメータ・キー. | 
| 
 | 
| 関数 mchar_define_charset() 用のパラメータ・キー. | 
| 
 | 
| 関数 mchar_define_charset() 用のパラメータ・キー. | 
| 
 | 
| 関数 mchar_define_charset() 用のパラメータ・キー. | 
| 
 | 
| 関数 mchar_define_charset() 用のパラメータ・キー. | 
| 
 | 
| 関数 mchar_define_charset() 用のパラメータ・キー. | 
| 
 | 
| 関数 mchar_define_charset() 用のパラメータ・キー. | 
| 
 | 
| 関数 mchar_define_charset() 用のパラメータ・キー. | 
| 
 | 
| 関数 mchar_define_charset() 用のパラメータ・キー. | 
| 
 | 
| 関数 mchar_define_charset() 用のパラメータ・キー. | 
| 
 | 
| 
シンボル Moffset は  
 文字コード = コードポイント - MIN-CODE + MIN-CHAR ここで、MIN-CODE は文字セットの Mmin_code パラメータの値であり、MIN-CHAR は Mmin_char パラメータの値である。 | 
| 
 | 
| 
シンボル Mmap は  | 
| 
 | 
| 
シンボル #Minherit は  コードポイントがマップに含まれていれば、変換はマップ参照によって行 われる。そうでなければ、以下の式に従う。 
 CHARACTER-CODE = CODE-POINT - MIN-CODE + LOWEST-CHAR-CODE ここで、MIN-CODE は文字セットの Mmin_code パラメータの値であり、 LOWEST-CHAR-CODE は割り当てられたコードスペースの最も小さい文字コー ドである。 | 
| 
 | 
| 
シンボル Msubset は  
 CHARACTER-CODE = PARENT-CODE (CODE-POINT) + SUBSET-OFFSET ここで PARENT-CODE は CODE-POINT の親文字セット中での文字コードを 返す擬関数であり、SUBSET-OFFSET は Msubset_offset パラメータで与 えられる値である。 | 
| 
 | 
| 
シンボル Msuperset は  | 
 mule-aist@m17n.org
mule-aist@m17n.org