2011-06-09から1日間の記事一覧

USC4 ←→UTF8 変換を調べてみました。

Haskell の内部ではUSC4を使用しています。 UTF8 に変換するには以下のテーブルにより行います。 <http://www.ietf.org/rfc/rfc2279.txt> UCS-4 range (hex.) UTF-8 octet sequence (binary) 0000 0000-0000 007F 0xxxxxxx 0000 0080-0000 07FF 110xxxxx 10xxxxxx 0000 0800-0000 FFFF 1110xxxx 10</http://www.ietf.org/rfc/rfc2279.txt>…