UTF-8ではサロゲートペアは不正になるものの、UTF-8の一文字4バイトのシーケンスに対応してないソフトウェアがあり、そういうソフトウェアで基本多言語面外の文字を表現するためにサロゲートペア部分のコードポイントを使ったCESU-8って謎の文字コードがあり…

Reply to this note

Please Login to reply.

Discussion

No replies yet.