UTF-8ではサロゲートペアは不正になるものの、UTF-8の一文字4バイトのシーケンスに対応してないソフトウェアがあり、そういうソフトウェアで基本多言語面外の文字を表現するためにサロゲートペア部分のコードポイントを使ったCESU-8って謎の文字コードがあり…
Discussion
No replies yet.
UTF-8ではサロゲートペアは不正になるものの、UTF-8の一文字4バイトのシーケンスに対応してないソフトウェアがあり、そういうソフトウェアで基本多言語面外の文字を表現するためにサロゲートペア部分のコードポイントを使ったCESU-8って謎の文字コードがあり…
No replies yet.