关于unicode编码的问题。
发布网友
发布时间:2023-07-10 06:42
我来回答
共2个回答
热心网友
时间:2024-10-24 06:47
一般的,可以用2个字节编码
但是字太多了,码位不够用,就有了3个4个的情况
上面都是说 unicode编码
如果转为 utf-8,一个2个字节编码的字符,也可能转为3个字符,以第三行为例,就是说unicode编码在0800到ffff之间的字,转为 utf后,除了写1和0的位置保持不变,其他写x的位置用这个字符的unicode码顺序填上。
如汉字 可 的unicode码是53EF 二进制0101 0011 1110 1111
转为utf8 E58FAF
(1110)0101 (10)001111 (10)101111
我可以帮助你,你先设置我最佳答案后,我百度Hii教你。
热心网友
时间:2024-10-24 06:47
一般的,可以用2个字节编码
但是字太多了,码位不够用,就有了3个4个的情况
上面都是说 unicode编码
如果转为 utf-8,一个2个字节编码的字符,也可能转为3个字符,以第三行为例,就是说unicode编码在0800到ffff之间的字,转为 utf后,除了写1和0的位置保持不变,其他写x的位置用这个字符的unicode码顺序填上。
如汉字 可 的unicode码是53EF 二进制0101 0011 1110 1111
转为utf8 E58FAF
(1110)0101 (10)001111 (10)101111