你的位置:首页 > 软件开发 > 操作系统 > Unicode 和 UTF

Unicode 和 UTF

发布时间:2016-09-19 00:00:04
Unicode符号范围 (一个字符两个字节) | UTF-8编码方式(十六进制)               | (二进制)———————& ...

Unicode符号范围 (一个字符两个字节) | UTF-8编码方式

(十六进制)               | (二进制)作者:于洋 计算机只懂二进制,因此,严格按照unicode的方式(UCS-2),应该这样存储:怎么办?UTF。UTF-8是这样做的:1. 单字节的字符,字节的第一位设为0,对于英语文本,UTF-8码只占用一个字节,和ASCII码完全相同;2. n个字节的字符(n>1),第一个字节的前n位设为1,第n+1位设为0,后面字节的前两位都设为10,这n个字节的其余空位填充该字符unicode码,高位用0补足。这样就形成了如下的UTF-8标记位:0xxxxxxx于是,”It's 知乎日报“就变成了:下边是课后作业:请将”It's 知乎日报“的GB2312和GBK码(自行google)转成二进制。不考虑历史因素,从技术角度解释为什么在unicode和UTF-8大行其道的同时,GB2312和GBK仍在广泛使用。剧透:一切都是为了节省你的硬盘和流量。

原标题:Unicode 和 UTF

关键词:Unicode

*特别声明:以上内容来自于网络收集,著作权属原作者所有,如有侵权,请联系我们: admin#shaoqun.com (#换成@)。

可能感兴趣文章

我的浏览记录