unicode 是几个字节？

发布网友发布时间：2022-04-22 10:01

共5个回答

热心网友时间：2023-10-09 20:46

unicode是2个字节。

这一标准的2字节形式通常称作UCS-2。然而，受制于2字节数量的*，UCS-2只能表示最多65536个字符。Unicode的4字节形式被称为UCS-4或UTF-32，能够定义Unicode的全部扩展，最多可定义100万个以上唯一字符。2016-06-21颁发的Unicode9，0共收录128，237个字。

Unicode是一种字符集，Unicode的学名是“UniversalMultiple-OctetCodedCharacterSet”，简称为UCS。UCS可以看作是“UnicodeCharacterSet”的缩写。

扩展资料

unicode的使用

1、使用代码页(Codepage)转换表的技术来过渡性的部分解决这一问题，即通过指定的转换表将非 Unicode 的字符编码转换为同一字符对应的系统内部使用的 Unicode 编码。

2、可以在“语言与区域设置”中选择一个代码页作为非 Unicode 编码所采用的默认编码方式，如936为简体中文GBK，950为繁体中文Big5（皆指PC上使用的）。

参考资料来源：百度百科—Unicode

热心网友时间：2023-10-09 20:46

Unicode（统一码、万国码、单一码）是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发，1994年正式公布。随着计算机工作能力的增强，Unicode也在面世以来的十多年里得到普及。
目前的用于实用的 Unicode 版本对应于 UCS-2，使用16位的编码空间。也就是每个字符占用2个字节。
utf-8长度是1-6个字节,第一个字节的高位1的数目指明了这个utf-8的字符使用的byte数目，在UTF-8编码集中，每个汉字使用 3个字符表示

热心网友时间：2023-10-09 20:47

转自北大中文论坛-中文信息化：
UTF-8 每字至少 1 byte，至多 4 bytes。1 byte 字符与 US-ASCII 相符。U+0800-07ff 是 2 bytes，0800-ffff 是 3 bytes，之后的是 4 bytes
UTF-32 或称 UCS-4 ，每字都是 4 bytes
UCS-2 每字都是 2 bytes，但容纳不了扩展平面的字符，於是，Unicode 拨出了 d800-dfff 的位置，以两个这些字符来代表扩展平面的字符。这就叫 surrogate. 加上了这种变通方法后，UCS-2 就改名成了 UTF-16。扩展平面的字符，所占的位置就是 2 x 2 bytes

热心网友时间：2023-10-09 20:47

两个字节

热心网友时间：2023-10-09 20:48

彻底搞定各种编码ASCII、ANSI、GBK、utf

全部栏目

unicode 是几个字节？