当前位置:首页 > 软件资讯 > 一个字固定等于两个字节么(计算机程序常识讲解)

一个字固定等于两个字节么(计算机程序常识讲解)

分区:软件资讯 更新:2023-06-15 17:30:23

一个字固定等于两个字节么(计算机程序常识讲解)

汉字可以存储在CHAR变量中吗?下一个汉字取几个字?

Char类型可以存储一个汉字。因为Java中char的编码是UTF-16BE。UTF-16编码使用2或4字节,65536以内的占2字节。而且基本上所有的中文Unicode编码都在19968到40869之间& mdash& mdash因为Unicode至少包含20,902个中文字符,所以char类型可以存储一个中文字符。

占用的字节数

GB2312

GB2312标准主要针对简体中文中的常用字,包括约7000个汉字,不包括一些生僻字和繁体字。

[h/]GBK

GBK基于GB2312。向后兼容GB2312,也就是说GB2312编码的字符和二进制表示在GBK编码中是完全一样的。需要注意的是,低位字节从0x40开始,即64,也就是说,低位字节的最高有效位可能是0。

GB18030

GB18030向后兼容GBK,增加了55000多个字符,共计76000多个字符。包括很多中日韩的少数民族文字和统一文字。

Big5

Big5针对繁体中文,在台湾省和香港广泛使用。

Big5包括超过13,000个繁体中文字符。与GB2312类似,一个字符也用两个字节表示。在这两个字节中,高字节范围是0x81-0xFE,低字节范围是0x40-0x7E和0xA1-0xFE。

简而言之,byte是一个字节,char是两个字节,但是char可以存储一个汉字,所以汉字占用两个字节?字符串型汉字根据编码格式不同,分为2-4个字节,UTF 8占用3个字节,特别是4个字节。GBK的汉字真的占用2个字节。在UTF-16中,汉字一般占2个字节,尤其是4个字节。

综上所述,那要看汉字是以什么编码格式来存储了,以及汉字是否为特殊汉字
  • 最新资讯
  • 最新软件