java 汉字几个字节

内容摘要
java 汉字几个字节java中,只要是字符,不管是数字还是英文还是汉字,都占2个字节,都是一个char。char c1 = '中';
char c2 = 'A';
char c3 = '1';确切
文章正文

java 汉字几个字节

java中,只要是字符,不管是数字还是英文还是汉字,都占2个字节,都是一个char。

char c1 = '中'; 
char c2 = 'A'; 
char c3 = '1';

确切说,Unicode编码是指一类编码的统称,而非某个具体编码。utf-8跟unicode是不一样的。

以utf8为例,utf8是一个变长编码标准,可以以1~4个字节表示一个字符,而中文占3个字节,ascII字符占1个字节。

因为java是以unicode作为编码方式的。unicode是一个定长的编码标准,每个字符都是2个字节,也就是1个char类型的空间。

扩展知识:

Unicode是一个编码方案,Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。Unicode 编码共有三种具体实现,分别为utf-8,utf-16,utf-32,其中utf-8占用一到四个字节,utf-16占用二或四个字节,utf-32占用四个字节。目前Unicode 码在全球范围的信息交换领域均有广泛的应用。

IDC笔记,大量的免费Java入门教程,欢迎在线学习!

代码注释
[!--zhushi--]

作者:喵哥笔记

IDC笔记

学的不仅是技术,更是梦想!