java怎么判断字符串是否中文
内容摘要
Java用的是Unicode 编码char 型变量的范围是0-65535 无符号的值,可以表示 65536个字符,基本上地球上的字符可被全部包括了汉字基本集中在[19968,40869]之间,共有20901个汉字。
文章正文
Java用的是Unicode 编码char 型变量的范围是0-65535 无符号的值,可以表示 65536个字符,基本上地球上的字符可被全部包括了
汉字基本集中在[19968,40869]之间,共有20901个汉字。
unicode编码范围:
汉字:[0x4e00,0x9fa5](或十进制[19968,40869])
数字:[0x30,0x39](或十进制[48, 57])
小写字母:[0x61,0x7a](或十进制[97, 122])
大写字母:[0x41,0x5a](或十进制[65, 90])
第一种 判断是否存在汉字
public boolean checkcountname(String countname) { Pattern p = Pattern.compile("[u4e00-u9fa5]"); Matcher m = p.matcher(countname); if (m.find()) { return true; } return false; }
用正则表达式去匹配
第二种 判断整个字符串都由汉字组成
public boolean checkname(String name) { int n = 0; for(int i = 0; i < name.length(); i++) { n = (int)name.charAt(i); if(!(19968 <= n && n <40869)) { return false; } } return true; }
更多java知识请关注java基础教程。
代码注释
[!--zhushi--]