MySQL 字符串长度计算实现代码(gb2312+utf8)
2022-11-12 09:23:30
内容摘要
这篇文章主要为大家详细介绍了MySQL 字符串长度计算实现代码(gb2312+utf8),具有一定的参考价值,可以用来参考一下。
对此感兴趣的朋友,看看idc笔记做的技术笔记!PHP对中文字符
文章正文
这篇文章主要为大家详细介绍了MySQL 字符串长度计算实现代码(gb2312+utf8),具有一定的参考价值,可以用来参考一下。
对此感兴趣的朋友,看看idc笔记做的技术笔记!
PHP对中文字符串的处理一直困扰于刚刚接触PHP开发的新手程序员。下面简要的剖析一下PHP对中文字符串长度的处理:PHP自带的函数如strlen()、mb_strlen()都是通过计算字符串所占字节数来统计字符串长度的,一个英文字符占1字节。例:$enStr = 'Hello,China!';echo strlen($enStr); // 输出:12而中文则不然,做中文网站一般会选择两种编码:gbk/gb2312或是utf-8。utf-8能兼容更多的字符,所以受到很多站长的喜爱。gbk与utf-8对中文的编码不同,导致中文在gbk与utf-8编码下所占字节也有差异。gbk编码下每个中文字符所占字节为2,例:$zhStr = '您好,中国!';echo strlen($zhStr); // 输出:12utf-8编码下每个中文字符所占字节为3,例:$zhStr = '您好,中国!';echo strlen($zhStr); // 输出:18那么如何计算这组中文字符串的长度呢?有人可能会说gbk下获取中文字符串长度除以2,utf-8编码下除以3不就行了吗?但是您要考虑字符串并不老实,99%的情况会以中英混合的情况出现。这是WordPress中的一段代码,主要思想就是先用正则将字符串分解为个体单元,然后再计算单元的个数即字符串的长度,代码如下(只能处理utf-8编码下的字符串):代码如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 | <code> $zhStr = '您好,中国!' ; $str = 'Hello,中国!' ; // 计算中文字符串长度 function utf8_strlen( $string = null) { // 将字符串分解为单元 preg_match_all( "/./us" , $string , $match ); // 返回单元个数 return count ( $match [0]); } echo utf8_strlen( $zhStr ); // 输出:6 echo utf8_strlen( $str ); // 输出:9 </code> |
代码如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 | <code> /* * 用于UTF8编码的程序 * 获得字符串的长度,一个中文表示3个长度 * itlearner注释 */ function utf8_strlen( $str ) { $count = 0; for ( $i = 0; $i < strlen ( $str ); $i ++){ $value = ord( $str [ $i ]); if ( $value > 127) { $count ++; if ( $value >= 192 && $value <= 223) $i ++; elseif ( $value >= 224 && $value <= 239) $i = $i + 2; elseif ( $value >= 240 && $value <= 247) $i = $i + 3; else die ( 'Not a UTF-8 compatible string' ); } $count ++; } return $count ; } </code> |
注:关于MySQL 字符串长度计算实现代码(gb2312+utf8)的内容就先介绍到这里,更多相关文章的可以留意
代码注释