python按中文拆分中英文混合字符串的解决办法
内容摘要
这篇文章主要为大家详细介绍了python按中文拆分中英文混合字符串的简单示例,具有一定的参考价值,可以用来参考一下。
对python这个高级语言对此感兴趣的朋友,看看idc笔记做的
对python这个高级语言对此感兴趣的朋友,看看idc笔记做的
文章正文
这篇文章主要为大家详细介绍了python按中文拆分中英文混合字符串的简单示例,具有一定的参考价值,可以用来参考一下。
对python这个高级语言对此感兴趣的朋友,看看idc笔记做的技术笔记!出自群里的提问,试了几次就实现了,现在分享出来。
# @param python拆分中英文混合字符串 - 按中文拆分
# @author php教程|512pic.com
#coding=utf-8
import re
s = 'hi新手oh'.decode('utf-8') #举个栗子是字符串s,为了匹配下文的unicode形式,所以需要解码
p = re.compile(ur'[\u4e00-\u9fa5]') #这里是精髓,[\u4e00-\u9fa5]是匹配所有中文的正则,因为是unicode形式,所以也要转为ur
print p.split(s) #使用re库的split切割
# End www_512pic_com
注:关于python按中文拆分中英文混合字符串的简单示例的内容就先介绍到这里,更多相关文章的可以留意
代码注释