python去除html标签的解决办法

内容摘要
这篇文章主要为大家详细介绍了python去除html标签的简单示例,具有一定的参考价值,可以用来参考一下。

对python这个高级语言对此感兴趣的朋友,看看idc笔记做的技术笔记!
python
文章正文

这篇文章主要为大家详细介绍了python去除html标签的简单示例,具有一定的参考价值,可以用来参考一下。

对python这个高级语言对此感兴趣的朋友,看看idc笔记做的技术笔记!

python去除html标签,自己写的,若有不足请指正:


#! /usr/bin/env python
#coding=utf-8
# blueel 2013-01-19
from HTMLParser import HTMLParser
 
class MLStripper(HTMLParser):
    def __init__(self):
        self.reset()
        self.fed = []
    def handle_data(self, d):
        self.fed.append(d)
    def get_data(self):
        return ''.join(self.fed)
 
def strip_tags(html):
    s = MLStripper()
    s.feed(html)
    return s.get_data()

# End www_512pic_com

调用:

html = '<em productIndex="0" class="valor-dividido" style="display:block"><span>ou <strong><label productIndex="0" class="skuBestInstallmentNumber">12</label>X</strong> de <strong> <label productIndex="0" class="skuBestInstallmentValue">R$ 116,58</label></strong> sem juros</span></em>'

print strip_tags(html)

注:关于python去除html标签的简单示例的内容就先介绍到这里,更多相关文章的可以留意

代码注释

作者:喵哥笔记

IDC笔记

学的不仅是技术,更是梦想!