parsel使用 发表于 2022-03-02 | 分类于 python爬虫 基础使用12345678910111213141516171819202122232425from parsel import Selectorhtml = '''<div> <ul> <li class="item-0">first item</li> <li class="item-1"><a href="link2.html">second item</a></li> <li class="item-0 active"><a href="link3.html"><span class="bold">third item</span></a></li> <li class="item-1 active"><a href="link4.html">fourth item</a></li> <li class="item-0"><a href="link5.html">fifth item</a></li> </ul> </div>'''selector = Selector(text=html)# 提取文本items2 = selector.xpath('//li[contains(@class, "item-0")]//text()')# 提取属性items3 = selector.xpath('//li[contains(@class, "item-0")]/a/@href')# 正则提取result = selector.xpath('//li[contains(@class, "item-0")]/a/@href').re('link.*')for item in items2: # first item # third item # fifth item print(item.get()) 赏个🍗吧 打赏 微信支付 支付宝 本文作者: Keeep 本文链接: http://Keeep.coding.me/blog/parsel使用/ 版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 3.0 许可协议。转载请注明出处!