使用Scrapy,以下摘录仅适用于普通文本。它不包括我尝试检索的所有BOLD标签:

hxs.select('//td[@class="Info_Cell"]/text()').extract()


以下仅提取粗体文本,但不包括普通文本。

hxs.select('//td[@class="Info_Cell"]/b/text()').extract()


您将如何提取普通文本和带有粗体标签的文本。

最佳答案

通常,//将递归提取所有子节点,因此您需要:

hxs.select('//td[@class="Info_Cell"]//text()').extract()

关于python - Scrapy将文字与粗体结合在一起,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/23459521/

10-12 21:18