我正在使用Html2Text将html代码转换为文本。
工作得很好,但我在网上找不到很多例子或文档。
我是这样读用户名的:

text_to_gain = hxs.xpath('//div[contains(@id,"yq-question-detail-profile-img")]/a/img/@alt').extract()
if text_to_gain:
        h = html2text.HTML2Text()
        h.ignore_links = True
        item['author'] = h.handle(text_to_gain[0])
else:
        item['author'] = "anonymous"

但我的结论是:
u'Duncan\n\n'

当我阅读长文本或消息时,使用\n很有用,但对于单个字符串或某些字符串,我只想保留名称。
'Duncan'

最佳答案

使用strip()功能。这将删除所有空白。

>>> a = u'Duncan\n\n'
>>> a
u'Duncan\n\n'
>>> a.strip()
u'Duncan'
>>> str(a.strip())
'Duncan'

关于python - 使用html2text并在Python中清除一些文本,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/33199260/

10-12 22:27