我正在使用Html2Text
将html代码转换为文本。
工作得很好,但我在网上找不到很多例子或文档。
我是这样读用户名的:
text_to_gain = hxs.xpath('//div[contains(@id,"yq-question-detail-profile-img")]/a/img/@alt').extract()
if text_to_gain:
h = html2text.HTML2Text()
h.ignore_links = True
item['author'] = h.handle(text_to_gain[0])
else:
item['author'] = "anonymous"
但我的结论是:
u'Duncan\n\n'
当我阅读长文本或消息时,使用\n很有用,但对于单个字符串或某些字符串,我只想保留名称。
'Duncan'
最佳答案
使用strip()
功能。这将删除所有空白。
>>> a = u'Duncan\n\n'
>>> a
u'Duncan\n\n'
>>> a.strip()
u'Duncan'
>>> str(a.strip())
'Duncan'
关于python - 使用html2text并在Python中清除一些文本,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/33199260/