本文介绍了Ruby删除
 &安培;#XA0;的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我使用xpath从HTML文件中提取包含关键字的第一个元素。但是有些文件具有&#xD&#xA0,我的代码不起作用。我想用空格替换& #xD&#xA0,但不知道如何。
I am using xpath to extract first element that contain keywords from html files. But some files have 
   and my code doesn't work. I want to replace 
   with space but don't know how.
<font size="1" face="Times New Roman" style="font-size:8.0pt;">For
the fiscal year ended December 31, 2006</font>
doc.xpath('//*[contains(text(),"For the fiscal year ended")]')[0]
感谢您的帮助。
推荐答案
转换为实际值:
To convert to the actual value:
require "htmlentities"
HTMLEntities.new.decode('For
 the fiscal year ended December 31, 2006')
#=> "For\r\n the fiscal year ended December 31, 2006"
做 gsub
放在\r\\\
和到一个空间会做到这一点。
Doing gsub
on "\r\n"
and " "
to a space will do it.
这篇关于Ruby删除&#xD; &安培;#XA0;的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!