本文介绍了Ruby删除
 &安培;#XA0;的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我使用xpath从HTML文件中提取包含关键字的第一个元素。但是有些文件具有&#xD&#xA0,我的代码不起作用。我想用空格替换& #xD&#xA0,但不知道如何。

I am using xpath to extract first element that contain keywords from html files. But some files have &#xD &#xA0 and my code doesn't work. I want to replace &#xD &#xA0 with space but don't know how.

 <font size="1" face="Times New Roman" style="font-size:8.0pt;">For&#xD;
 the fiscal year ended December&#xA0;31, 2006</font>

doc.xpath('//*[contains(text(),"For the fiscal year ended")]')[0]

感谢您的帮助。

推荐答案

转换为实际值:

To convert to the actual value:

require "htmlentities"
HTMLEntities.new.decode('For&#xD; the fiscal year ended December&#xA0;31, 2006')
#=> "For\r\n the fiscal year ended December 31, 2006"

gsub 放在\r\\\
到一个空间会做到这一点。

Doing gsub on "\r\n" and " " to a space will do it.

这篇关于Ruby删除&amp;#xD; &安培;#XA0;的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

10-11 09:24