在使用Firefox浏览器测试我编写的xml文件时,遇到如下错误:
我的xml源代码如下:
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://s.faydo.com/?q=%BB%FA%C6%B1&mb=bt</loc> <lastmod>2012-06-26T17:35:23+08:00</lastmod> <changefreq>daily</changefreq> <priority>1.0</priority> </url> </urlset>
Firefox浏览器提示的错误如下:
XML解析错误:未组织好 位置:http://s.faydo.com/err.xml 行:4,列:42: <loc>http://s.faydo.com/?q=%BB%FA%C6%B1&m=m.htm</loc> -----------------------------------------^
谷歌Chrome浏览器提示的错误如下:
This page contains the following errors: error on line 4 at column 42: EntityRef: expecting ';' Below is a rendering of the page up to the first error.
分析问题
Firefox浏览器、谷歌Chrome浏览器以及大多数浏览器在显示xml文件时,显示的并不是文件源码,而是经过“xml解析器”解析后的结果。但是,“xml解析器”在遇到字符“&”时,会把“&”当做一个实体引用的开始,而去寻找这个实体引用的结束符号“;”,本文上面遇到的就是这个问题。
在xml文档中,像“&”这样的预定义的实体引用一共有5个,分别是“&”、“<”、“>”、“'”、“"”。
解决方法一:
把实体引用编码后使用,即
把“&” 编码为 “&”
把“<” 编码为“<”
把“>” 编码为 “>”
把“'” 编码为 “'”
把“"” 编码为 “"”
针对本文上面的问题,即把原来代码中的:
<loc>http://s.faydo.com/?q=%BB%FA%C6%B1&mb=bt</loc>
替换为:
<loc>http://s.faydo.com/?q=%BB%FA%C6%B1&mb=bt</loc>
解决方法二:
在标记CDATA中,所有的标记、实体引用都被忽略,而被“xml解析器”一视同仁地当做原始字符数据看待,CDATA的形式如下:<![CDATA[文本内容]]>
针对本文上面的问题,即把原来代码中的:
<loc>http://s.faydo.com/?q=%BB%FA%C6%B1&mb=bt</loc>
替换为:
<loc><![CDATA[http://s.faydo.com/?q=%BB%FA%C6%B1&mb=bt]]></loc>
使用CDATA需要注意的两点,一:由于CDATA的结束符号是“]]>”,所以CDATA中不能包含“]]>”,二:由于CDATA中的所有标记、实体引用都被忽略,所以CDATA不能嵌套使用。