我有一个文件,它以一些行开头,我想删除到行“
此行以及以下两行应替换为:
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<TimeML xmlns:ns0="xsi" ns0:noNamespaceSchemaLocation="http://timeml.org/timeMLdocs/TimeML_1.2.1.xsd" xmlns:ns1="xmlns" ns1:xsi="http://www.w3.org/2001/XMLSchema-instance">
<DOCID>doc3</DOCID>
<DCT>Sun Feb 24 15:25:40 CET 2013</DCT>
<TEXT>*1*9*6*9*
可以用同样的格式把实际日期加上“DCT”吗?
并且:在文件的末尾,在“”之前的一行,我应该添加“”。这也可能吗?
我已经可以解决问题的第一部分,即删除我不想要的部分:
with open(fileName,'r+') as f:
contents=f.read()
contents=contents[contents.find('<?xml version="1.0"?>'):]
f.seek(0)
f.write(contents)
f.truncate()
非常感谢你的帮助!:)
最佳答案
对于日期格式,您可以查看this topic。
对于替换XML文件的结尾,您有几个选择:
照你做的做,用你所有的东西替换</TimeML>
,加上</TimeML>
或者可以使用一些xml解析器作为BeautifulSoup