我有一个文件,它以一些行开头,我想删除到行“
此行以及以下两行应替换为:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<TimeML xmlns:ns0="xsi" ns0:noNamespaceSchemaLocation="http://timeml.org/timeMLdocs/TimeML_1.2.1.xsd" xmlns:ns1="xmlns" ns1:xsi="http://www.w3.org/2001/XMLSchema-instance">
<DOCID>doc3</DOCID>
<DCT>Sun Feb 24 15:25:40 CET 2013</DCT>
<TEXT>*1*9*6*9*

可以用同样的格式把实际日期加上“DCT”吗?
并且:在文件的末尾,在“”之前的一行,我应该添加“”。这也可能吗?
我已经可以解决问题的第一部分,即删除我不想要的部分:
with open(fileName,'r+') as f:
   contents=f.read()
   contents=contents[contents.find('<?xml version="1.0"?>'):]
   f.seek(0)
   f.write(contents)
   f.truncate()

非常感谢你的帮助!:)

最佳答案

对于日期格式,您可以查看this topic
对于替换XML文件的结尾,您有几个选择:
照你做的做,用你所有的东西替换</TimeML>,加上</TimeML>
或者可以使用一些xml解析器作为BeautifulSoup

09-27 02:03