我正在尝试在文件列表中找到以下标头,并用我自己的标头替换。
/*************************************************************************************
* Company: XXX
* File Name: myfile1.c
* Author: MyName
* Date: 30/12/2011
* Operating Environment: XXX
* Compiler with Version Number:
* Description: This file contains an array which returns a structure having API characteristics.
* Version:
***********************************************************************************/
基本上,我试图编写一个python程序来遍历目录列表并在所有文件中进行字符串替换。以下是我的程序的代码:
import sys
import os
import re
correctlicheader = r'''
/* <MY-HEADER>
*
*/
'''
def changelic():
startdir = sys.argv[1]
for root, dirs, files in os.walk(startdir):
for file in files:
actualfilename = os.path.join(root, file)
print("Reading file: %s" %(actualfilename))
f = open(actualfilename, 'r')
read_data = f.read()
#try replacing the incorrect header
p = re.compile("<MY-REGULAREXPRESSION-HERE>")
changed_data = p.sub(correctlicheader, read_data, 1)
f.close()
f= open(actualfilename, 'w')
f.write(changed_data)
f.close()
print("End")
if __name__ == '__main__':
changelic()
问题不是正确的“ MY-REGULAREXPRESSION-HERE”。我试过了
p = re.compile("/\*[\*]*\r\n[ *[a-zA-Z0-9:/\.]+\r\n]*\*/")
以及以上的各种排列。但我不断
matched = p.match(read_data)
None
有任何建议取代“ MY-REGULAREXPRESSION-HERE”吗?此外,有没有更好的方法,而无需open(read-mode)-close-open(write-mode)-write?
最佳答案
http://ostermiller.org/findcomment.html具有用于查找c ++注释的正则表达式。
将<MY-REGULAREXPRESSION-HERE>
更改为/\*([^*]|[\r\n]|(\*+([^*/]|[\r\n])))*\*+/
会做正确的事情。
我已经在我的机器上运行了您的代码,它的工作与预期的一样。
感谢@Wilduck的推动。 :)