我正在尝试在文件列表中找到以下标头,并用我自己的标头替换。

/*************************************************************************************
 * Company: XXX
 * File Name: myfile1.c
 * Author: MyName
 * Date: 30/12/2011
 * Operating Environment: XXX
 * Compiler with Version Number:
 * Description: This file contains an array which returns a structure having API characteristics.
 * Version:
 ***********************************************************************************/


基本上,我试图编写一个python程序来遍历目录列表并在所有文件中进行字符串替换。以下是我的程序的代码:

import sys
import os
import re
correctlicheader = r'''
/* <MY-HEADER>
 *
 */
'''

def changelic():
   startdir = sys.argv[1]
   for root, dirs, files in os.walk(startdir):
      for file in files:
         actualfilename =  os.path.join(root, file)
         print("Reading file: %s" %(actualfilename))
         f = open(actualfilename, 'r')
         read_data = f.read()
         #try replacing the incorrect header
         p = re.compile("<MY-REGULAREXPRESSION-HERE>")
         changed_data = p.sub(correctlicheader, read_data, 1)
         f.close()
         f= open(actualfilename, 'w')
         f.write(changed_data)
         f.close()
    print("End")

if __name__ == '__main__':
   changelic()


问题不是正确的“ MY-REGULAREXPRESSION-HERE”。我试过了

p = re.compile("/\*[\*]*\r\n[ *[a-zA-Z0-9:/\.]+\r\n]*\*/")


以及以上的各种排列。但我不断

matched = p.match(read_data)
None


有任何建议取代“ MY-REGULAREXPRESSION-HERE”吗?此外,有没有更好的方法,而无需open(read-mode)-close-open(write-mode)-write?

最佳答案

http://ostermiller.org/findcomment.html具有用于查找c ++注释的正则表达式。

<MY-REGULAREXPRESSION-HERE>更改为/\*([^*]|[\r\n]|(\*+([^*/]|[\r\n])))*\*+/会做正确的事情。

我已经在我的机器上运行了您的代码,它的工作与预期的一样。

感谢@Wilduck的推动。 :)

10-08 15:16