我有一个文件'in.csv',其中包含许多类似于以下内容的条目:

[Part 1: A]
Was hab’ ich nur getan?
Hab mich selbst nie hinterfragt
Wer bin ich, wer bin ich, wer bin ich, was bin ich bloß?
Aaaah - wer bin ich, was bin ich bloß?
Ging es all die Zeit lang wirklich nur um mich?
Nur um mich, nur um mich, nur um mich?
Denk’ ich wirklich immer nur an mich?
Nur an mich, nur an mich, nur an mich?

[Part 2: T]
Ich bin so horrible, horrible, horrible
Fehler einzusehen ist mir nicht possible, possible, possible
Jaaah - doch ich denk’ jeden Tag an all den Shit, den ich getan hab’
Warum unterschätz’ ich meinen Impact auf die andern?
Homie, sag mir, warum ficke ich mein Karma
Und geb kein’ Fick auf alles, was die Stimme in mir labert?
Blockiert mich da mein Ego oder weiß ich es nicht besser?
Mann, wann verdammt fühl ich mich bereit etwas zu ändern?
Warum lass’ ich einfach nichts mehr an mich ran?
Warum lass’ ich selbst mich selbst nicht an mich ran?
,1

(...)


我想找到并消除这种模式的所有出现:

match = "[\(\[].*?[\)\]]"


我正在尝试:

with open('in.csv', 'rb') as in_file, open('out.csv', 'wb') as out_file:
     reader = csv.reader(in_file, delimiter='\t')
     for item in list(reader):
         re.sub(match, ' ', item, flags=re.MULTILINE)
         out_file.write(item)


但它不起作用。如何查找并消除所有[]

最佳答案

问题是您对结果不做任何事情,表达式是正确的:

with open('in.csv', 'rb') as in_file, open('out.csv', 'wb') as out_file:
     reader = csv.reader(in_file, delimiter='\t')
     for item in list(reader):
         item = re.sub(match, ' ', item, flags=re.MULTILINE)
         # ---^---
         out_file.write(item)


sub函数不会更改原始字符串,而是会返回一个新副本,因此您需要抓住它。您甚至可以通过添加锚点来改善表情:

^[\(\[].*?[\)\]]


它大大减少了所需的步骤(十倍!),请参见a demo on regex101.com

关于python - Python-从CSV文件中消除正则表达式匹配,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/46461168/

10-12 16:52