考虑我有以下文字:

== Sejarah == \n Berkas:Gunung Kawi Rice Terrace Tampaksiring 1.jpg|kiri|jmpl|200px|Sawah di sekitar Candi Tebing Gunung Kawi, Tampaksiring, Bali. \n  \n  \n \n Jepang menduduki Bali selama Perang Dunia II dan saat itu seorang perwira militer bernama I Gusti Ngurah Rai membentuk pasukan Bali 'pejuang kemerdekaan'. Berkas:Bali Labeled.png|jmpl|225px|Peta topografi Pulau Bali \n \n === Daftar kabupaten dan kota di Bali ==


我想替换来自Berkas的所有数据:直到第一次出现\ n,这意味着:

Berkas:Gunung Kawi Rice Terrace Tampaksiring 1.jpg|kiri|jmpl|200px|Sawah di sekitar Candi Tebing Gunung Kawi, Tampaksiring, Bali. \n
Berkas:Bali Labeled.png|jmpl|225px|Peta topografi Pulau Bali \n


我尝试使用正则表达式df['Body'] = df['Body'].str.replace('Berkas:[\s\S]*?\n','',regex=True)失败
我如何告诉正则表达式\ n应该是第一个被发现的?我究竟做错了什么?!

最佳答案

以下正则表达式部分为我工作。唯一的问题是它还会返回一个额外的\

Berkas:[\s\S]*?[\\\n]


输出:


  Berkas:Gunung Kawi水稻梯田
  1.jpg | kiri | jmpl | 200px |巴厘岛坦帕克西林(Sampah di sekitar)Candi Tebing Gunung Kawi,巴厘岛。 \
  
  Berkas:Bali Labeled.png | jmpl | 225px | Beta topografi巴厘岛\


输出为:
python - 使用Regex捕获文本,直到第一次出现新行-LMLPHP

07-28 04:06