考虑我有以下文字:
== Sejarah == \n Berkas:Gunung Kawi Rice Terrace Tampaksiring 1.jpg|kiri|jmpl|200px|Sawah di sekitar Candi Tebing Gunung Kawi, Tampaksiring, Bali. \n \n \n \n Jepang menduduki Bali selama Perang Dunia II dan saat itu seorang perwira militer bernama I Gusti Ngurah Rai membentuk pasukan Bali 'pejuang kemerdekaan'. Berkas:Bali Labeled.png|jmpl|225px|Peta topografi Pulau Bali \n \n === Daftar kabupaten dan kota di Bali ==
我想替换来自Berkas的所有数据:直到第一次出现\ n,这意味着:
Berkas:Gunung Kawi Rice Terrace Tampaksiring 1.jpg|kiri|jmpl|200px|Sawah di sekitar Candi Tebing Gunung Kawi, Tampaksiring, Bali. \n
Berkas:Bali Labeled.png|jmpl|225px|Peta topografi Pulau Bali \n
我尝试使用正则表达式
df['Body'] = df['Body'].str.replace('Berkas:[\s\S]*?\n','',regex=True)
失败我如何告诉正则表达式\ n应该是第一个被发现的?我究竟做错了什么?!
最佳答案
以下正则表达式部分为我工作。唯一的问题是它还会返回一个额外的\
Berkas:[\s\S]*?[\\\n]
输出:
Berkas:Gunung Kawi水稻梯田
1.jpg | kiri | jmpl | 200px |巴厘岛坦帕克西林(Sampah di sekitar)Candi Tebing Gunung Kawi,巴厘岛。 \
Berkas:Bali Labeled.png | jmpl | 225px | Beta topografi巴厘岛\
输出为: