我想知道是否有可能删除刮擦字符串的一部分,例如:
Wujek Drew / Uncle Drew
进入
Uncle Drew
当然,由于它是Web抓取,因此标题每次都将有所不同,那么我该怎么做才能得到上面的结果?
更新资料
我忘记添加也需要删除的内容。 Wujek Drew / Uncle Drew(2018)我将需要删除字符串末尾的数据。
最佳答案
要删除由/字符分隔的刮擦字符串的第一部分,可以使用以下解决方案:
value = driver.find_element_by_xpath("element_xpath").get_attribute("innerHTML").split("/")[1]
根据您的注释更新,如果您想从字符串Wujek Drew / Uncle Drew(2018)中提取子字符串Uncle Drew,则可以使用以下解决方案:
import re
value = driver.find_element_by_xpath("element_xpath").get_attribute("innerHTML")
#value='Wujek Drew / Uncle Drew (2018)'
print(re.split('[/()]',value)[1])