考虑下表“tweets”
tweet_id call_id id_str timestamp text
--------------------------------------------------
1 11 12345 312323134 lorem ipsum
2 11 12345 312323134 lorem ipsum
3 11 12345 312323134 lorem ipsum
4 11 12345 312323134 lorem ipsum
5 11 67890 325565454 dolor
6 11 34355 333544664 samet
每个tweet应该只在数据库中出现一次。如您所见,完全相同的tweet(相同的call_id、id_str、时间戳和文本-换句话说,除了tweet_id(这是一个自动编号字段)之外,所有内容都是相同的)存储了4次(!)
有没有一种方法可以精确匹配(所以:除了tweet\u id之外的所有内容都一样),然后删除最后一个x-1(这里:4-1=3)?换句话说,清理过的桌子看起来
tweet_id call_id id_str timestamp text
--------------------------------------------------
1 11 12345 312323134 lorem ipsum
5 11 67890 325565454 dolor
6 11 34355 333544664 samet
我希望有一个简单的方法可以做到这一点,因为否则我会有一个大问题(向您展示在实际构建数据库之前多花一个小时思考可以做什么!)
最佳答案
在问这个问题之前,你在网上搜索过解决方案吗???如果没有,这里有一个关于如何做到这一点的在线教程。
http://www.sqlteam.com/article/deleting-duplicate-records
关于mysql - 如何从数据库中删除重复的条目?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/9959696/