我正在使用PHP和MySQL设置一个站点,该站点本质上只是现有数据库的Web前端。可以理解,我的客户非常渴望阻止任何人能够复制数据库中的数据,但同时又希望所有内容都公开可用,甚至希望“查看全部”链接来显示数据库中的每条记录。
尽管我已采取一切措施来防止诸如SQL注入(inject)攻击之类的攻击,但没有什么可以阻止任何人以html格式查看所有记录并运行某种脚本将这些数据解析回另一个数据库中。即使我要删除“查看全部”链接,从理论上讲,仍然有人可以使用自动化过程来逐条浏览每条记录,然后将它们编译到新数据库中,本质上是捏紧所有信息。
有没有人有任何好的策略来防止甚至阻止他们可以共享的策略。
最佳答案
如果数据已发布,则Internet上的所有人都可以看到并访问这些数据。这包括您想看到它的人和您不想看到的人。
您不能同时拥有这两种方式。您可以这样做,以便只能通过帐户看到数据,而人们将创建帐户来处理数据。您可以这样做,以便只能从已批准的IP地址中看到数据,然后人们将需要经过很多步骤才能获得批准。
是的,您很难获得它,但是如果您希望它对普通用户来说很方便,那么您也需要使它对恶意用户也很方便。
关于php - 从网站数据库中避免 'data scraping'的顶级技术,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/2066756/