假设有几个外部站点正在抓取/获取您的内容并将其作为自己的内容发布。我们还假设您为每个内容维护一个唯一/永久的url,这样内容别名(在您的站点上)就永远不会成为问题。
从搜索引擎优化的角度来看,在你的标题中包含一个canonical link有什么价值吗?这样当你的网站被“刮掉”时,规范的指示就会被注入到窃取你内容的任何网站中(假设他们获取原始的html而不是通过rss等进入)?
关于跨站点规范链接的行为,我听到过不同的说法,从“它们被忽略”到“行为未定义”再到“不会伤害”再到“确定这正是规范的目的”。我的印象是canonical是处理站点内别名的好方法,但不一定是站点间别名。
最佳答案
我不能直接回答你的问题。
你(你公司的某个人)应该在未经允许的情况下联系正在联合你的内容的各方,并试图让他们在获得许可的情况下这样做。你应该澄清你对未经授权的联合贷款的政策。这当然是一个业务决策,您的业务开发/流程人员和IP律师可能必须参与其中。
如果他们坚持这样做,你绝对需要让他们停止,你可以开始为他们的机器人提供垃圾。检测他们的机器人可能并不简单,因为他们可能会伪造一个“真实”的用户代理头,并使用不同的IP地址(现在大多数恶棍似乎都在使用EC2),然而,如果你成功了,他们的网站就会变成一堆垃圾。
一旦他们的网站充满了垃圾(或者更糟),你就可以再次联系他们,询问他们是否愿意停止他们令人讨厌的行为。