我有我的博客(您可以从我的个人资料中看到它,如果需要的话),它很新鲜,还有Google机器人的解析结果。

结果令我震惊。显然,在我的网站上,最常见的2个单词是“rss”和“feed”,因为我在“评论RSS”,“Post Feed”等链接中使用了文字。这2个单词将出现在每个帖子中,而其他单词会更加罕见。

有没有办法使这些链接从Google的分析中消失?我不希望技术链接被索引。我只希望内容,标题,描述得到索引。我正在寻找其他内容,而不是将这些文本替换为图像。

我从2007年开始在Google上找到了一些旧的讨论(我认为3年内许多事情可能会发生变化,希望也是如此)

这个问题不是关于robots.txt以及如何使Google忽略页面。这是关于使其忽略页面的一小部分,或以使人类可以看见并且对于机器人而言不可见的方式来改变这些部分。

最佳答案

有一种简单的方法告诉Google不要为您的文档部分编制索引,即使用googleongoogleoff:

<p>This is normal (X)HTML content that will be indexed by Google.</p>

<!--googleoff: index-->

<p>This (X)HTML content will NOT be indexed by Google.</p>

<!--googleon: index-->

在此示例中,第二段不会被Google索引。注意“index”参数,可以将其设置为以下任意一项:
  • index —由“googleoff: index”包围的内容将不被索引
    由Google
    anchor —“googleoff: anchor”区域内任何链接的 anchor 文本
    将不会与目标页面相关联
    snippet-将使用“googleoff: snippet”包围的内容
    为搜索结果创建摘要
    all-用“googleoff: all”包围的内容将被所有
  • 处理

    source

    关于html - 有没有办法让机器人忽略某些文本?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/3207211/

    10-09 14:15