我有我的博客(如果你想的话,可以从我的个人资料中看到),很新鲜,还有谷歌机器人解析结果。
结果令我震惊。显然,我的网站上最常见的两个词是“rss”和“feed”,因为我使用文本作为链接,如“评论rss”、“帖子feed”等。这两个词将出现在每个帖子中,而其他词将更加罕见。
有没有办法让这些链接从谷歌的解析中消失?我不希望技术链接被索引。我只想把内容,标题,描述编入索引。我在找别的东西,而不是用图片代替这段文字。
从2007年开始,我在google上发现了一些旧的讨论(我认为3年后很多事情都可能改变,希望也是这样)
这个问题不是关于robots.txt和如何让google忽略页面。它是要使它忽略页面的小部分,或者以这样一种方式转换页面的各个部分,使其被人类看到,而机器人看不见。
最佳答案
有一种简单的方法告诉google不要索引文档的部分,即使用googleon
和googleoff
:
<p>This is normal (X)HTML content that will be indexed by Google.</p>
<!--googleoff: index-->
<p>This (X)HTML content will NOT be indexed by Google.</p>
<!--googleon: index-->
在本例中,google不会索引第二段。请注意“
index
”参数,该参数可以设置为以下任意值:index
-由“googleoff: index
”包围的内容将不会被索引谷歌
anchor
-为“googleoff: anchor
”区域内的任何链接定位文本将不与目标页关联
snippet
-将不使用由“googleoff: snippet
”包围的内容为搜索结果创建代码段
all
-被“googleoff: all
”包围的内容被处理为source