遵循这些指南有助于 Google 查找、索引并对您的网站进行排名。即使您选择不采纳这些建议,我们也积极建议您对"质量指南"多加留意,其中简要说明了一些可能造成网站从 Google 索引中彻底删除或受到其他处罚的违禁行为。如果网站受到处罚,则可能不会再出现在 Google.cn 或其他任何 Google 合作伙伴网站的搜索结果中。

将其他相关网站链接到您的网站。  

将网站提交给 Google,网址为:http://www.google.com/addurl.html 。  

将 Sitemap 作为 Google 网站管理员工具的一部分提交。Google 使用您的 Sitemap 来了解您网站的结构,并提高对您网页的抓取率。  

确保应了解您网页的所有网站都知道您的网站已处于在线状态。  

将您的网站提交给相关的目录,例如,Open Directory Project 和 Yahoo!,以及其他特定行业的专业网站。  

设计与内容指南

网站应具有清晰的层次结构和文本链接。每个网页应至少可以通过一个静态文本链接打开。  

为用户提供网站地图,列出指向网站重要部分的链接。如果网站地图上的链接超过或大约为 100 个,则需要将网站地图拆分为多个网页。  

网站应实用且信息丰富,网页文字应清晰、准确地表述要传达的内容。  

要考虑到用户会使用哪些字词来查找您的网页,确保网站上确实包含了这些文字。  

尽量使用文字而不是图形来显示重要的名称、内容或链接。Google 抓取工具无法识别图形中所含的文字。  

确保对 TITLE 和 ALT 标记属性的描述和表达准确无误。  

检查链接是否损坏,并确保 HTML 格式正确。  

如果您决定采用动态网页(即网址中包含"?"字符),请注意并非所有搜索引擎的抓取工具都能像抓取静态网页一样抓取动态网页。动态网页有助于缩短参数长度并减少参数数目。  

将特定网页上的链接限制在合理的数量内(少于 100 个)。

技术指南

由于大部分搜索引擎 Spider 查看网站的方式与 Lynx 一样,所以可以使用 Lynx 之类的文本浏览器来查看您的网站。如果因应用了 Javascript、Cookie、会话 ID、框架、DHTML 或 Flash 等复杂技术,而导致在文本浏览器中无法看到网站的所有网页,则搜索引擎 Spider 在抓取您的网站时可能会遇到麻烦。  

允许搜索漫游器在不采用会跟踪其在网站上浏览路径的会话 ID 或参数的情况下抓取您的网站。这些技术对跟踪单个用户的行为非常有用,但漫游器的访问模式却完全不同。如果采用这些技术,可能会导致对网站的检索不完整, 因为漫游器可能无法排除那些看上去不同,但实际却指向同一个网页的网址。  

确保您的网络服务器支持 If-Modified-Since HTTP 标头。通过该功能,您的网络服务器可以告诉 Google 自上次抓取您的网站以来,内容是否已发生变化。该功能可以节省您的带宽和开销。  

利用网络服务器上的 robots.txt 文件。该文件会告诉抓取工具哪些目录能够抓取,哪些不能抓取。确保该文件是网站的最新版本,以免意外拦截 Googlebot 抓取工具。请访问 http://www.robotstxt.org/wc/faq.html,了解如何在漫游器浏览您的网站时对其进行指示。您可以使用 Google 网站管理员工具中的  robots.txt 分析工具测试 robots.txt 文件,以确保正确使用此文件。  

如果您的公司购买了内容管理系统,请确保该系统能导出您的内容,以便搜索引擎 Spider 可以抓取您的网站。

使用 robots.txt 可避免抓取搜索结果页或其他 自动生成的页面,这些页面对来自搜索引擎的用户没有附加价值。

03-15 00:29