假设我们有这些页面:

1. http://www.mywebsite.com/users/thomas-roberts
2. http://www.mywebsite.com/pages/thomas-roberts/1
3. http://www.mywebsite.com/pages/thomas-roberts/hello-kitty-collection

在sitemap.xml中是否可以这样做:
<?xml version="1.0" encoding="utf-8"?>

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
        <loc>http://mywebsite.com/users/^(\w+)$/</loc>
        <lastmod>2006-11-18</lastmod>
        <changefreq>daily</changefreq>
        <priority>1</priority>
    </url>
    <url>
        <loc>http://mywebsite.com/users/^(\w+)$/pages/^(\w+)$</loc>
        <lastmod>2006-11-18</lastmod>
        <changefreq>daily</changefreq>
        <priority>0.8</priority>
    </url>
    <url>
        <loc>http://mywebsite.com/users/^(\w+)$/pages/^(\d+)$</loc>
        <lastmod>2006-11-18</lastmod>
        <changefreq>daily</changefreq>
        <priority>0.6</priority>
    </url>
</urlset>

我希望我的示例很清楚,我们并没有在sitemap.xml文件中真正指定一个新的“url”元素,而是将regex与url匹配起来,每次更新时我们都会返回。
如果这不是一个解决方案,twitter和facebook如何在google中索引所有页面(个人资料页面等)?他们是否会在每次创建新用户时生成新的站点地图,并在每次有人更新他们的页面/配置文件时更新他们的站点地图?
我很好奇,如果indead以某种方式生成sitemap.xml(限制为50000条和10MB),那么如果内容被修改,生成sitemap的好主意是什么?
非常感谢。

最佳答案

站点地图必须包含实际的URL。regex是不可接受的,而且毫无用处,因为它们什么都不告诉搜索引擎。
网站地图只是告诉搜索引擎在哪里可以找到你的内容。因此,如果一个页面的内容被修改,网站地图就不会影响到搜索引擎。

关于seo - SEO sitemap.xml动态内容,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/11989237/

10-12 13:19