51工具盒子

依楼听风雨
笑看云卷云舒,淡观潮起潮落

SEO基础:深入了解网站地图Sitemap的应用

当我们网站开发完成后,需要做一个网站地图,这样更能让搜索引擎能够清晰的知道您网站的内容分布。那什么是网站地图Sitemap呢?它到底有什么用呢?接下来,让我们一起去探究吧!

网站地图Sitemap

Sitemap 可方便网站管理员通知搜索引擎他们网站上有哪些可供抓取的网页。最简单的 Sitemap 形式,就是XML 文件,在其中列出网站中的网址以及关于每个网址的其他元数据(上次更新的时间、更改的频率以及相对于网站上其他网址的重要程度为何等),以便搜索引擎可以更加智能地抓取网站。

Sitemap 常见的格式

对于百度来说,支持以下三种Sitemap格式:

  1. txt文本格式

  2. xml格式

  3. Sitemap索引格式

txt文本格式

打开一个sitemap.txt格式的网站地图文件,大致是以下样式:

  • https://www.xxx.com/robots-mislead-seo.html

  • https://www.xxx.com/search-engine.html

  • https://ww.xxx.com/robots-seo.html

此文本文件需要遵循以下规则:

  • 文本文件每行都必须有一个网址。网址中不能有换行。

  • 不应包含网址列表以外的任何信息。

  • 您必须书写完整的网址,包括 http。

  • 每个文本文件最多可包含 50,000 个网址,超过部分再新建一个文本文件。 文本文件需使用 UTF-8 编码。

xml格式

xml格式有两种,一种是谷歌sitemap,一种是百度sitemap

谷歌sitemap格式如下:

<urlset xmlns=“网页列表地址”>
    <url>
        <loc>网址</loc>
        <lastmod>2021-1-01T00:00-08:00</lastmod>
        <changefreq>always</changefreq>
        <priority>1.0</priority>
    </url>
    <url>
        <loc>网址</loc>
        <lastmod>2021-01-02T20:20:36Z</lastmod>
        <changefreq>daily</changefreq>
        <priority>0.8</priority>
    </url>
</urlset>

百度sitemap格式如下:

<?xml version="1.0" encoding="UTF-8"?>
<urlset>
    <url>
        <loc>网页地址</loc>
        <lastmod>2021-01-01</lastmod>
        <changefreq>daily</changefreq>
        <priority>1.0</priority>
    </url>
</urlset>

看上去谷歌的sitemap要比百度的sitemap复杂,其实是一样的,下面看看xml中几个重要的标签。
changefreq:页面内容更新频率。
lastmod:页面最后修改时间(ISO 8601)
loc:页面永久链接地址
priority:相对于其他页面的优先权
其中changefreq是比较重要的,它会告诉搜索引擎爬虫,此界面多久更新一次,这样爬虫就可以尽可能及时的爬取网站更新的内容,可以通过"always"、 "hourly"、 "daily"、 "weekly"、 "monthly"、 "yearly"、 "never"几个单词来描述,具体含义就不单独解释了,看单词意思应该就很明白了,有不懂的留言。

Sitemap索引格式

当网站内容不断丰富,就会有多个sitemap文件,如果一个一个文件去站长平台提交是一件很麻烦的事,还有一种更方便的方法,将所有sitemap文件打包提交,如下格式:

<?xml version="1.0" encoding="utf-8"?>
<!-- XML文件需以utf-8编码-->
<sitemapindex>
<!--必填,以 <sitemapindex> 开始标记作为开始,以 </sitemapindex> 结束标记作为结束-->
    <sitemap>
        <!--必填,以<sitemap>标签提交一个子sitemap文件-->
        <loc>http://example.com/sitemap.xml</loc>
        <!--必填,识别sitemap的位置-->
        <lastmod>2021-1-1</lastmod>
        <!--选填,识别相对sitemap文件的修改时间-->
    </sitemap>
    <!--必填,标签闭合-->
</sitemapindex>
<!--必填,标签闭合-->

只要复制<sitemap>标签,添加更多的sitemap文件路径就可以,最后提交单个sitemap索引文件就可以。

作用

网络抓取工具通常会通过网站内部和其他网站上的链接查找网页。Sitemap会提供此数据以便允许支持Sitemap的抓取工具抓取 Sitemap 提供的所有网址,并了解使用相关元数据的网址。使用Sitemap协议并不能保证网页会包含在搜索引擎中,但可向网络抓取工具提供一些提示以便它们更有效地抓取网站。


赞(1)
未经允许不得转载:工具盒子 » SEO基础:深入了解网站地图Sitemap的应用