什么是SiteMap.xml/SiteMap.txt?

2020年2月21日07:04  0  15  

SiteMap就是我们站长称之为网站地图,包含并列出了网站中几乎所有的URL,以便搜索引擎可以更加方便快捷的抓取和发现网站的网页,从而提高搜索引擎的抓取效率。因为很多网站的连接层次比较深,蜘蛛很难抓取到,网站地图可以方便搜索引擎蜘蛛抓取网站页面,通过抓取网站页面,清晰了解网站的架构,网站地图一般存放在根目录下并命名为sitemap,为搜索引擎蜘蛛指路,增加网站重要内容页面的收录。网站地图就是根据网站的结构、框架、内容,生成的导航网页文件。大多数人都知道网站地图对于提高用户体验有好处:它们为网站访问者指明方向,并帮助迷失的访问者找到他们想看的页面。在实际中我们最常见的有以下几种网站地图文件格式:sitemap.xml,sitemap.html,sitemap.txt。

sitemap.xml、sitemap.txt

XML版本的网站地图是由Google首先提出的,是用于提交给搜索引擎的重要文件,XML 文件也是 sitemap 信息量最大最常用的,其文件中列出了网站中的所有网页地址及其它相关数据(更新的时间、频率以及相对于网站上其他网址的重要程度等)。XML版本的网站地图是由XML标签组成的,文件本身必须是utf8编码,网站地图文件实际上就是列出网站需要被收录的页面的URL,最简单的网站地图可以是一个纯文本件,文件只要列出页面的URL,一行列一个URL,搜索引擎就能抓取并理解文件内容。简单的我们可以理解这两个文件是给搜索引擎看的文件,XML版本中包含了 URL,时间,重要性等参数。

sitemap.html

sitemap.html 格式的网站地图主要用来方便用户的浏览使用,简单的来说就是给来访用户看的。称为HTML版本的网站地图,这个版本的网站地图就是用户可以在网站上看到的,列出网站上所有主要页面的链接的页面。对小网站来说,甚至可以列出整个网站的所有页面,对于具有规模的网站来说,一个网站地图不可能罗列所有的页面链接,可以采取两种办法,一种办法是网站地图只列出网站最主要的链接,如一级分类,二级分类,第二种办法是将网站地图分成几个文件,主网站地图列出通往次级网站的链接,次级网站地图在列出一部分页面链接。如下图:新浪的网站地图HTML页

sitemap的优点

1.为搜索引擎蜘蛛提供可以浏览整个网站的链接简单的体现出网站的整体框架出来给搜索引擎看;

2.为搜索引擎蜘蛛提供一些链接,指向动态页面或者采用其他方法比较难以到达的页面;

3.作为一种潜在的着陆页面,可以为搜索流量进行优化;

4.如果访问者试图访问网站所在域内并不存在的URL,那么这个访问者就会被转到“无法找到文件”的错误页面,而网站地图可以作为该页面的“准”内容


sitemap的使用建议

百度:建议使用 HTML 格式和TXT格式的网站地图。

Google:建议使用 XML 格式的网站地图。

Yahoo:建议使用 TXT 格式的网站地图。


继续阅读