为了向百度搜索主动推送资源,缩短爬虫发现网站链接的时间,加快网站内容抓取,提升百度搜索的收录效率,我们通常会向百度搜索资源平台提交网站 sitemap 文件。
打开当前站点,在 资源提交 菜单下,有个 普通收录 工具,资源提交方式中的 sitemap 类别,在文本框中填写数据文件地址,提交即可。
我的网站是由 WordPress 程序搭建的, 系统自带了 XML 站点地图(XML SiteMap)生成功能,站点地图 wp-sitemap.xml 文件在根目录下,我提交的地址是能正常访问的,但百度最却提示“抓取失败”。
后经分析,原来是自己提交的 sitemap 文件不符合百度的规范要求,百度修改了站点地图的提交方式,不再支持索引型站点地图文件了。
7月8日下午,百度搜索资源平台发布《sitemap 提交方式优化公告》,称为提高站点地图文件的处理效率,搜索资源平台常用的采集和死链提交工具不再支持索引站点地图文件(即XML文档嵌套)XML文档)。
意思就是只支持单文件的列表,不支持多个 XML 列表。而 WordPress 网站,几乎所有 SiteMap 插件都是生成了一个总的 XML 文件,打开后会发现还有下面几个嵌套的 XML 文件。
百度将这类 XML 文件称为索引型 sitemap ,不予处理。而且,百度还规定,若存在索引型sitemap,将不允许提交新文件,需先删除索引型 sitemap 后,才能提交数据。
WordPress 网站的解决方法
我们不能填写 WordPress 生成的这个总的 wp-sitemap.xml 文件,而是要单独提交里面的那些子文件,如:wp-sitemap-posts-post-1.xml,这么操作后,就可以正常提交到百度后台了。
另外 ,若链接存在跳转关系,请直接提交跳转后链接。如网站换域名,需提交新域名资源;进行HTTPS改造页面,请提交HTTPS资源。
暂无评论