当前位置:首页 »“秋了秋”个人博客 » WP教程 » 垃圾的百度官方sitemap插件提交垃圾内容

垃圾的百度官方sitemap插件提交垃圾内容

作者:秋了秋 发表时间:2015年01月13日

百度sitemap插件前几天看到一位Wordpress博主使用的百度Sitemap插件,于是我也想知道这是什么东西,于是就在百度上搜索,结果得知是百度站长平台官方推出的一款插件,该插件在数据提交那里,叫做结构化数据插件,点进去你会发现有两款插件,一款是Wordpress结构化数据插件sitemap1.0,另一款叫做Discuz! 结构化数据插件。

那时候那个激动呀,居然有这种东西,下载来试试,于是依靠我熟练的手法快速下载上传安装,几分钟就妥妥得搞好了,第二天就发现它提交了400多条网址给百度,每天都提交一定量的文章,今天又提交了400多条,总共提交了800多条。正当我得意的时候,却发现它的巨大漏洞了。

像往常一样我都会通过主机控制面板查看蜘蛛的爬行情况,但是又和往常不一样,这次发现蜘蛛爬很多文章页面,又正当我窃喜的时候一个一个去打开这些网址,想瞧个究竟它到底在爬什么文章,却发现全部都是404页面,一下就几十条啊,全部都是一些死链。下图为截取的其中一条。

爬行死链

那么这些死链是如何产生的呢,首先wordpress本身系统的这种递增id就很不完善,每发表一篇文章都会在数据库产生两个占位id,一个是文章本身的id,一个是自动保存的id,当我们优化数据库的时候会把这种自动保存的文章删掉,但是这个id是没有删掉,所以留了个空白id残留在数据库表里面,也就是前台显示的404页面。还有一种就是当我们变动了一个页面的id的时候,如何变换文章id?我博客里面有一篇文章专门讲到(改变wordpress文章id的技巧,使id变连续),对于我这个完美主义者,是追求连续id的,所以你们会看到从我的这篇文章的id开始一直递减,每一个id都对应着一篇文章,从不留空缺。因为我都是首先一口气发布大量草稿,然后通过数据库操作把这些草稿id转到前面的空余id,之后发表文章的时候就择取草稿直接写内容发布了,这样以达到id的充分利用。然而这样移动了的id只是把id内的文章内容移动到了另一个id,那么它原先的id还是依旧存在的,也是一个空值,也就是404。

刚去卢松松那里看了下,他曾发布了一篇文章介绍了该插件的独特优势:

1、安装插件后,能够遍历博客所有文章,自动生成sitemap提交给百度,保证博客历史内容的收录。 2、安装插件后,当博客中有新文章发布时,会将新内容实时推送给百度,大大提升博客新内容的收录速度。 3、博客内容在百度搜索结果中能获得更丰富的信息展示,提高用户点击率。

他这里所说的遍历也就是遍历wordpress数据库的post表中的内容,然而wordpress的post表是很混乱的,死链会有一大堆。但是该插件并不会去检查死链,而是把所有链接生成sitemap提交给百度。这样就造成了把一些垃圾死链递交给百度,这跟自首有什么区别!!把死链递交给它,然后它又来抓取,抓取大量的404页面,不危及你的seo利益才怪。

本来我的博客抓取得好好的,安装这个插件反而带来这么不爽,一怒之下直接把插件删了,不是停用!官方推荐的东西也不是什么好东西啊,秋叶建议大家如果蜘蛛能正常抓取网站文章的话,最好不要安装这种插件,如果你更新文章不多的话,手动提交网址给百度都行的。有人说百度不喜欢主动的东西,那么它这个插件同样也是一个主动的东西。

0
文章作者: “秋了秋”个人博客,本站鼓励原创。
转载请注明本文地址:http://netblog.cn/blog/259.html
目录: WP教程标签: wordpress优化,Sitemap插件 10122次阅读

请求播放音乐,请点击播放

登 录
点击获取验证码
还没账号?点击这里