去年就发现我们有的网站在Google Search Console里面提交的网站地图一直都是“待定”状态(英文界面是“Pending”),重新提交也没有效果,前几天又和同事一起查看,发现有两个域名的系列网站全部都是网站地图处在“待定”状态,这应该有好多个月了,很是令人郁闷。
先以为是网站地图本身有问题,但打开都是正常的,用Google Search Console里面的“用Google方式打开”也可以正常获取内容,在其它验证网站地图的地方也可以通过验证,肯定不是网站地图本身的问题。
考虑是否因为我们一些站的多语言设置很多,网站地图经历过几次改版,参考我以前的博客文章《Drupal网站多语言版的站点地图自动转换》和《多语言网站xml sitemap中网址的相互链接》,是否我们带的多语言链接太多?上周我去掉部分网站sitemap中的多语言设置,重新提交了,但到这个星期再看也没有改变状态。
又在网上搜索了相关话题,各种回答都有,例如:网站地图格式问题、网站地图是否被robots.txt屏蔽、Google爬虫是否被屏蔽、网站是否被惩罚、sitemap的提交仅仅参考不重要、pending就是pending等等。这里还有两篇来自Google官方博客的2009年的文章:
我去查看Google Search Console里面的“索引状态”和“搜索分析”,发现也都是有数据的,再用Google搜索site:example.com,也是有数据的,这说明和sitemap提交的关系也确实不大。
我又花了不少时间去看了Google官方的一些内容:
再结合我们其它域名下提交Sitemap都可以显示正确的数据的情况,我自己得出的结论是Pending的两个域名还是因为内容质量不好、数量过多而受到Google的一些限制了,里面一些有用的信息还是会被索引、展示,而Google认为用处不大、过时或者重复的内容则不会被索引和展示。
那就还是好好做网站内容吧,尽量挑选新鲜独特的数据来源,只想扩大数据量靠长尾来做不是不行,只是效果不会那么好了。广告收益也是类似,有些人的网站流量大,但广告点击率特别低,收入很少,而有些人的网站流量不大,但内容质量高、用户定位精准,广告点击率高,收入也高。
评论