一、问题的发现
去年11月份的时候,我们陆续有几个网站发现流量大幅减少,一开始还以为是正常波动或其它常规原因而没有引起重视,直到几周后来自百度搜索的流量持续大幅下降、好几个网站都情况类似,才去深入检查原因。🕵️
二、问题的检查
结果在百度资源平台中发现"流量与关键词"的热门关键词里面有些明显异常的数据,例如:
红框中的一些关键
这是 百度 分类的页面,点击下面标题查看详细文章内容:
去年11月份的时候,我们陆续有几个网站发现流量大幅减少,一开始还以为是正常波动或其它常规原因而没有引起重视,直到几周后来自百度搜索的流量持续大幅下降、好几个网站都情况类似,才去深入检查原因。🕵️
结果在百度资源平台中发现"流量与关键词"的热门关键词里面有些明显异常的数据,例如:
红框中的一些关键
去年邮编库与百度开展邮政编码查询合作后,效果还不错,今年百度的人还主动找我们来做更多的智能小程序合作。我们很多年前就做工具类网站,所以也比较适合来做这一类小程序。下面是我们做的一个文字转拼音的百度智能小程序。
这个功能很简单所以也只做了一个页面,直接操作。不过对比其它类似网站或者小程序,我们还是有明显优势:添加了多音字的识别、增加了发音功能等。
下面是这个百度智能
最近同事从访问日志和统计分析中发现有一些400报错和一些错误网页,我们自己访问也打不开,是网址有问题,我翻看了以前写的博客《百度对网址二次编码的问题》,问题很类似。
以前的错误网址:
https://tw.chahaoba.com/%25E8%25AE%25A8%25E8%25AE%25BA:80004911
.htaccess中写的跳转规则:
RewriteCond %{REQUEST_URI} ^(.*)%(.*)$ RewriteRule ^.*$ https://%{HTTP_H
我们邮编库网站提供邮政编码查询的服务有20多年历史了,真的是比所有其它邮编查询网站提供的时间更长、也更专注,这么多年一直不断在这个小小的领域默默改进。即使现在邮政编码的使用频率越来越低,查询邮编的人比以前少了很多,我们却反而推出任意地址邮编查询、微信公众号改进、用IP地址或者手机定位获取用户位置及邮政编码,今年还推出大的改版更新。
很多年前看到百度中搜索邮政编码会出现直接结果,标注来自邮政官方某机构,这种方式当时叫着百度的阿拉丁计划,我们也曾经想去申请,但似乎门槛很高,就没有花力气联系。
今年初接到百度相关人员的联系,主动询问我们是否愿意参加这种合
9月我们就整理了《各厂商或平台提供的Emoji图片列表》,这些都是国外厂商提供的,而国内用户更多是在中国特有的交流平台上使用表情符号,例如微信、QQ上的表情就与Emoji有着明显的不同,同事最近花了很大力气去做了这方面的收集整理工作,网上询问各平台表情图片的人不少,但能提供完整、新版的信息内容极少,只能靠我们自己去各种终端(Windows、MacOS、iOS、Android等)下载各种App或者尝试Web方式,在安装使用中或者直接文件查找甚至反编译去发现这些表情的图片,还要自己做中文对照、介绍、Emoji比对等,好在做出来的内容是质量极高的,请看:
最近几天我们有两个域名下的网站从Google Analytics看流量异常增高,是平时的数十倍,同时在线人数也是以前的几十倍,从流量来源看主要是直接来源用户大量增加,这显然是不正常的。截图如下:
从相同网站的百度统计、Google AdSense数据来看却没有明显变化,只是Google Analytics
几年前Google推出了AMP项目并开源,bing, sogou等搜索引擎也表示支持,百度随后自己推出了一套有些类似的MIP项目,我们网站为了有更好的SEO效果,也在MediaWiki和Drupal网站都添加了MIP版本,我甚至在《Google AdSense实战宝典》一书中还在一个问答中推荐大家做MIP版本。
但百度的MIP技术似乎总有些问题,缓存指向错误页面等等。前两年还有百度熊掌号,轰轰烈烈做全国巡演,但已经被百度放弃了,前两个月接到百度通知,MIP的缓存也即将关闭,又一个产品快下课了。
网站做个AMP版本都有些麻烦,再加上MIP需要考虑更多
昨天同事发现一个奇怪的事情,在百度APP中搜索一个关键词,我们网站排在第一位,显示的内容也是正常的,点击这个链接进入我们网站却显示“无法找到页面”,检查是进入的网址在我们网站并不存在,是百度对我们的URL二次编码造成的,例如:
https://hanyucidian.18dao.cn/hanyu/%25E5%258F%25A3%25E8%2588%258C%25E5%2591%2586%25E9%2592%259D?mip
这个网址是不存在的,正确的网址应该是:
https:/
MediaWiki和Drupal都自带了站内搜索功能,我们多年都是直接调用,只在少数情况下尝试其它的,例如✉邮编库网站因为数据量过大,Wiki站的搜索常导致MySQL数据库卡住,后来改用了Sphinx才不再卡住,但搜索结果不尽如意,有一些莫名其妙的不相干结果,估计是没有把Sphinx摸透、没有专门加对中文的分词包吧。
Drupal站也尝试安装过Apache Solr Search,感觉太复杂了,勉强用了一下,没有深入研究。Drupal站还用Views来进行过搜索、安装过Auto Complete,以及直接用SQL语句来进行搜索。
另外,
今年1月份记录了一篇《清除百度MIP缓存,纠正跳转错误》,当时是在百度移动搜索(m.baidu.com或者baidu app)中的搜索结果跳到错误的MIP页面上,通过清除该域名下所有MIP缓存解决的,估计是百度的移动网页索引中哪里出了问题。
时隔一个多月,2月中旬后再次出现百度移动搜索中的搜索结果跳转到错误的网址,而这次不是MIP页面,而是普通的响应式网页页面,在移动搜索结果中显示的网页标题都是对的,就是点击后到了错误的网址,例如统一都跳转到 www.example.com/xxx/node/40933 ,里面的内容明显不匹配,而对应的百度PC搜索(www.b
2002-2023 v11.7 a-j-e-0