一、問題的發現
去年11月份的時候,我們陸續有幾個網站發現流量大幅減少,一開始還以為是正常波動或其它常規原因而沒有引起重視,直到幾周後來自百度搜索的流量持續大幅下降、好幾個網站都情況類似,才去深入檢查原因。🕵️
二、問題的檢查
結果在百度資源平台中發現"流量與關鍵詞"的熱門關鍵詞裡面有些明顯異常的數據,例如:
紅框中的一些關鍵
這是 百度 分類的頁面,點擊下面标題查看詳細文章内容:
去年11月份的時候,我們陸續有幾個網站發現流量大幅減少,一開始還以為是正常波動或其它常規原因而沒有引起重視,直到幾周後來自百度搜索的流量持續大幅下降、好幾個網站都情況類似,才去深入檢查原因。🕵️
結果在百度資源平台中發現"流量與關鍵詞"的熱門關鍵詞裡面有些明顯異常的數據,例如:
紅框中的一些關鍵
去年郵編庫與百度開展郵政編碼查詢合作後,效果還不錯,今年百度的人還主動找我們來做更多的智能小程序合作。我們很多年前就做工具類網站,所以也比較适合來做這一類小程序。下面是我們做的一個文字轉拼音的百度智能小程序。
這個功能很簡單所以也隻做了一個頁面,直接操作。不過對比其它類似網站或者小程序,我們還是有明顯優勢:添加了多音字的識别、增加了發音功能等。
下面是這個百度智能
最近同事從訪問日志和統計分析中發現有一些400報錯和一些錯誤網頁,我們自己訪問也打不開,是網址有問題,我翻看了以前寫的博客《百度對網址二次編碼的問題》,問題很類似。
以前的錯誤網址:
https://tw.chahaoba.com/%25E8%25AE%25A8%25E8%25AE%25BA:80004911
.htaccess中寫的跳轉規則:
RewriteCond %{REQUEST_URI} ^(.*)%(.*)$ RewriteRule ^.*$ https://%{HTTP_H
我們郵編庫網站提供郵政編碼查詢的服務有20多年曆史了,真的是比所有其它郵編查詢網站提供的時間更長、也更專注,這麼多年一直不斷在這個小小的領域默默改進。即使現在郵政編碼的使用頻率越來越低,查詢郵編的人比以前少了很多,我們卻反而推出任意地址郵編查詢、微信公衆号改進、用IP地址或者手機定位獲取用戶位置及郵政編碼,今年還推出大的改版更新。
很多年前看到百度中搜索郵政編碼會出現直接結果,标注來自郵政官方某機構,這種方式當時叫着百度的阿拉丁計劃,我們也曾經想去申請,但似乎門檻很高,就沒有花力氣聯系。
今年初接到百度相關人員的聯系,主動詢問我們是否願意參加這種合
9月我們就整理了《各廠商或平台提供的Emoji圖片列表》,這些都是國外廠商提供的,而國内用戶更多是在中國特有的交流平台上使用表情符号,例如微信、QQ上的表情就與Emoji有着明顯的不同,同事最近花了很大力氣去做了這方面的收集整理工作,網上詢問各平台表情圖片的人不少,但能提供完整、新版的信息内容極少,隻能靠我們自己去各種終端(Windows、MacOS、iOS、Android等)下載各種App或者嘗試Web方式,在安裝使用中或者直接文件查找甚至反編譯去發現這些表情的圖片,還要自己做中文對照、介紹、Emoji比對等,好在做出來的内容是質量極高的,請看:
最近幾天我們有兩個域名下的網站從Google Analytics看流量異常增高,是平時的數十倍,同時在線人數也是以前的幾十倍,從流量來源看主要是直接來源用戶大量增加,這顯然是不正常的。截圖如下:
從相同網站的百度統計、Google AdSense數據來看卻沒有明顯變化,隻是Google Analytics
幾年前Google推出了AMP項目并開源,bing, sogou等搜索引擎也表示支持,百度随後自己推出了一套有些類似的MIP項目,我們網站為了有更好的SEO效果,也在MediaWiki和Drupal網站都添加了MIP版本,我甚至在《Google AdSense實戰寶典》一書中還在一個問答中推薦大家做MIP版本。
但百度的MIP技術似乎總有些問題,緩存指向錯誤頁面等等。前兩年還有百度熊掌号,轟轟烈烈做全國巡演,但已經被百度放棄了,前兩個月接到百度通知,MIP的緩存也即将關閉,又一個産品快下課了。
網站做個AMP版本都有些麻煩,再加上MIP需要考慮更多
昨天同事發現一個奇怪的事情,在百度APP中搜索一個關鍵詞,我們網站排在第一位,顯示的内容也是正常的,點擊這個鍊接進入我們網站卻顯示“無法找到頁面”,檢查是進入的網址在我們網站并不存在,是百度對我們的URL二次編碼造成的,例如:
https://hanyucidian.18dao.cn/hanyu/%25E5%258F%25A3%25E8%2588%258C%25E5%2591%2586%25E9%2592%259D?mip
這個網址是不存在的,正确的網址應該是:
https:/
MediaWiki和Drupal都自帶了站内搜索功能,我們多年都是直接調用,隻在少數情況下嘗試其它的,例如✉郵編庫網站因為數據量過大,Wiki站的搜索常導緻MySQL數據庫卡住,後來改用了Sphinx才不再卡住,但搜索結果不盡如意,有一些莫名其妙的不相幹結果,估計是沒有把Sphinx摸透、沒有專門加對中文的分詞包吧。
Drupal站也嘗試安裝過Apache Solr Search,感覺太複雜了,勉強用了一下,沒有深入研究。Drupal站還用Views來進行過搜索、安裝過Auto Complete,以及直接用SQL語句來進行搜索。
另外,
今年1月份記錄了一篇《清除百度MIP緩存,糾正跳轉錯誤》,當時是在百度移動搜索(m.baidu.com或者baidu app)中的搜索結果跳到錯誤的MIP頁面上,通過清除該域名下所有MIP緩存解決的,估計是百度的移動網頁索引中哪裡出了問題。
時隔一個多月,2月中旬後再次出現百度移動搜索中的搜索結果跳轉到錯誤的網址,而這次不是MIP頁面,而是普通的響應式網頁頁面,在移動搜索結果中顯示的網頁标題都是對的,就是點擊後到了錯誤的網址,例如統一都跳轉到 www.example.com/xxx/node/40933 ,裡面的内容明顯不匹配,而對應的百度PC搜索(www.b
2002-2023 v11.7 a-j-e-0