網站遇到采集者是很常見的事情,因為采集太快太多導緻我們服務器負載過高的事情也時有發生,我們一般都是收到網站打開太慢或者服務器負載過高報警的消息後及時進行處理,在apache設置.htaccess上把該屏蔽的屏蔽就可以了,偶爾需要用到ipt
網站
這是 網站 分類的頁面,點擊下面标題查看詳細文章内容:
昨天給同事做内部培訓,講搜索引擎優化,提到面包屑導航的時候,有人問為什麼叫“面包屑”,我記憶中是有個故事:小孩在森林中迷路了,為了能找到回去的路就沿途灑下面包屑,網站中的導航欄也是起到讓浏覽者不迷糊的作用,因此叫着面包屑導航,英文Breadcrumb Navigation,例如本篇博客文章的上級導航是:
首頁 » 博客 » James Qi的博客
Drupal網站中是可以自動生成面包屑導航的,而在MediaWiki網站中我們是自己寫的,反正隻要實現這
去年我們Drupal網站把MySQL數據庫的UTF8字符集升級為UTF8MB4了,很重要一點就是可以支持emoji表情字符,以前的UTF8字符集數據庫在保存表情字符的時候會無法保存而報錯。
當時我還專門去找了幾個emoji表情網站
我們有部分網站設立的時間很長,在搜索引擎裡面權重高,流量還不錯,也有一定知名度和口碑,創收方面基本上就一直用聯盟廣告的形式,例如Google AdSense或者百度聯盟。好幾年前就有人網上找到我們,希望在我們的網站域名下設立一個目錄,專門放置
前段時間和同事一起看了一些國外開放數據的網站,特别是一些國家/地區政府的開放數據,考慮哪些是适合用來做網站的、哪些不适合、好數據有什麼特征等,下面小結幾點:
剛開始用Drupal網站的時候對于多語言站點不是很了解,10種語言就單獨做了10個站點(郵編庫的10種外文中國郵編站點),導緻數據庫龐大、維護麻煩,後來我們又做了一個新版郵編庫,一套數據庫可以增加50種外文版本。
因為中國郵編有180萬數據,生成的頁面數量衆多、各種查詢消耗數據庫資源大,被各種爬蟲大量抓取的時候常常導緻MySQL性能問題。在Drupal 6升級到Drupal 7的過程中考慮過放棄這個系列,重定向到新版郵編庫,但當時沒有下這個決心,還是花了不少時間精力去實施了升級。
今年開年大力開展關停并轉工作,為其他項目發展騰出時間精力
多年前我們開始專門做網站運營的時候就考慮到多語言支持,特別是繁體版本,當時用MediaWiki搭建了一個專門的繁體版本實用查詢網站,內容與對應的簡體版本實用查詢網站基本一樣,後來看到繁體版本的瀏覽量一直不錯,而簡體版本的瀏覽量很少,
10年前做的一把刀實用查詢網站當時先是同事用Java開發了一個版本,但以後的持續改進、維護、開發不方便,我就又弄了一個MediaWiki平台,做了《中文簡體》、《中文繁體》、《英文》三個版本,十年過後還一直有用戶使用,幾個版本的情況:
- https://cn.18dao.net 中文簡體:流量不大,雖然内容與繁體基本對應,質量還算不錯的,但百度不給與好的權重;
- https://tw.18dao.net 中文繁體:流量一直不錯,主要來源是台灣用戶使用Google, Yahoo帶來的流量,也有不少回訪用戶;
美國郵政編碼的網站我們做得很早了,最早是在郵編庫網站的美國郵編這個頁面添加内容,後來建的這個5位号碼ZIP Code的郵編庫子網站流量還不錯:United States ZIP Code。另外一套美國9位郵編數據的系列網站U.S. ZIP Codes 5
前年開始準備龍人方言系列網站,公司還花費了不少力氣,去年3月份龍人網推出方言系列之武漢話網站及微信公衆服務号,7月份武漢話在網站基礎上推出移動應用App程序,今天去看了一下流量統計,每天隻有200左右的浏覽量,app的用戶也不多(不過iOS的用戶比Android的多不少),算廣告收入的話,金額也是可以忽略掉的。😭
國内的網站流量很大程度上還得靠百度,但在百度中搜索“武漢話”排在前面的是廣告、百度百科、百度知道、百度文庫、百度貼吧等,還有一些其它網站,我看都不如我們網站專業、内容豐富,但就是不把我們的排在前面,也沒有辦法。而在Google