最近和采集者杠上了,不斷與這些采集者糾纏,周一一大早就看到網站監控報警,服務器帶寬被占滿,在從iftop -i eth1看到有兩個IP段一直占據前列:
再仔細一查,這兩個IP段是已經被我們在.htaccess裡面屏蔽的,從tail -f access.log看這兩個IP段的地址訪問都是403被拒絕狀态,但不知道是哪家的傻爬蟲(220.243.135.*/220.243.136.*),被拒絕後也不停,反而繼續瘋狂爬取,因為被拒絕的速度很快,所以來抓取就更快,導緻帶寬完全被堵死。
以前我們遇到類似情況就用Linux下的iptable來設置,現在用了阿裡雲後也可以在阿裡雲控制後台設置安全組來進行屏蔽,如下圖:
C類地址寫法:1.2.3/24,B類地址寫法:1.2/16,這樣設置後,很快帶寬就恢複了正常,網站打開超時報警也恢複了。
评论4
看來阿裡雲安全組還是很重要的,平時關注這個比較少,學習了。
看來阿裡雲安全組還是很重要的,平時關注這個比較少,學習了。我們網站數據量大,被爬後總是影響服務器,不得不管
我們網站數據量大,被爬後總是影響服務器,不得不管
我也深受這兩個ip段的騷擾!
我也深受這兩個ip段的騷擾! 還有以下幾個IP段,也煩死了: 221.221.(145~169).*嗯,這些爬蟲确實讓人煩心!
嗯,這些爬蟲确實讓人煩心!