在Drupal網站中使用PHP程序來屏蔽采集者效果還不錯,可以自己任意設定判斷标準。不過我們以前的MediaWiki平台上的網站還沒有使用這套PHP程序來屏蔽,最近發現采集又太多了,搞得服務器負載太高,老是從Apache日志人工排查太麻煩、太慢(以前的辦法見博文《Apache中設置屏蔽IP地址和URL網址來禁止采集》),今天花一些時間編寫了一個小程序來統計日志中的IP訪問數,程序很簡短,如下:
<?php /* * 統計Apache日志文件的IP,找出訪問最多的IP地址,方便發現采集者 * James Qi 2013-11-8 */ //0