当前位置

OpenWRT路由器中监控网络服务并重启的脚本

James Qi 在 2014年5月7日 - 22:42 提交
内容摘要:前一阵子写了一篇《俺在德国上网的十八般武艺》和一篇《修改OpenWRT的设置接入802.1X认证的网络》,这个CF-E218N远程Wifi放大器确实帮了我的大忙,可以足不出户就连接上百米以外的WLan......

  前一阵子写了一篇《俺在德国上网的十八般武艺》和一篇《修改OpenWRT的设置接入802.1X认证的网络》,这个CF-E218N远程Wifi放大器确实帮了我的大忙,可以足不出户就连接上百米以外的WLan。

  不过从第一天开始就发现有路由器偶然中断的情况,也就是电脑或者移动终端突然会断网找不到Wifi热点,这时跑过去看路由器,会发现背后几个LED灯在不停闪烁,而正常情况下是显示远程无线信号强弱的。故障间隔时间上不固定,有时十几个小时会断一次,有时几个小时,或者几天,好像是与使用频繁程度有关,网络越繁忙就越容易出故障。偶尔也出现过出问题后路由器自己恢复的情况,但多数情况下都无法自己恢复,只好人工去把电源关闭、再接通,让路由器重启,这样几分钟后可以恢复。

  但这样也比较麻烦,想到能否有机制自动检测故障然后自动排除故障恢复访问呢?在网上找了一些资料,看到还是有人在Linux平台下编写脚本来做这个事情的,各种平台、各种路由器、各种监控手段和脚本都有,我这里结合自己的情况记录一下:

  在/root下编写一个my_watchdog.sh脚本:

#!/bin/sh
#sleep 100
DATE=`date +%Y-%m-%d-%H:%M:%S`
tries=0
echo --- my_watchdog start ---
while [[ $tries -lt 5 ]]
do
        if /bin/ping -c 1 8.8.8.8 >/dev/null
        then
                echo --- exit ---
#               echo $DATE OK >>my_watchdog.log
                exit 0
        fi
        tries=$((tries+1))
        sleep 10
#       echo $DATE tries: $tries >>my_watchdog.log
done

echo $DATE network restart >>my_watchdog.log
/etc/init.d/network restart

#echo $DATE reboot >>my_watchdog.log
#reboot

  然后用crontab -e来在系统的crontab中添加一句,每隔5分钟定时运行这个脚本:

*/5 * * * * sh /root/my_watchdog.sh

0 0,4,8,12,16,20 * * * date -u  +"%Y.%m.%d-%H:%M:%S" >/usr/data/time_backup
0,1,11,21,31,41,51 * * * * /usr/bin/set_kernel_timezone >/dev/null 2>&1
0 0,4,8,12,16,20 * * * /tmp/bw_backup/do_bw_backup.sh

  几个注意的地方:

  • 这个脚本是通过PING Google的DNS服务器8.8.8.8来判断网络是否连通的
  • 连续5次不能PING通,中间间隔10秒,就判断为网络故障
  • 我先考虑的处理办法是重启路由器,后来尝试用网络服务重启就可以恢复
  • 增加了一个my_watchdog.log的日志文件,记录故障、重启的时间、次数
  • 路由器的固态硬盘容量非常小,只有2M多,日志文件都不能大了,所以注释掉了一些不是很必要的运行记录
  • 脚本运行时间间隔不宜太短,否则在没有WLan网络连接的情况下会不断重启网络服务,都无法登陆进去修改设置了,现在设定的5分钟对于登录修改、停止脚本运行还是够了

  这个脚本运行了24小时,自动发现两次故障、自动重启网络服务两次,都正常恢复了,比人工来处理还是方便一些。不过如果能查到具体故障原因、彻底消除隐患才好,但那是高手才能做到的事情,我这种水平也就可以先做点临时修补、治标不治本的工作吧。