前一阵子写了一篇《俺在德国上网的十八般武艺》和一篇《修改OpenWRT的设置接入802.1X认证的网络》,这个CF-E218N远程Wifi放大器确实帮了我的大忙,可以足不出户就连接上百米以外的WLan。
不过从第一天开始就发现有路由器偶然中断的情况,也就是电脑或者移动终端突然会断网找不到Wifi热点,这时跑过去看路由器,会发现背后几个LED灯在不停闪烁,而正常情况下是显示远程无线信号强弱的。故障间隔时间上不固定,有时十几个小时会断一次,有时几个小时,或者几天,好像是与使用频繁程度有关,网络越繁忙就越容易出故障。偶尔也出现过出问题后路由器自己恢复的情况,但多数情况下都无法自己恢复,只好人工去把电源关闭、再接通,让路由器重启,这样几分钟后可以恢复。
但这样也比较麻烦,想到能否有机制自动检测故障然后自动排除故障恢复访问呢?在网上找了一些资料,看到还是有人在Linux平台下编写脚本来做这个事情的,各种平台、各种路由器、各种监控手段和脚本都有,我这里结合自己的情况记录一下:
在/root下编写一个my_watchdog.sh脚本:
#!/bin/sh #sleep 100 DATE=`date +%Y-%m-%d-%H:%M:%S` tries=0 echo --- my_watchdog start --- while [[ $tries -lt 5 ]] do if /bin/ping -c 1 8.8.8.8 >/dev/null then echo --- exit --- # echo $DATE OK >>my_watchdog.log exit 0 fi tries=$((tries+1)) sleep 10 # echo $DATE tries: $tries >>my_watchdog.log done echo $DATE network restart >>my_watchdog.log /etc/init.d/network restart #echo $DATE reboot >>my_watchdog.log #reboot
然后用crontab -e来在系统的crontab中添加一句,每隔5分钟定时运行这个脚本:
*/5 * * * * sh /root/my_watchdog.sh 0 0,4,8,12,16,20 * * * date -u +"%Y.%m.%d-%H:%M:%S" >/usr/data/time_backup 0,1,11,21,31,41,51 * * * * /usr/bin/set_kernel_timezone >/dev/null 2>&1 0 0,4,8,12,16,20 * * * /tmp/bw_backup/do_bw_backup.sh
几个注意的地方:
- 这个脚本是通过PING Google的DNS服务器8.8.8.8来判断网络是否连通的
- 连续5次不能PING通,中间间隔10秒,就判断为网络故障
- 我先考虑的处理办法是重启路由器,后来尝试用网络服务重启就可以恢复
- 增加了一个my_watchdog.log的日志文件,记录故障、重启的时间、次数
- 路由器的固态硬盘容量非常小,只有2M多,日志文件都不能大了,所以注释掉了一些不是很必要的运行记录
- 脚本运行时间间隔不宜太短,否则在没有WLan网络连接的情况下会不断重启网络服务,都无法登陆进去修改设置了,现在设定的5分钟对于登录修改、停止脚本运行还是够了
这个脚本运行了24小时,自动发现两次故障、自动重启网络服务两次,都正常恢复了,比人工来处理还是方便一些。不过如果能查到具体故障原因、彻底消除隐患才好,但那是高手才能做到的事情,我这种水平也就可以先做点临时修补、治标不治本的工作吧。
评论4
感谢博主分享, 我在此基础上增加:
感谢博主分享, 我在此基础上增加: 1.避免重复写日志; 2.增加微信通知功能; 项目地址:https://github.com/q629988171/my_watchdog/谢谢你的github项目中放置了来源链接为我这篇博客😄
谢谢你的github项目中放置了来源链接为我这篇博客😄
多谢博主的脚本,不过我在X86_64平台上测试发现
多谢博主的脚本,不过我在X86_64平台上测试发现,如果使用重启网络服务的方式,则会出现在OpenWRT的概览页面显示wan已经连接,但是实际上并无法连接上网的状况,不得已还是改回了reboot,不知道可否解释一下什么原因?你好,我自己现在已经没有用这个系统了,手头无法实验
你好,我自己现在已经没有用这个系统了,手头无法实验,所以还不好解释,抱歉。