我们使用了阿里云的多种服务好几年了,ECS服务器、RDS数据库等种类和台数都在增加中,前段时间把云监控中的“站点监控(站点拨测)”设置进行了全面梳理,原则是让需要报警的及时告知需要了解的人、让不需要报警的情况和不需要了解的人减少干扰,方便同事准确了解和处理。
但这个报警是事后的,要想提前了解、预防问题,可以查看ECS/RDS平时的状态,对于资源占用一直比较高的需要观察,对于资源占用突然增高的需要处理。我们以前用过Linux的的VNC远程桌面查看多台ECS的top数据,这个还是有一定作用的。但要查看图形化的历史数据就不方便了,可以查看阿里云的各种监控数据,不过阿里云的监控数据太多、比较繁杂,也不方便经常查看,因此我们最近做了一些准备工作:
- 购买一台阿里云的云桌面(1元试用1个月),用于长期打开需要监控的窗口,便于其它客户端随时连接访问;
- 购买一台三星34寸4K显示器,用于放在办公室相关同事面前,便于随时查看各项监控数据和图形;
- 使用一台老的联想笔记本电脑,不需要性能很强,作为云桌面的瘦客户机终端,三星显示器作为其第二屏。
下面就是显示器和电脑连接访问云桌面的拍照:
监控屏上除了ECS的top数据以外,我们在阿里云的云监控中创建了自己的仪表盘(Dashboard),以便集中查看主要数据:
- 阿里云的云监控中有“企业云监控”,其中有监控大盘、智能水位分析等高端功能,但收费不少,所以我们暂时没有采用;
- 阿里云的云监控中有“Dashboard”,可以添加自定义的数据展示,比较符合我们的需要;
- 多个阿里云账号之间不能互通查看云监控数据,所以不同阿里云账号下分别创建各自的仪表盘;
- 一个仪表盘中可以显示多个监控图表,把需要监控的ECS、RDS等资源放在一个仪表盘中方便查看;
- 每台ECS可以添加一个图表,图表中包含CPU和带宽的占用百分比这两个对我们来说最重要的数据;
- 每台RDS可以添加一个图表,图表中包含CPU、IOPS、活跃连接数等几个对我们最有用的数据;
- 仪表盘默认显示1小时数据,可以切换为6小时、12小时、1天、3天、7天,但只有1小时和6小时可以开启“自动刷新”
- 根据需要设置每行展示几个图表。
下面是阿里云的云监控中Dashboard仪表盘例子的查看:
还有自定义监控也可以加到仪表盘中,以后我们再来进行尝试。
评论