https://mp.weixin.qq.com/s/qJGKjPn2liGXoA_LyaBNNw
WGCLOULD
一、项目简介
本平台以极简运维为理念,致力于实现快速部署、低学习成本与全自动化运维体验,摒弃传统复杂模板与脚本配置模式,让运维操作化繁为简、开箱即用。系统架构基于 Spring Boot 微服务,采用轻量级分布式设计,具备对硬件资源的全方位洞察力,可精准监测 CPU 使用率、温度、内存、磁盘容量、IO 性能、硬盘健康状态、系统负载、网络连接数及网卡流量等核心指标,同时对软件运行状况实时把控,涵盖进程状态、文件完整性、端口状态、日志动态、Docker 容器、数据库及数据表等关键要素。
平台还支持服务接口 API 以及网络设备(交换机、路由器、打印机)连通性监测,具备网络拓扑图自动生成能力,提供大屏可视化展示、Web SSH 远程管理(支持堡垒机模式)、统计图表分析、批量指令执行等多元功能,告警通知机制全面,可通过邮件、钉钉、微信、短信等多渠道即时推送。
二、项目优势
轻量:它的探针端 agent 体积只有 6M 大小
集群监控:默认可支持数百主机在线监测服务
性能优秀:基本不占用内存 cpu 资源
安全稳定:开始于开源社区,后来推出商业版,在开源社区非常受欢迎,就是因为它的简单稳定的口碑引来那么多用户青睐
部署简单:除了 server 需要 JDK1.8 和 mysql,agent 部署后即可启动,不用其他依赖
上手容易:操作简单,UI 体验极佳
无模板脚本:再也不用找模板和写辣么多的脚本了,启动后即可自动采集所有主机指标
私有化部署:server 和 agent 全部本地部署,可以在内网运行,不用外网
三、运行环境
1.JDK版本:JDK1.8、JDK11
2.数据库:MySql5.5及以上、MariaDB、PostgreSQL、Oracle
3.支持系统平台
支持监测Linux系列:Debian,RedHat,CentOS,Ubuntu,Fedora,SUSE,麒麟,统信(UOS),龙芯(mips)等
支持监测Windows系列:Windows Server 2008 R2,2012,2016,2019,2022,Windows 7,Windows 8,Windows 10,Windows 11
支持监测Unix系列:solaris,FreeBSD,OpenBSD
支持监测MacOS系列:macOS amd64,macOS arm64
其他支持:ARM,Android(安卓),riscv64,s390x,树莓派,AIX等
四、通信原理
图片
五、核心功能
主机基础信息采集
支持获取操作系统版本、主机IP地址、设备名称、MAC地址、网卡列表、进程总数、启动时间、运行时长、系统吞吐量及网络流量速率等核心数据。
硬件性能监控
实时追踪CPU型号、核心数量、使用率及温度,内存总量与占用率,磁盘容量、IO读写速度、SMART健康状态,以及交换区内存使用情况。
容器资源管理
提供容器创建时间、名称、镜像版本、端口映射、资源消耗(内存/CPU)、运行状态等数据,并支持远程启动、停止或重启容器操作。
日志异常检测
对log/txt/out格式的日志文件进行关键字扫描,一旦发现预设告警词立即触发通知,便于快速定位问题。
文件完整性保护
监控指定文件或目录的修改、删除行为,支持自动恢复原始内容,防止关键配置或数据被篡改。
端口连通性检测
检测目标IP的指定端口是否可达,用于验证服务可用性或网络连通性。
GPU状态监控
采集主机GPU的使用率、温度、显存占用等指标,适用于深度学习或高性能计算场景。
防火墙状态追踪
实时监测主机防火墙的启用状态及规则配置,确保安全策略符合预期。
定时任务管理
监控Linux主机的Crontab任务设置(暂不支持Windows),确保计划任务按预期执行。
自定义脚本监控
允许用户编写指令或脚本,由Agent定期执行并反馈结果,支持基于表达式的告警规则。
数据库与表监控
自定义SQL语句监控数据库及数据表状态,支持设置监控间隔时间,并通过表达式触发告警。
接口可用性检测
支持对GET/POST接口的响应时间、状态码进行周期性检测,确保API服务正常运行。
数据导出功能
所有监控指标数据可导出为Excel文件,便于离线分析或存档。
批量指令下发
通过Server端向多台主机同时下发多条指令,支持立即执行或定时任务模式,并可设置连续执行天数。
告警配置灵活性
支持开启/关闭告警、设置阈值及时间段,允许为单台主机定制告警规则,并通过邮件、微信、钉钉、短信等渠道推送通知。
告警静默机制
相同告警在设定的静默时间内不会重复发送,减少冗余通知。
告警脚本扩展
支持使用Bat/Shell/Python等脚本自定义处理告警逻辑,实现复杂告警场景。
巡检报告生成
自动生成每日、每周、每月的巡检报告,并支持导出为Excel文件。
网络拓扑可视化
自动绘制主机间的网络拓扑图,直观展示资源分布与连接关系。
成员权限管理
每个用户可管理自身监控资源,并分配菜单访问权限,实现精细化控制。
标签分类体系
为监控资源添加自定义标签,便于分类与快速检索。
资产信息管理
记录并导出所有监控资产的详细信息,形成设备清单。
中间件监控
支持K8S集群、Kafka、Redis、RabbitMQ、ActiveMQ及Nginx日志的实时监测。
账号密码管理
存储常用设备的账号密码信息,并支持导出为Excel。
历史数据清理
自定义历史监控数据的保留周期,系统自动清理过期数据以优化性能。
登录权限控制
支持自定义登录账号/密码,并提供只读账号类型。
文件传输监控
监测FTP/SFTP服务的可用性及传输状态。
机房环境监测
采集机房设备的温度、湿度等环境参数,并实时展示。
分布式计划任务
为所有监控主机设置定时任务,执行脚本或指令,支持跨节点同步。
Web SSH远程操作
通过浏览器连接Linux主机,实现类SSH的远程命令执行。
链路连通性检测
使用PING命令检测打印机、路由器、交换机、摄像头等设备的连通性,支持自定义检测间隔。
网络设备性能监控
通过SNMP协议采集交换机等设备的流量、速率、CPU/内存/磁盘占用等指标。
大屏数据看板
提供6套预设大屏模板,实时刷新资源运行状态数据。
系统日志记录
全面记录错误日志、操作日志及告警日志,便于审计与故障排查。
界面自定义
支持修改系统名称、Logo及页面版权信息,适配企业品牌需求。
免登录集成
可配置免登录模式,跳过登录页面自动进入系统,方便与其他平台集成。
API数据开放
提供监控数据接口,便于第三方业务系统调用或集成。
Server集群部署
支持通过Nginx实现Server端负载均衡,提升系统可用性。
硬件健康监测
需安装smartmontools工具后,可监控硬盘的通电时间、通电次数及温度(部分系统不支持)。
Agent上报频率
默认每2分钟上报一次数据,若需更短间隔(如10秒),可手动调整配置。
异常进程识别
监测主机中内存或CPU占用过高的进程,支持强制终止异常进程。
全量进程采集
获取主机当前所有运行中的进程列表,便于全面分析资源使用情况。
容器全量监测
采集主机上所有Docker容器的实时状态,形成完整的容器视图。
工作笔记功能
提供笔记模块用于记录运维操作、故障处理经验或临时事项,支持文本编辑与存储。
动环监测扩展
支持机房设备的温度、湿度等环境参数采集与可视化展示,确保物理基础设施运行安全。
多维度告警策略
支持基于时间、阈值、表达式等多条件组合的告警规则,满足复杂业务场景需求。
自动化修复机制
针对特定告警事件,可预设自动修复脚本或操作指令,减少人工干预。
资源健康评分
根据监控指标动态计算主机、容器或数据库的健康度评分,辅助优先级决策。
跨平台兼容性
支持Linux、Windows、Unix、MacOS、ARM及Android等主流平台,覆盖多样化设备类型。
性能基线分析
基于历史数据建立资源性能基线,智能识别异常波动并触发预警。
六、UI展示