嘉为蓝鲸WeOps 4.0 内容说明
1、资源模型内置说明
操作系统、数据库、中间件、容器等对象进行资源模型内置,具体模型、字段、自动发现和采集能力详见列表
查看资产和模型字段的具体信息,点击可下载WeOps内置的模型说明表格,包括WeOps初始化内置的资产模型和字段,以及自动发现和采集能力。
1.1 操作系统模型内置情况
类型 | 纳管对象 | 内置模型字段 | 自动发现采集情况 |
---|---|---|---|
操作系统 | Windows Server | 内网IP、外网IP、主机名称、操作系统类型、操作系统名称、操作系统版本、操作系统位数、CPU逻辑核心数、CPU频率、CPU型号、内存容量(MB)、备注、主机类型、虚拟内存大小、系统语言、逻辑磁盘数量、子网掩码、DNS服务器、内网MAC地址、外网MAC、网关、网卡速率、时区设置、时钟同步服务器、上次补丁安装时间、上次重启时间、主机状态、最近备份时间、防火墙状态、主要维护人、录入时间、录入方式、主机安装时间、备份维护人 | 支持自动发现采集,采集字段如下: 内网IP、主机名称、操作系统类型、CPU逻辑核心数、内存容量(MB)、磁盘容量(GB)、录入时间、录入方式、内网MAC地址、外网MAC、操作系统版本、操作系统位数、CPU型号 |
操作系统 | linux | 内网IP、外网IP、主机名称、操作系统类型、操作系统名称、操作系统版本、操作系统位数、CPU逻辑核心数、CPU频率、CPU型号、内存容量(MB)、备注、主机类型、虚拟内存大小、系统语言、逻辑磁盘数量、子网掩码、DNS服务器、内网MAC地址、外网MAC、网关、网卡速率、时区设置、时钟同步服务器、上次补丁安装时间、上次重启时间、主机状态、最近备份时间、防火墙状态、主要维护人、录入时间、录入方式、主机安装时间、备份维护人 | 支持自动发现采集,采集字段如下: 内网IP、主机名称、操作系统类型、CPU逻辑核心数、内存容量(MB)、磁盘容量(GB)、录入时间、录入方式、内网MAC地址、外网MAC、操作系统版本、操作系统位数、CPU型号 |
1.2 数据库模型内置情况
类型 | 纳管对象 | 内置模型字段 | 自动发现采集情况 |
---|---|---|---|
数据库 | Oracle | 蓝鲸实例名、IP地址、端口、SID、数据库名、数据库版本、最大内存、最大连接数、是否开启归档、归档目录、数据库总数据大小、字符集、数据库角色、是否集群、部署时间、主要维护人、最后一次备份时间 | 支持自动发现采集,自动发现采集字段如下: 实例名、IP地址、端口、SID、最大内存(MB)、最大连接数、数据库名称、数据库版本、数据库角色、是否自动发现、上次更新时间 |
数据库 | MySQL | IP地址、端口、数据库版本、是否开启binlog、最大连接数、最大内存、数据库总数据大小、字符集、部署时间、主要维护人、最后一次备份时间 | 支持自动发现采集,自动发现采集字段如下: 蓝鲸实例名、IP地址、端口、数据库版本、是否开启binlog、最大连接数、最大内存、字符集、数据库角色、是否自动发现、上次更新时间 |
数据库 | MSSQL | ip地址、端口、数据库实例名、数据库版本、最大连接数、最大内存、数据库总数据大小、排序规则、高可用模式、部署时间、主要维护人、最后一次备份时间 | |
数据库 | REDIS | IP地址、端口、版本、最大连接数、持久化机制、最大内存、数据库角色、部署时间、主要维护人、最后一次备份时间 | 支持自动发现采集,自动发现采集字段如下: 蓝鲸实例名、IP地址、端口、版本、最大连接数、持久化机制、最大内存、数据库角色、是否自动发现、上次更新时间 |
数据库 | MongoDB | IP地址、端口、数据库总数据大小、版本、数据库角色、部署时间、主要维护人、最后一次备份时间 | |
数据库 | ElasticSearch | 蓝鲸实例名、IP地址、端口、版本、数据库角色 | |
数据库 | PostgreSQL | 蓝鲸实例名、IP地址、端口、版本、数据库角色 | |
数据库 | DB2 | 蓝鲸实例名、IP地址、端口、版本、数据库角色、数据库主备角色 | |
数据库 | 数据库集群 | 蓝鲸实例名、IP地址、端口、集群类型、描述 |
1.3 中间件模型内置情况
类型 | 纳管对象 | 内置模型字段 | 自动发现采集情况 |
---|---|---|---|
中间件 | Apache | 实例名、httpd路径、httpd配置文件路径、IP地址、listen端口、文档根路径、INCLUDE、版本、维护人、最近备份时间 | |
中间件 | Tomcat | 实例名、catalina路径、version路径、端口、MAXPERMSIZE、PERMSIZE、XMS、XMX、jdk版本、版本号、维护人、最近备份时间 | |
中间件 | Nginx | 实例名、IP地址、监听端口、版本、INCLUDE、bin路径、域名、log路径、ssl版本、维护人、最近备份时间 | |
中间件 | IIS | 实例标识、IP地址、软件版本、应用池数量、应用程序数量、维护人、最近备份时间 | |
中间件 | RabbitMQ | 实例名、IP地址、端口、所有端口、节点名称、版本号、erlange版本、java版本 | |
中间件 | WebLogic | 实例名、IP地址、管理实例端口、管理实例名称、wlst路径、版本号、域版本、java版本 |
1.4 K8S模型内置情况
类型 | 纳管对象 | 内置模型字段 | 自动发现采集情况 |
---|---|---|---|
K8S | K8S集群 | 实例名 | |
K8S | K8S命名空间 | 实例名、命名空间名称 | 支持自动发现采集,采集字段如下: 支持自动发现采集,自动发现采集字段如下: 实例名、命名空间名称、是否自动发现、上次更新时间 |
K8S | K8S工作负载 | 实例名、工作负载名称、工作负载类型 | 支持自动发现采集,自动发现采集字段如下: 实例名、工作负载名称、工作负载类型、是否自动发现、上次更新时间 |
K8S | Pod | 实例名、Node名称、IP地址、角色、CPU总容量(GHz)、内存总容量(GB)、存储总容量(GB)、操作系统版本、kubelet版本、内核版本、 容器运行时版本、Pod IP地址段 | 支持自动发现采集,自动发现采集字段如下: 实例名、Pod名称、IP地址、CPU Limit(GHz)、Memory Limit(GB)、CPU Request(GHz)、Memory Request(GB)、是否自动发现、上次更新时间 |
K8S | Node | 实例名、Pod名称、IP地址、CPU Limit(GHz)、Memory Limit(GB)、CPU Request(GHz)、Memory Request(GB) | 支持自动发现采集,自动发现采集字段如下: 实例名、IP地址、角色、CPU总容量(GHz)、内存总容量(GB)、存储总容量(GB)、操作系统版本、kubelet版本、内核版本、容器运行时版本、Pod IP地址段、是否自动发现、上次更新时间 |
1.5 云平台模型内置情况
类型 | 纳管对象 | 内置模型字段 | 自动发现采集情况 |
---|---|---|---|
VMware | Vcenter | 实例名、IP地址、VC版本、资产编码、是否自动发现、上次更新时间、接入点 | |
VMware | VMware虚拟机 | 实例名、IP地址、资源ID、虚拟机名称、操作系统名称、vCPU数、内存容量(MB)、资产编码、是否自动发现、上次更新时间、接入点 | 实例名、IP地址、资源ID、虚拟机名称、操作系统名称、vCPU数、内存容量(MB)、资产编码、是否自动发现、上次更新时间、接入点 |
VMware | ESXI | 实例名、IP地址、资源ID、CPU型号、CPU核数、vCPU数、内存容量(MB)、ESXi版本、资产编码、是否自动发现、上次更新时间、接入点 | 实例名、IP地址、资源ID、CPU型号、CPU核数、vCPU数、内存容量(MB)、ESXi版本、资产编码、是否自动发现、上次更新时间、接入点 |
VMware | 数据存储 | 实例名、资源ID、文件系统类型、总容量(GB)、URL、资产编码、是否自动发现、上次更新时间、接入点 | 实例名、资源ID、文件系统类型、总容量(GB)、URL、资产编码、是否自动发现、上次更新时间、接入点 |
阿里云 | 阿里云账号 | 实例名、资产编码 | |
阿里云 | ECS | 实例名、资源名称、资源ID、内网IP、公网IP、地域、可用区、VPC、状态、规格、操作系统名称、vCPU数、内存容量(MB)、资产编码、付费类型、创建时间、到期时间、是否自动发现、上次更新时间、接入点 | 实例名、资源名称、资源ID、内网IP、公网IP、地域、可用区、VPC、状态、规格、操作系统名称、vCPU数、内存容量(MB)、资产编码、付费类型、创建时间、到期时间、是否自动发现、上次更新时间、接入点 |
腾讯云 | 腾讯云账号 | 实例名、资产编码 | |
腾讯云 | CVM | 实例名、资源名称、资源ID、内网IP、公网IP、地域、可用区、VPC、状态、规格、操作系统名称、vCPU数、内存容量(MB)、资产编码 | 实例名、资源名称、资源ID、内网IP、公网IP、地域、可用区、VPC、状态、规格、操作系统名称、vCPU数、内存容量(MB)、资产编码 |
华为云 | ManageOne平台 | 实例名、全局域名、运维域名、资产编码 | |
华为云 | ManageOne云服务器 | 实例名、资源名称、资源ID、内网IP、地域、状态、操作系统名称、vCPU数、资产编码、付费类型、创建时间、到期时间、是否自动发现、上次更新时间、接入点 | 实例名、资源名称、资源ID、内网IP、地域、状态、操作系统名称、vCPU数、资产编码、付费类型、创建时间、到期时间、是否自动发现、上次更新时间、接入点 |
华为云 | 华为云账号 | 详见表格【WeOps内置的模型说明表格】 | |
华为云 | 华为云ECS | 详见表格【WeOps内置的模型说明表格】 | 支持自动发现和采集,详见表格【WeOps内置的模型说明表格】 |
深信服超融合(SangforHCI) | SangforHCI平台 | 详见表格【WeOps内置的模型说明表格】 | |
深信服超融合(SangforHCI) | SangforHCI虚拟机 | 详见表格【WeOps内置的模型说明表格】 | 支持自动发现和采集,详见表格【WeOps内置的模型说明表格】 |
1.6 基础设备模型内置情况
类型 | 纳管对象 | 内置模型字段 | 自动发现采集情况 |
---|---|---|---|
基础设备 | 交换机 | 实例名、管理IP、管理端口、型号、SNMP版本、品牌 | 支持自动发现采集,自动发现采集字段如下: 实例名、管理IP、管理端口、型号、SNMP版本、品牌 |
基础设备 | 路由器 | 实例名、管理IP、管理端口、SNMP版本、型号、品牌 | 支持自动发现采集,自动发现采集字段如下: 实例名、管理IP、管理端口、SNMP版本、型号、品牌 |
基础设备 | 防火墙设备 | 实例名、管理IP、管理端口、型号、SNMP版本、品牌 | 支持自动发现采集,自动发现采集字段如下: 实例名、管理IP、管理端口、型号、SNMP版本、品牌 |
基础设备 | 负载均衡设备 | 实例名、管理IP、管理端口、SNMP版本、型号、品牌 | 支持自动发现采集,自动发现采集字段如下: 实例名、管理IP、管理端口、型号、SNMP版本、品牌 |
基础设备 | 物理机 | 实例名、IP地址、型号、类型、硬盘大小、CPU型号、型号、品牌、sn设备序列号、网卡数量、内存大小、MAC地址、维护人、过保日期、存放地点、资产编号 |
1.7 硬件设备模型内置情况
类型 | 纳管对象 | 内置模型字段 |
---|---|---|
硬件设备 | 硬件服务器 | 实例名、内网IP、资产编码 |
1.8 其他模型内置情况
类型 | 纳管对象 | 内置模型字段 | 自动发现采集情况 |
---|---|---|---|
目录服务 | Active Directory | 蓝鲸实例名、计算机名、IP地址、所属域、所属林、所属站点、林功能级别、域功能级别、是否为全局编录、是否为只读域控、主机角色、数据库目录、数据库日志文件目录、SYSVOL目录、系统版本 | |
邮件服务 | Exchange Server | 蓝鲸实例名、计算机名、IP地址、所属域、所属林、所属站点、安装目录、Exchange版本、Exchange角色、owa虚拟目录内部URL、owa虚拟目录外部URL、ecp虚拟目录内部URL、ecp虚拟目录外部URL、ews虚拟目录内部URL、ews虚拟目录外部URL、mapi虚拟目录内部URL、mapi虚拟目录外部URL、oab虚拟目录内部URL、oab虚拟目录外部URL、activesync虚拟目录内部URL、activesync虚拟目录外部URL、autodiscover内部URI、outlookanywhere内部主机名、outlookanywhere外部主机名、outlookanywhere身份验证方式、pop3身份验证方式、imap4身份验证方式、接收连接器名称、发送连接器名称、数据库名称、所属DAG名称 |
2、监控指标说明
操作系统、数据库、中间件等对象的监控指标,具体如下表。(部分对象已经内置监控插件、内置关键指标、内置监控策略详见列表)
点击可下载WeOps内置的监控指标说明表格,包括WeOps初始化内置的资产指标、指标说明和推荐阈值等信息
2.1 操作系统监控指标
序号 | 对象类型 | 指标数量 | 指标/事件 | 内置关键指标 | 内置监控插件 | 内置监控策略 |
---|---|---|---|---|---|---|
1 | 操作系统-Windows | 97 | CPU使用率、磁盘空间使用率、应用程序内存使用占比、I/O使用率、CPU空闲率、应用程序内存可用率、CPU单核空闲率、CPU单核分配给虚拟机的时间占比、磁盘已用空间大小、系统启动时间、内核在虚拟机上运行的CPU占比、硬件中断数的CPU占比、正在运行的进程总个数、CPU单核等待IO的时间占比、CPU单核系统程序使用占比、CPU单核使用率、CPU单核用户程序使用占比、CPU等待IO的时间占比、CPU分配给虚拟机的时间占比、CPU系统程序使用占比、CPU用户程序使用占比、磁盘可用空间大小、磁盘总空间大小、系统总进程数、可用inode数量、已用inode占比、总inode数量、已用inode数量、平均I/O队列长度、设备每次I/O平均数据大小、I/O平均等待时长、I/O读速率、I/O读次数、I/O平均服务时长、I/O写速率、I/O写次数、1分钟平均负载、15分钟平均负载、5分钟平均负载、内存buffered大小、内存cached大小、物理内存空闲量、物理内存已用占比、物理内存已用量、物理内存总大小、应用程序内存可用量、应用程序内存使用量、网卡入包量、网卡出包量、网卡入流量、网卡出流量、closed连接数、closewait连接数、closing连接数、estab连接数、finwait1连接数、finwait2连接数、lastack连接数、listen连接数、synrecv连接数、synsent连接数、timewait连接数、udp接收包量、udp发送包量、SWAP空闲量、SWAP已用占比、SWAP总量、SWAP已用量、网卡入流量比特速率、网卡出流量比特速率、内核在虚拟机上运行的CPU占比、硬件中断数的CPU占比、低优先级程序在用户态执行的CPU占比、软件中断数的CPU占比、低优先级程序在用户态执行的CPU占比、软件中断数的CPU占比、登录的用户数、最大文件描述符、处于等待I/O完成的进程个数、系统上下文切换次数、系统启动后所创建过的进程数量、单核CPU的load、设备驱动程序检测到的载波丢失数、网卡冲突包、网卡丢弃包、网卡错误包、网卡物理层丢弃、swap从硬盘到内存、swap从内存到硬盘、Agent心跳丢失-GSE、磁盘只读-GSE、磁盘写满-GSE、Corefile产生-GSE、PING不可达告警-GSE、进程端口、自定义字符型、系统启动时间异常 | 5分钟平均负载、CPU使用率、物理内存空闲量、物理内存已用占比、应用程序内存使用占比、应用程序内存可用量、网卡入流量、网卡出流量、磁盘空间使用率、I/O使用率 | 使用Agent采集监控数据,无需监控插件 | CPU使用率>90%、物理内存已用占比>90%、应用程序内存使用占比>90%、磁盘空间使用率>90%、I/O使用率>70%、已用inode占比>90%、SWAP已用占比> 80% |
2 | 操作系统-Linux | 97 | CPU使用率、磁盘空间使用率、应用程序内存使用占比、I/O使用率、CPU空闲率、应用程序内存可用率、CPU单核空闲率、CPU单核分配给虚拟机的时间占比、磁盘已用空间大小、系统启动时间、内核在虚拟机上运行的CPU占比、硬件中断数的CPU占比、正在运行的进程总个数、CPU单核等待IO的时间占比、CPU单核系统程序使用占比、CPU单核使用率、CPU单核用户程序使用占比、CPU等待IO的时间占比、CPU分配给虚拟机的时间占比、CPU系统程序使用占比、CPU用户程序使用占比、磁盘可用空间大小、磁盘总空间大小、系统总进程数、可用inode数量、已用inode占比、总inode数量、已用inode数量、平均I/O队列长度、设备每次I/O平均数据大小、I/O平均等待时长、I/O读速率、I/O读次数、I/O平均服务时长、I/O写速率、I/O写次数、1分钟平均负载、15分钟平均负载、5分钟平均负载、内存buffered大小、内存cached大小、物理内存空闲量、物理内存已用占比、物理内存已用量、物理内存总大小、应用程序内存可用量、应用程序内存使用量、网卡入包量、网卡出包量、网卡入流量、网卡出流量、closed连接数、closewait连接数、closing连接数、estab连接数、finwait1连接数、finwait2连接数、lastack连接数、listen连接数、synrecv连接数、synsent连接数、timewait连接数、udp接收包量、udp发送包量、SWAP空闲量、SWAP已用占比、SWAP总量、SWAP已用量、网卡入流量比特速率、网卡出流量比特速率、内核在虚拟机上运行的CPU占比、硬件中断数的CPU占比、低优先级程序在用户态执行的CPU占比、软件中断数的CPU占比、低优先级程序在用户态执行的CPU占比、软件中断数的CPU占比、登录的用户数、最大文件描述符、处于等待I/O完成的进程个数、系统上下文切换次数、系统启动后所创建过的进程数量、单核CPU的load、设备驱动程序检测到的载波丢失数、网卡冲突包、网卡丢弃包、网卡错误包、网卡物理层丢弃、swap从硬盘到内存、swap从内存到硬盘、Agent心跳丢失-GSE、磁盘只读-GSE、磁盘写满-GSE、Corefile产生-GSE、PING不可达告警-GSE、进程端口、自定义字符型、系统启动时间异常 | 5分钟平均负载、CPU使用率、物理内存空闲量、物理内存已用占比、应用程序内存使用占比、应用程序内存可用量、网卡入流量、网卡出流量、磁盘空间使用率、I/O使用率 | 使用Agent采集监控数据,无需监控插件 | CPU使用率>90%、物理内存已用占比>90%、应用程序内存使用占比>90%、磁盘空间使用率>90%、I/O使用率>70%、已用inode占比>90%、SWAP已用占比> 80% |
2.2 数据库监控指标
序号 | 对象类型 | 指标数量 | 指标/事件 | 内置关键指标 | 内置监控插件 | 内置监控策略 |
---|---|---|---|---|---|---|
1 | 数据库-MySQL | 21 | 插件运行状态、InnoDB缓冲池的使用率、InnoDB每分钟写日志请求数、每分钟执行锁表语句的次数、MySQL打开的表数量、MySQL查询缓存命中数、MySQL查询缓存命中率、MySQL每分钟查询次数(包含不仅cmd_*的所有操作)、MySQL每分钟执行语句的次数、主从延迟延迟时间、主从同步状态、MySQL每分钟慢查询的次数、mysql数据量大小、当前已连接的线程数、已创建的线程数、线程使用率、缓存命中失败率、活动状态下的线程数、数据文件所在空间使用率、binlog日志所在空间使用率、mysqlServer运行状态 | 已内置监控插件 | 插件运行状态!=active、线程使用率>80% | |
2 | 数据库-MSSQL | 20 | 插件运行状态、数据库状态、实例状态、可用页面文件、连接错误数、数据库连接数、死锁次数、每秒全表扫描数、实例缓冲区命中率、实例缓冲区总页数、实例缓冲区使用页数、实例运行时间、当前堵塞进程数、导致死锁的每秒锁定请求数、总页面文件、用户等待IO总时间、用户等待读取总时间、用户等待写入总时间、等待内存分配进程数、SQL每秒编译次数 | 已内置监控插件 | 插件运行状态!=active、数据库状态!=online、实例状态!=online、实例缓冲区命中率<80%、 | |
3 | 数据库-Oracle | 25 | 插件运行状态、数据库状态、活跃用户会话数、后台进程总数、当前阻塞数量、缓冲区命中率、死锁数量、共享SQL缓冲区命中率、PGA使用率、进程分配数、进程总数、用户会话数、SGA使用率、SharePool使用率、表空间使用率、表空间分配大小、表空间使用大小、归档日志空间大小、归档日志已使用空间、归档日志空间使用率、ASM磁盘使用率、ASM总磁盘大小、ASM磁盘状态、scanIP监听状态、VIP监听状态 | 已内置监控插件 | 插件运行状态!=active、数据库状态!=online、缓冲区命中率<80%、共享SQL缓冲区命中率<80%、表空间使用率>95%、归档日志空间使用率>95%、ASM磁盘使用率>95% | |
4 | 数据库-MongoDB | 27 | 插件运行状态、可用连接数、当前连接数、访问swap分区中的数据大小、物理内存消耗、虚拟内存消耗、删除记录的条数、插入记录的条数、返回记录的条数、更新记录的条数、当前活动的读连接数、当前的全局读锁等待个数、当前活跃客户端的个数、当前的全局锁等待锁等待的个数、当前活动的写连接数、当前全局写锁等待个数、每秒命令次数、每秒delete次数、每秒getmore次数、每秒insert次数、每秒query次数、每秒update次数、从mongod启动以来的游标超时个数、从mongod启动以来打开游标的总个数、发送到数据库的数据量、发送到数据库的请求量、数据库发出的数据量 | 已内置监控插件 | ||
5 | 数据库-Redis | 30 | 每秒输入字节数、每秒输出字节数、拒接的连接个数、执行过的命令总数、连接过的客户端总数、输入总网络流量、输出总网络流量、连接从节点个数、主节点偏移量、复制缓冲区状态、复制缓冲区起始偏移量、标识复制缓冲区已存有效数据长度、复制缓冲区尺寸、从节点复制偏移量、最大内存配置、内存碎片率、系统内存、redis分配器分配的内存总量、数据占用的内存大小、数据占用的内存大小的百分比、lua引擎所消耗的内存大小、维护数据集的内部机制所需的内存开销、内存使用最大量、使用内存达到峰值内存的百分比、redis进程占用的物理内存总量、Redis服务器启动时消耗的内存、redis主进程在内核态所占用的CPU时钟总和、redis子进程在内核态所占用的CPU时钟总和、redis主进程在用户态所占用的CPU时钟总和、redis子进程在用户态所占用的CPU时钟总和 | redis分配器分配的内存总量、内存碎片率、拒接的连接个数 | 已内置监控插件 | 复制缓冲区状态!=正常、数据占用的内存大小的百分比>90%、使用内存达到峰值内存的百分比>90% |
2.3 中间件监控指标
序号 | 对象类型 | 指标数量 | 指标/事件 | 内置关键指标 | 内置监控插件 | 内置监控策略 |
---|---|---|---|---|---|---|
1 | 中间件-Tomcat | 19 | 插件运行状态、最大内存、总内存、空闲内存、堆已用内存百分比、接收字节总数、发送字节总数、每分钟请求错误数、请求最大时间、当前进程数、当前堵塞进程、最大进程数、非堆最大内存、非堆已使用内存、非堆已用内存百分比、请求处理时间、每分钟请求数量、堆最大内存、堆已使用内存 | 最大进程数、当前进程数、当前堵塞进程、每分钟请求数量、每分钟请求错误数、请求最大时间、发送字节总数、接收字节总数 | 已内置监控插件 | |
2 | 中间件-Nginx | 8 | 插件运行状态、每分钟成功握手次数、正在处理的活跃的连接数、每分钟成功处理请求数、驻留(等待)连接数、读连接数、每分钟处理未丢失的请求数、写连接数、JDBC失败重连数 | 每分钟成功握手次数、每分钟成功处理请求数、驻留(等待)连接数、读连接数、每分钟处理未丢失的请求数、写连接数、JDBC失败重连数 | 已内置监控插件 | 状态!=active |
3 | 中间件-Apache | 8 | 插件运行状态、访问总数、CPU负载、总数据发送量、运行时间、不同状态的连接数量统计、不同状态Workers数量统计、不同状态记分版数量统计、JDBC失败重连数 | 访问总数、总数据发送量、运行时间、不同状态Workers数量统计、不同状态记分版数量统计、JDBC失败重连数 | 已内置监控插件 | 插件运行状态!=active、CPU负载>80% |
2.4 K8S监控指标
序号 | 对象类型 | 指标数量 | 指标 | 内置关键指标 | 内置监控插件 | 内置监控策略 |
---|---|---|---|---|---|---|
1 | K8S-Pod | 17 | CPU使用率、容器CPU使用率、内存使用量、容器内存使用量、memory limit %、container memory limit %、I、O读写次数、容器I、O读写次数、网络入流量、容器网络入流量、网络出流量、容器网络出流量、进程数、容器进程数、10秒平均负载、容器10秒平均负载、运行时长 | CPU使用率、容器CPU使用率、内存使用量、容器内存使用量 | 已内置监控指标 | CPU使用率>80%、容器CPU使用率>80%、memory limit %>80%、container memory limit %>80% |
2 | K8S-Node | 14 | CPU使用率、应用内存使用量、应用内存使用率、物理内存使用量、物理内存使用率、I/O读写次数、网络入流量(每分钟速率)、网络出流量(每分钟速率)、1分钟平均负载、5分钟平均负载、15分钟平均负载、文件系统使用量、文件系统可用量、文件系统使用率 | CPU使用率、应用内存使用量、1分钟平均负载、文件系统使用率 | 已内置监控指标 | CPU使用率>80%、应用内存使用率>80%、物理内存使用率>80%、文件系统使用率>80% |
2.5 云平台监控指标
序号 | 云平台 | 类型 | 指标数量 | 指标 | 内置关键指标 | 内置监控插件 | 内置监控策略 |
---|---|---|---|---|---|---|---|
1 | VMware | 数据存储 | 3 | 磁盘使用率、磁盘剩余量、存储连接状态 | |||
2 | VMware | ESXI | 10 | CPU使用率、CPU使用量、内存使用率、活动内存、磁盘读速率、磁盘写速率、网络接收速率、网络发送速率、磁盘读IO、磁盘写IO | |||
3 | VMware | 虚拟机 | 12 | CPU使用率、CPU使用量、内存使用率、活动内存、硬盘使用率、硬盘读速率、硬盘写速率、网络接收速率、网络发送速率、磁盘读IO、磁盘写IO、虚拟机的电源状态 | |||
4 | 阿里云 | ECS | 8 | CPU使用率、内存利用率、磁盘每秒读取次数、磁盘每秒写入次数、内网流入流量、内网流入带宽、内网流出流量、内网流出带宽 | |||
5 | 腾讯云 | CVM | 11 | CPU利用率、内存使用量、内存利用率、磁盘利用率、内网出带宽、内网入带宽、内网出包量、内网入包量、外网出带宽、外网入带宽、外网出包量、外网入包量 | |||
6 | 华为云-manageone | 云服务器 | 9 | CPU使用率、内存使用率、云硬盘使用率、云硬盘IO写入、云硬盘IO读出、磁盘写操作速率、磁盘读操作速率、网络流入速率、网络流出速率 | |||
7 | 华为公有云 | 华为云ECS | / | 详见【WeOps内置的监控指标说明表格】 | |||
8 | SangforHCI | SangforHCI虚拟机 | / | 详见【WeOps内置的监控指标说明表格】 |
WeOps内置的监控指标说明表格
2.6 网络设备监控指标
(以下展示的是内置的网络设备指标模板,WeOps提供拓展能力,可支持不同品牌和型号的设备。)
序号 | 对象类型 | 厂商 | 指标数量 | 指标 | 内置关键指标 | 内置监控策略 |
---|---|---|---|---|---|---|
1 | 防火墙 | Cisco | 40 | 设备运行时间、可用性、BGP状态、接收流量、单播入包数、接收丢包数、接收错包数、发送流量、单播出包数、发送丢包数、发送错包数、接口管理状态、接口操作状态、接口带宽、多播入包数、广播入包数、多播出包数、广播出包数、CPU使用率、模块操作状态、传感器温度、温度传感器状态、风扇状态、电源状态、已用内存、剩余内存、5分钟平均接收丢包数、5分钟平均接收错包数、5分钟流量接收速率、5分钟平均发送丢包数、5分钟平均单播出包数、5分钟平均单播入包数、5分钟流量发送速率、5分钟平均发送错包数、5分钟平均多播入包数、5分钟平均广播入包数、5分钟平均多播出包数、5分钟平均广播出包数、5分钟平均多播出包数、5分钟平均广播出包数 | 设备运行时间、接口管理状态、接口操作状态、接口带宽、CPU使用率、已用内存、剩余内存、5分钟平均接收丢包数、5分钟平均接收错包数、5分钟流量接收速率、5分钟流量发送速率、5分钟平均发送错包数 | |
2 | 防火墙 | H3C | 40 | 设备运行时间、ospf状态、bgp状态、接收流量、单播入包数、接收丢包数、接收错包数、发送流量、单播出包数、发送丢包数、发送错包数、接口管理状态、接口操作状态、接口带宽、多播入包数、广播入包数、多播出包数、广播出包数、内存大小、H3C设备运行时间、CPU使用率、内存使用率、温度传感器温度值、插槽内存大小、管理状态、操作状态、风扇状态、电源状态、5分钟流量发送速率、5分钟流量接收速率、5分钟平均单播入包数、5分钟平均接收丢包数、5分钟平均接收错包数、5分钟平均单播出包数、5分钟平均发送丢包数、5分钟平均发送错包数、5分钟平均多播入包数、5分钟平均广播入包数、5分钟平均多播出包数、5分钟平均广播出包数 | 设备运行时间、接口管理状态、接口操作状态、接口带宽、H3C设备运行时间、CPU使用率、内存使用率、5分钟流量发送速率、5分钟流量接收速率、5分钟平均接收丢包数、5分钟平均接收错包数、5分钟平均发送丢包数、5分钟平均发送错包数 | |
3 | 防火墙 | 华为 | 33 | 设备运行时间、可用性、BGP状态、接收流量、单播入包数、接收丢包数、接收错包数、发送流量、单播出包数、发送丢包数、发送错包数、接口管理状态、接口操作状态、接口带宽、多播入包数、广播入包数、多播出包数、广播出包数、CPU使用率、内存使用率、内存大小、5分钟流量接收速率、5分钟平均单播入包数、5分钟平均接收丢包数、5分钟平均接收错包数、5分钟流量发送速率、5分钟平均单播出包数、5分钟平均发送丢包数、5分钟平均发送错包数、5分钟平均多播入包数、5分钟平均广播入包数、5分钟平均多播出包数、5分钟平均广播出包数 | 设备运行时间、可用性、接口管理状态、接口操作状态、接口带宽、CPU使用率、内存使用率、5分钟流量接收速率、5分钟平均接收丢包数、5分钟平均接收错包数、5分钟流量发送速率、5分钟平均发送丢包数、5分钟平均发送错包数 | |
4 | 防火墙 | NETGEAR | ||||
5 | 防火墙 | WatchGuard | ||||
6 | 防火墙 | 东软Neteye | ||||
7 | 负载均衡设备 | Riverbed | ||||
8 | 负载均衡设备 | Superiority | ||||
9 | 交换机 | Cisco | 40 | 设备运行时间、可用性、BGP状态、接收流量、单播入包数、接收丢包数、接收错包数、发送流量、单播出包数、发送丢包数、发送错包数、接口管理状态、接口操作状态、接口带宽、多播入包数、广播入包数、多播出包数、广播出包数、CPU使用率、模块操作状态、传感器温度、温度传感器状态、风扇状态、电源状态、已用内存、剩余内存、5分钟平均接收丢包数、5分钟平均接收错包数、5分钟流量接收速率、5分钟平均发送丢包数、5分钟平均单播出包数、5分钟平均单播入包数、5分钟流量发送速率、5分钟平均发送错包数、5分钟平均多播入包数、5分钟平均广播入包数、5分钟平均多播出包数、5分钟平均广播出包数、5分钟平均多播出包数、5分钟平均广播出包数 | 设备运行时间、接口管理状态、接口操作状态、接口带宽、CPU使用率、已用内存、剩余内存、5分钟平均接收丢包数、5分钟平均接收错包数、5分钟流量接收速率、5分钟流量发送速率、5分钟平均发送错包数 | |
10 | 交换机 | H3C | 40 | 设备运行时间、ospf状态、bgp状态、接收流量、单播入包数、接收丢包数、接收错包数、发送流量、单播出包数、发送丢包数、发送错包数、接口管理状态、接口操作状态、接口带宽、多播入包数、广播入包数、多播出包数、广播出包数、内存大小、H3C设备运行时间、CPU使用率、内存使用率、温度传感器温度值、插槽内存大小、管理状态、操作状态、风扇状态、电源状态、5分钟流量发送速率、5分钟流量接收速率、5分钟平均单播入包数、5分钟平均接收丢包数、5分钟平均接收错包数、5分钟平均单播出包数、5分钟平均发送丢包数、5分钟平均发送错包数、5分钟平均多播入包数、5分钟平均广播入包数、5分钟平均多播出包数、5分钟平均广播出包数 | 设备运行时间、接口管理状态、接口操作状态、接口带宽、H3C设备运行时间、CPU使用率、内存使用率、5分钟流量发送速率、5分钟流量接收速率、5分钟平均接收丢包数、5分钟平均接收错包数、5分钟平均发送丢包数、5分钟平均发送错包数 | |
11 | 交换机 | 华为 | 33 | 设备运行时间、可用性、BGP状态、接收流量、单播入包数、接收丢包数、接收错包数、发送流量、单播出包数、发送丢包数、发送错包数、接口管理状态、接口操作状态、接口带宽、多播入包数、广播入包数、多播出包数、广播出包数、CPU使用率、内存使用率、内存大小、5分钟流量接收速率、5分钟平均单播入包数、5分钟平均接收丢包数、5分钟平均接收错包数、5分钟流量发送速率、5分钟平均单播出包数、5分钟平均发送丢包数、5分钟平均发送错包数、5分钟平均多播入包数、5分钟平均广播入包数、5分钟平均多播出包数、5分钟平均广播出包数 | 设备运行时间、可用性、接口管理状态、接口操作状态、接口带宽、CPU使用率、内存使用率、5分钟流量接收速率、5分钟平均接收丢包数、5分钟平均接收错包数、5分钟流量发送速率、5分钟平均发送丢包数、5分钟平均发送错包数 | |
12 | 交换机 | MOXA | ||||
13 | 交换机 | NETGEAR | ||||
14 | 交换机 | 派凌 | ||||
15 | 交换机 | 神州数码 | ||||
16 | 路由器 | Cisco | 26 | 设备运行时间、可用性、BGP状态、接收流量、单播入包数、接收丢包数、接收错包数、发送流量、单播出包数、发送丢包数、发送错包数、接口管理状态、接口操作状态、接口带宽、多播入包数、广播入包数、多播出包数、广播出包数、CPU使用率、模块操作状态、传感器温度、温度传感器状态、风扇状态、电源状态、已用内存、剩余内存 | 设备运行时间、接口管理状态、接口操作状态、接口带宽、CPU使用率、已用内存、剩余内存 | |
17 | 路由器 | H3C | 28 | 设备运行时间、ospf状态、bgp状态、接收流量、单播入包数、接收丢包数、接收错包数、发送流量、单播出包数、发送丢包数、发送错包数、接口管理状态、接口操作状态、接口带宽、多播入包数、广播入包数、多播出包数、广播出包数、内存大小、H3C设备运行时间、CPU使用率、内存使用率、温度传感器温度值、插槽内存大小、管理状态、操作状态、风扇状态、电源状态 | 设备运行时间、接口管理状态、接口操作状态、接口带宽、H3C设备运行时间、CPU使用率、内存使用率 | |
18 | 路由器 | 华为 | 21 | 设备运行时间、可用性、BGP状态、接收流量、单播入包数、接收丢包数、接收错包数、发送流量、单播出包数、发送丢包数、发送错包数、接口管理状态、接口操作状态、接口带宽、多播入包数、广播入包数、多播出包数、广播出包数、CPU使用率、内存使用率、内存大小数 | 设备运行时间、可用性、接口管理状态、接口操作状态、接口带宽、CPU使用率、内存使用率 |
2.7 硬件设备监控指标
序号 | 对象类型 | 指标数量 | 指标/事件 | 内置关键指标 | 内置监控插件 | 内置监控策略 |
---|---|---|---|---|---|---|
1 | 硬件服务器 | 5 | 电源状态、风扇转速(转数/每分钟)、功率(瓦特)、温度(摄氏度)、电压(伏特) | -------- | -------- | -------- |
2.8 其他监控指标
序号 | 对象类型 | 指标数量 | 指标/事件 | 内置关键指标 | 内置监控插件 | 内置监控策略 |
---|---|---|---|---|---|---|
1 | 进程 | 15 | 进程启动时间、进程占用系统态时间、进程CPU使用率、整体占用时间、进程占用用户态时间、打开的文件描述符数量、进程io累计读、进程io读速率、进程io累计写、进程io写速率、物理内存、物理内存使用率、共享内存、虚拟内存、端口存活 | |||
2 | 拨测 | 12 | HTTP响应时间、HTTP单点可用率、ICMP单点可用率、TCP单点可用率、TCP响应时间、HTTP期望响应码、HTTP期望响应内容、ICMP平均时延、ICMP丢包率、ICMP最大时延、ICMP最小时延、ICMP响应时间 | |||
3 | Active Directory活动目录 | 47 | DS当前使用的线程数、链路值被清洗的速率、名称转换速率、清除phantom的速度、访问phantom的速度、查询速度、已排队但尚未处理的安全描述符传播事件的数量、安全描述传播子操作的速率、当前DS安全描述符传播器事件时需要检查的对象数量、过期的tombstone对象被垃圾回收的速率、已删除对象的访问速率、处理请求的平均时间、当前ATQ分配给服务的请求线程数量、ad处理下一个请求的延迟时间、当前排队等待服务的请求数量、SAM尝试创建机器的速率、SAM成功创建机器的速率、SAM枚举速率、执行身份认证平均延迟、SAM非传递成员评估速率、不同组身份认证速率、SAM传递成员评估速率、SAM评估全局目录速率、SAM用户变化速率、SAM密码变化速率、SAM查询显示速率、SAM尝试创建用户的速率、SAM成功创建用户的速率、本地目录服务的LDAP子系统当前使用的线程数、最后一秒内关闭的LDAP连接数、最后一次成功的LDAP绑定所花费的时间、最后一秒内打开的的连接数、LDAP客户端执行搜索操作的速率、LDAP服务器处理的UDP操作速率、LDAP客户端执行写操作的速率、副本数据的压缩速度、未在DSA压缩的字节速率、DSA上最高的USN、未完成同步对象数量、本地AD从入站副本接收的不需要应用更新的对象速度、本地AD从副本接收的复制更新的速率、副本传入被过滤掉(无需更新)的属性的速率、副本传入属性而更新的属性的速度、在完全同步完成之前剩余的对象数量、DRA等待的复制操作数、服务器队列上尚未处理的目录同步请求数、向邻居发出的同步请求的数量 | 已内置监控插件 | ||
4 | Exchange邮件系统 | 38 | 插件运行状态、2分钟内活动的用户数量、过去1024个包的平均延迟、RPC当前维护的客户端连接数、RPC操作发生的速率、RPC正在处理的客户端请求的数量、RPC用户数量、每秒运行的LDAP操作、发送LDAP读请求并接收响应的时间、发送LDAP搜索请求并接收响应的时间、LDAP超时错误数、发送LDAP写请求并接收响应的时间、活动邮箱投递队列长度、外部的活动远程传递队列长度、外部最大的发送队列长度、内部的活动远程传递队列长度、内部最大的发送队列长度、poison队列长度、重试投递队列长度、unreachable队列长度、验证CAS请求所花费的平均时间、CAS处理时间的平均延迟、CAS和MBX服务器之间发生了故障速率、MailboxServerLocator_web服务调用的平均延迟、未处理的proxy请求数、每秒处理的proxy请求数、当前后台运行用于工作负载管理的活动任务的数量、已完成的工作负载管理任务的数量、工作负载是处于活动(1)状态还是暂停(0)状态、当前排队等待处理的工作负载管理任务的数量、由工作负载产生的任务数、当前队列中挂起的ping命令数 | 已内置监控插件 |
3、凭据说明
WeOps的自动发现、监控采集、自动化运维等模块需要使用到对应对象的凭据,凭据账号的说明如下
序号 | 对象 | 自动发现/监控采集需要的账号权限(建议使用同一账号,并授予以下权限) |
---|---|---|
1 | MySQL | 创建访问权限的账号,并授权 1、连接数据库 2、授权PROCESS,REPLICATION CLIENT,REPLICATION SLAVE 3、授权选择performance_schema和infomation_schema |
2 | MSSQL | 1、连接数据库 2、授权查看ANY DATABASE、SERVER STATE、ANY DEFINITION TO/ 3、授权选择sys.dm_hadr_availability_group_states、sys.dm_os_sys_memory、sys.dm_os_performance_counters、sysperfinfo |
3 | Oracle | 只读权限数据库账号并授权 1、连接数据库 2、授权选择:v$database、v$version、v$controlfile、v$log 、v$logfile、dba_data_files、v$parameter、v$datafile、v$tablespace、v$instance、v$asmdiskgroup、sm$ts_avail、sm$ts_used、sm$ts_free、gv$database、gv$datafile、gv$controlfile、gv$tablespace、gv$version、gv$instance、gv$parameter、gv$parameter、V$LIBRARYCACHE、v$sga、v$sgastat、v$pgastat、v$session、dbafree_space、DBA_TABLESPACES、v$sysstat、v$diag_alert_ext、v$process、v$recovery_file_dest、v$archive_dest |
4、告警源插件说明
序号 | 告警源插件 | 版本 |
---|---|---|
1 | REST API | 无需版本适配 |
2 | VCenter | 5.5及以上 |
3 | 华为云 | |
4 | 阿里云 | |
5 | 腾讯云 | |
6 | 听云 | |
6 | Zabbix | 3.X、4.X、5.X |
7 | Prometheus | 2.15 |
8 | 日志易 | 3.6 |
9 | H3C-IMC | |
10 | 华为esight系统 | |
11 | 绿盟日志审计系统 | V2.0 |
5、内置仪表盘说明
序号 | 仪表盘名称 | 关键指标 |
---|---|---|
1 | 单主机运行状态 | CPU使用率、应用内存可用率、磁盘空间使用率、1分钟系统负载、系统进程数、磁盘IO使用率、当前连接数、网卡出流量、网卡入流量、可用inode数量 |
2 | 应用主机运行状态 | CPU使用率、内存剩余空间、磁盘空间使用率、5分钟系统负载、磁盘IO使用率、当前连接数、网卡出流量、网卡入流量 |
3 | Oracle监控 | 数据库状态、服务器CPU使用率、服务器内存使用率、进程使用率、活跃用户会话数、阻塞超过3分钟个数、软解析率、PGA使用率、SGA使用率、SharePool使用率、缓冲区命中率、表空间使用率、Top5等待事件及数量、ASM磁盘状态、ASM磁盘使用率、ScanIP监听状态、redolog1小时内切换次数、VIP监听状态、归档日志空间使用率 |
4 | MySQL监控 | 服务器CPU使用率、服务器内存使用率、数据文件所在空间使用率、binlog日志所在空间使用率、当前已连接的线程数、查询缓存命中率、每分钟执行语句的次数、每分钟查询次数、每分钟慢查询的次数、InnoDB缓冲池的使用率、InnoDB每分钟写日志请求数、主从同步状态、主从延迟时间、线程使用率 |
5 | MSSQL监控 | 用户连接数、作业执行状态、数据库缓存页面数、每秒连接错误数、服务器CPU使用率、服务器内存使用率、数据库连接数、平均磁盘队列长度、缓冲区命中率、阻塞进程数、等待内存授予的进程数、数据库文件使用率、数据库日志文件使用率、每秒刷新的脏页数、每秒全表扫描数、每秒惰性写入、排队等待物理磁盘的物理读写请求的平均数、每秒锁等待数、每秒锁超时数、每秒等待内存页I/O锁的时间 |
6 | Redis监控仪表盘 | redis可用性、内存碎片率、Redis分配器分配的内存总量、客户端连接数、拒绝的连接数、退出的秘钥数量、过期的密钥总数、keyspace命中成功率、每秒处理命令数、每秒输入字节数、每秒输出字节数、服务器CPU使用率、服务器内存使用率、数据占用的内存大小的百分比 |
7 | Apache监控仪表盘 | Apache状态、运行时间、忙碌的worker数、空闲的worker数、服务器CPU使用率、服务器内存使用率、进程IO写速率、进程IO读速率、不同状态计分版数量统计、每个请求的字节数、每秒传输的字节数、每分钟平均请求数 |
8 | Tomcat监控仪盘 | 活动连接数、会话数、全局请求数、线程数、堵塞线程数、接收的流量、发送的流量、过期会话数、错误请求数、线程池状态、服务器CPU使用率、服务器内存使用率 |
9 | Nginx监控仪盘 | Nginx监控状态、正在处理的活跃的连接数、驻留(等待)等待连接数、每分钟成功握手次数、服务器CPU使用率、服务器内存使用率、读连接数、写连接数、每分钟成功处理请求数、每分钟处理未丢失的请求数 |
6、健康扫描包说明
共内置11个扫描包,各个扫描包的介绍和相关指标见下表
序号 | 扫描包名称 | 对象 | 操作系统 | 检查项数量 | 检查项 |
---|---|---|---|---|---|
1 | 基础健康检查-Windows | 主机 | Windows | 10 | Windows是否激活、内存可用大小、磁盘空间使用率(Windows)、磁盘可用空间(Windows)、磁盘IO读速率、磁盘IO写速率、DCP时间百分比、处理器队列长度、逻辑磁盘队列长度、每秒页面错误数 |
2 | 基础健康检查-Linux | 主机 | Linux | 8 | 磁盘空间使用率(Linux)、磁盘可用空间(Linux)、交换空间使用率、iNode可用大小、iNode使用率、僵尸进程数、TIME_WAIT状态的连接数、passwd文件权限 |
3 | 基础健康检查-ActiveDirectory | ActiveDirectory | 4 | AD数据库文件盘可用空间、AD数据库日志文件盘可用空间、AD健康性检查、时间偏差检查 | |
4 | 基础健康检查-ExchangeServer | ExchangeServer(支持系统为Exchange Server 2016/2019的邮箱角色) | 22 | 关键服务测试、活动目录连接测试、ActiveSync连接测试、Ecp连接测试、Imap连接测试、Owa连接测试、Pop连接测试、Outlook连接测试、Smtp连接测试、复制健康性测试、数据包出站错误、数据库平均读延迟、数据库平均写延迟、数据库日志平均读延迟、数据库日志平均写延迟、应用重启次数、工作进程重启次数、应用队列中的请求数、RPC请求数(信息存储进程)、RPC平均延迟(客户端协议)、RPC平均延迟(数据库)、证书过期时间 | |
5 | 基础健康检查- MSSQL(Windows) | MSSQL | Windows | 26 | 缓冲区命中率、磁盘空间使用率、可用连接数、MSSQL内存可用大小、阻塞源会话(近一个小时)、死锁情况(近一个小时)、长事务(TOP5)、页生存周期、实例内存使用情况、数据库使用内存、可用线程数、资源等待Top5、磁盘队列数、群集资源状态、群集网络状态、群集仲裁状态、AlwaysOn同步健康状态、AlwaysOn发送队列大小、AlwaysOn重做队列大小、AlwaysOn重做延迟时长、文件组可用大小、错误日志磁盘可用大小、作业执行失败Top20、最近备份时间、SQL代理服务启动方式、最近完整备份时间 |
6 | 基础健康检查- MySQL(Windows) | MySQL | Windows | 17 | InnoDB缓冲区命中率、每秒查询数、每秒事务数、每秒全表扫描数量、慢查询数量、数据空间使用率、Binlog日志空间使用率、不能立即获得表锁次数、InnoDB行锁次数、可用连接数、数据文件总大小、InnoDB缓存池可用大小、锁等待数量、操作系统CPU使用率、操作系统内存使用率、操作系统内存可用大小、操作系统交换空间使用率 |
7 | 基础健康检查- MySQL(Linux) | MySQL | Linux | 17 | InnoDB缓冲区命中率、每秒查询数、每秒事务数、每秒全表扫描数量、慢查询数量、数据空间使用率、Binlog日志空间使用率、不能立即获得表锁次数、InnoDB行锁次数、可用连接数、数据文件总大小、InnoDB缓存池可用大小、锁等待数量、操作系统CPU使用率、操作系统内存使用率、操作系统内存可用大小、操作系统交换空间使用率 |
8 | 基础健康检查- Oracle(Windows) | Oracle | Windows | 20 | 缓冲区命中率、共享池命中率、表空间空间使用率、归档空间使用率、数据空间使用率、ASM磁盘组空间使用率、可用会话数、可用进程数、SQL硬解析百分比、内存排序百分比、无效索引个数、行锁等待大于1分钟数量、联机日志每小时切换次数、DG状态、最近备份成功状态、实例状态、监听状态、Oracle目录使用率、操作系统内存使用率、操作系统内存可用大小 |
9 | 基础健康检查- Oracle(Linux) | Oracle | Linux | 14 | 缓冲区命中率、共享池命中率、表空间空间使用率、可用会话数、可用进程数、SQL硬解析百分比、内存排序百分比、无效索引个数、行锁等待大于1分钟数量、联机日志每小时切换次数、最近备份成功状态、实例状态、监听状态、Oracle目录使用率 |
10 | 基础健康检查- vCenter(Windows) | vCenter | Windows | 7 | 物理机最新启动时间、物理机cpu使用率、物理机内存使用率、物理机上虚拟机数量、存储空间使用率、物理机NTP服务器、物理机NTP服务状态 |
11 | 基础健康检查- vCenter(Linux) | vCenter | Linux | 7 | 物理机最新启动时间、物理机cpu使用率、物理机内存使用率、物理机上虚拟机数量、存储空间使用率、物理机NTP服务器、物理机NTP服务状态 |
7、运维工具说明
内置的脚本工具的介绍见下表
序号 | 工具类型 | 工具名 | 脚本类型 | 工具介绍 |
---|---|---|---|---|
1 | 操作系统类 | 查询消耗系统内存最多的进程 | shell(Linux) | 查找出Linux系统当前占用内存资源最多的TopN进程 |
2 | 操作系统类 | 查询消耗系统CPU最多的进程 | shell(Linux) | 查找出Linux系统当前占用CPU资源最多的TopN进程 |
3 | 操作系统类 | MSSQL全库备份 | powershell(Windows) | 将MSSQL全库备份到所选服务器的指定目录,支持SQL Server 2008 R2及以上版本 |
4 | 操作系统类 | 修改Windows本地账号密码 | powershell(Windows) | 修改Windows本地账号密码,支持Powershell 5.2及以上版本 |
5 | 操作系统类 | 修改Linux账号密码 | shell(Linux) | 修改Linux账号密码 |
6 | 操作系统类 | 查询系统本地帐户信息 | powershell(Windows) | 查找出Windows系统所有本地帐户的信息 |
7 | 操作系统类 | 查询AD用户上次登陆时间 | powershell(Windows) | 查找出指定的AD用户上次登陆时间,需在域服务器执行该脚本 |
8 | 操作系统类 | 查询服务进程状态信息 | shell(Linux) | 查找出Linux系统指定进程的状态信息 |
9 | 操作系统类 | 查询占用空间最大的目录和文件 | shell(Linux) | 查找出Linux系统指定目录下占用空间最大的top N目录和文件 |
10 | 操作系统类 | Ping | shell(Linux) | 测试所选主机与目标主机的数据连通性是否正常 |
11 | 操作系统类 | 查看Linux日志文件 | shell(Linux) | 查看Linux日志文件,协助问题排查 |
12 | 操作系统类 | AD密码质量审计 | powershell(Windows) | 执行AD审计,检查AD账号使用弱密码、重复密码、默认密码和空密码等情况 |
13 | 操作系统类 | 查找容量最大的文件 | shell(Linux) | 查找容量最大的文件 |
14 | 操作系统类 | 统计目录的文件数量 | shell(Linux) | 统计目录的文件数量 |
15 | 操作系统类 | 查询僵尸进程数 | shell(Linux) | 查询僵尸进程数 |
16 | 操作系统类 | 查询文件打开数最多的进程 | shell(Linux) | 查询文件打开数最多的进程 |
17 | 操作系统类 | MySQL显示错误日志内容 | shell(Linux) | MySQL显示错误日志内容 |
18 | 操作系统类 | Oracle显示错误日志内容 | shell(Linux) | Oracle显示错误日志内容 |
19 | 操作系统类 | MySQL显示参数值 | shell(Linux) | MySQL显示参数值 |
20 | 操作系统类 | 查询网络连接数最多的服务 | python(Linux) | 查询网络连接数最多的服务 |
21 | 操作系统类 | 查找UID或GID为0的系统用户 | shell(Linux) | 查找UID或GID为0的系统用户 |
22 | 操作系统类 | 查询已删除用户的进程 | shell(Linux) | 查询已删除用户的进程 |
23 | 操作系统类 | Oracle显示参数值 | shell(Linux) | Oracle显示参数值 |
24 | 操作系统类 | 查询权限为777的文件 | shell(Linux) | 查询权限为777的文件 |
25 | 操作系统类 | 统计TIME_WAIT连接数量 | python(Linux) | 统计TIME_WAIT连接数量 |
26 | 操作系统类 | 查询无属主或无属组的文件 | shell(Linux) | 查询无属主或无属组的文件 |
27 | 操作系统类 | 查询进程的文件打开数 | shell(Linux) | 查询进程的文件打开数 |
28 | 操作系统类 | 收集sosreport | shell(Linux) | 收集sosreport或 supportconfig |
29 | 操作系统类 | 检查拥有sudo权限账号或组 | shell(Linux) | 检查拥有sudo权限账号或组 |
30 | 操作系统类 | MySQL查询实例连接数和活动连接数 | shell(Linux) | MySQL查询实例连接数和活动连接数 |
31 | 操作系统类 | Oracle查询实例连接数和活动连接数 | shell(Linux) | Oracle查询实例连接数和活动连接数 |
32 | 操作系统类 | Oracle查看正在运行的SQL语句 | shell(Linux) | Oracle查看正在运行的SQL语句 |
33 | 操作系统类 | Oracle查看最近15分钟的等待事件 | shell(Linux) | Oracle查看最近15分钟的等待事件 |
34 | 操作系统类 | Oracle查询会话增长趋势 | shell(Linux) | Oracle查询会话增长趋势 |
35 | 操作系统类 | Oracle查看当前的等待事件 | shell(Linux) | Oracle查看当前的等待事件 |
36 | 操作系统类 | Oracle查看表空间的大小和可用空间 | shell(Linux) | Oracle查看表空间的大小和可用空间 |
37 | 操作系统类 | Oracle查看数据库锁信息 | shell(Linux) | Oracle查看数据库锁信息 |
38 | 操作系统类 | 查看系统防火墙启用情况 | powershell(Windows) | 查看系统防火墙启用情况 |
39 | 操作系统类 | 查看占用内存 Top10进程信息 | powershell(Windows) | 查看占用内存 Top10进程信息 |
40 | 操作系统类 | Oracle查看ASM磁盘组大小和可用空间 | shell(Linux) | Oracle查看ASM磁盘组大小和可用空间 |
41 | 操作系统类 | Oracle查询数据库中具有DBA权限的用户 | shell(Linux) | Oracle查询数据库中具有DBA权限的用户 |
42 | 操作系统类 | MySQL查看表空间的大小和可用空间 | shell(Linux) | MySQL查看表空间的大小和可用空间 |
42 | 操作系统类 | MySQL查询当前运行的SQL语句 | shell(Linux) | MySQL查询当前运行的SQL语句 |
43 | 操作系统类 | 查看所有物理网卡的网线连接状态 | shell(Linux) | 查看所有物理网卡的网线连接状态 |
44 | 操作系统类 | Linux补丁升级 | shell(Linux) | 适用于已部署Yum源的Linux服务器 |
序号 | 工具类型 | 工具名 | 脚本类型 | 工具介绍 |
---|---|---|---|---|
1 | 网络设备类 | 显示CDP查找进程的结果(思科) | telnet | 可以看见本地接口ID,与此接口直连的设备ID,设备类型,若对端接口是路由接口,可以看见对端接口ID |
2 | 网络设备类 | 显示打开的CDP接口信息(思科) | telnet | 可以看见接口状态,连接状态,封装类型,发送cdp报文周期 |
3 | 网络设备类 | 显示CDP表中所列相邻设备的信息(思科) | telnet | 展示运行cdp协议的邻居设备的详细信息:设备ID,厂家,设备能力,ip地址,IOS类型和版本,设备功能 |
4 | 网络设备类 | 展示总包吞吐量(思科) | telnet | |
5 | 网络设备类 | 展示接口统计信息(思科) | telnet | 显示设置在路由器和访问服务器上所有接口的统计信息 |
6 | 网络设备类 | 显示连接所有用户(思科) | telnet | |
7 | 网络设备类 | 显示产品库存清单(思科) | telnet | 显示安装的所有思科产品的产品库存清单和UDI |
8 | 网络设备类 | 显示接口的状态和全局参数(思科) | telnet | |
9 | 网络设备类 | 显示路由选择表的当前状态(思科) | telnet | |
10 | 网络设备类 | 显示IP路由表信息(思科) | telnet | |
11 | 网络设备类 | 显示路由器的进程(思科) | telnet | |
12 | 网络设备类 | 显示设置的协议(思科) | telnet | 显示全局和接口的第三层协议的特定状态。 |
13 | 网络设备类 | 显示内存大小(思科) | telnet | |
14 | 网络设备类 | 展示进程内存使用量(思科) | telnet | 显示每个系统进程或指定进程使用的内存量 |
15 | 网络设备类 | 展示进程CPU使用率(思科) | telnet | 显示所有进程及其CPU利用率 |
16 | 网络设备类 | 显示系统版本信息(思科) | telnet |
【备注】网络设备自动化运维支持的范围如下 | 类别|型号| | -----| ----| | 网络设备自动化支持的型号|A10, Accedian, AdtranOS,AlcatelAos,NokiaSros, ApresiaAeos, Arista, Aruba, HPProcurve, HPProcurve, ExtremeErs, ExtremeVsp, BroadcomIcos, RuckusFastiron, ExtremeNetiron, ExtremeNos,ExtremeNos, VyOS, CheckPointGaia, CalixB6,CentecOS,CienaSaos,CiscoAsa,CiscoFtd,CiscoIos,CiscoNxos,CiscoS300,CiscoTpTcCe,CiscoWlc,CiscoIos,CiscoXr,CloudGenixIon,Coriant,DellForce10,DellForce10,DellDNOS6,DellForce10,DellOS10,DellPowerConnect,DellIsilon,DlinkDS,Endace,Eltex,EltexEsr,Enterasys,ExtremeExos,ExtremeErs,ExtremeExos, ExtremeNetiron,ExtremeNos,ExtremeSlx,ExtremeNos,ExtremeVsp,ExtremeWing,F5Tmsh,F5Tmsh,F5Linux,Flexvnf,Fortinet,Generic,TerminalServer,HPComware,HPProcurve,Huawei,HuaweiSmartAX,HuaweiSmartAX,HuaweiVrpv8,IpInfusionOcNOS,Juniper,Juniper,JuniperScreenOs,Keymile,KeymileNOS,Linux, MikrotikRouterOs,MikrotikSwitchOs,MellanoxMlnxos, MellanoxMlnxos,MrvLx, MrvOptiswitch,NetAppcDot,NetgearProSafe,Netscaler, NokiaSros, OneaccessOneOS,OvsLinux, PaloAltoPanos,Pluribus,QuantaMesh,RaisecomRoap,RuckusFastiron,RuijieOS,SixwindOS,SophosSfos,TPLinkJetStream,UbiquitiEdge, UbiquitiEdgeRouter, UbiquitiEdge, UbiquitiUnifiSwitch,VyOS, WatchguardFireware, ZteZxros, Yamaha,|
8、内置工单流程
共内置5个自动化工单流程,具体介绍见下表
序号 | 服务名称 | 服务流程 |
---|---|---|
1 | AD账号创建 | 【前置条件】AD已经纳管/AD凭据已经录入→【提单】填写新建的信息→【管理员审批】选择域和组→【自动执行】引用自动化流程自动批量创建→【发送邮件】申请人接收通知邮件 |
2 | AD账号密码重置 | 【前置条件】AD已经纳管/AD凭据已经录入→【提单】填写重置信息→【管理员审批】选择域和组→【自动执行】引用自动化流程自动批量重置→【发送邮件】申请人接收通知邮件 |
3 | AD账号禁用 | 【前置条件】AD已经纳管/AD凭据已经录入→【提单】填写禁用的信息→【管理员审批】选择域和组→【自动执行】引用自动化流程自动批量禁用→【发送邮件】申请人接收通知邮件 |
4 | AD账号删除 | 【前置条件】AD已经纳管/AD凭据已经录入→【提单】填写删除的信息→【管理员审批】选择域和组→【自动执行】引用自动化流程自动批量删除→【发送邮件】申请人接收通知邮件 |
5 | 数据库SQL语句执行 | 【前置条件】数据库已经纳管/数据库凭据已经录入→【提单】填写执行对象和SQL语句→【管理员审批】审批并选择凭据→【自动执行】引用自动化流程自动执行 |
6 | VMware虚拟机创建 | 【前置条件】vcenter已经纳管并设置自动发现/凭据已经录入→【提单】填写申请的虚拟机配置→【管理员审批】审批并选择凭据→【自动执行】引用自动化流程自动执行 |
7 | VMware虚拟机快照创建 | 【前置条件】vcenter已经纳管并设置自动发现/凭据已经录入→【提单】填写申请的信息→【管理员审批】审批并选择凭据→【自动执行】引用自动化流程自动执行 |
8 | VMware虚拟机快照回滚 | 【前置条件】vcenter已经纳管并设置自动发现/凭据已经录入→【提单】填写申请的信息→【管理员审批】审批并选择凭据→【自动执行】引用自动化流程自动执行 |
共内置36个工单流程,具体介绍见下表
序号 | 服务类型 | 服务流程 | 流程字段 |
---|---|---|---|
1 | 【AD相关】 | 开通AD帐号 | 使用人、账号名、显示名、手机号、邮箱、部门、使用时间、禁用时间、用途、紧急程度 |
2 | 【AD相关】 | 续用AD帐号 | 使用人、账号名、手机号、邮箱、部门、禁用时间、原因、紧急程度 |
3 | 【AD相关】 | 修改AD帐号信息 | 使用人、账号名、部门、修改内容、原因、紧急程度 |
4 | 【AD相关】 | 重置AD帐号密码 | 使用人、账号名、部门、原因、紧急程度 |
5 | 【AD相关】 | 禁用AD帐号 | 使用人、账号名、部门、原因、紧急程度 |
6 | 【邮箱相关】 | 开通邮箱帐号 | 使用人、账号名、手机号、部门、使用时间、释放时间、邮箱容量、原因、紧急程度 |
7 | 【邮箱相关】 | 续用邮箱帐号 | 使用人、邮箱、部门、释放时间、补充说明、紧急程度 |
8 | 【邮箱相关】 | 扩容邮箱帐号 | 使用人、邮箱、部门、原因、扩容量、紧急程度 |
9 | 【邮箱相关】 | 注销邮箱帐号 | 使用人、邮箱、部门、原因、紧急程度 |
10 | 【服务器相关】 | 申请服务器 | 使用人、部门、使用时间、释放时间、规格、操作系统、指定IP、用途、补充说明、紧急程度 |
11 | 【服务器相关】 | 续用服务器 | 使用人、部门、服务器IP、释放时间、用途、紧急程度 |
12 | 【服务器相关】 | 释放服务器 | 使用人、部门、服务器IP、原因、紧急程度 |
13 | 【服务器相关】 | 扩容服务器 | 使用人、部门、服务器IP、现规格、扩充至、紧急程度 |
14 | 【服务器相关】 | 创建服务器快照 | 使用人、部门、服务器IP、原因、紧急程度 |
15 | 【服务器相关】 | 回滚服务器快照 | 使用人、部门、服务器IP、原因、快照时间、紧急程度 |
16 | 【服务器相关】 | 服务器文件上传 | 使用人、部门、服务器IP、操作系统、原因、紧急程度、附件 |
17 | 【服务器相关】 | 服务器文件下载 | 使用人、部门、服务器IP、操作系统、文件路径、原因、紧急程度 |
18 | 【服务器相关】 | 开通网络策略 | 使用人、部门、服务器IP、开通端口、用途、紧急程度 |
19 | 【笔记本相关】 | 申请笔记本 | 使用人、部门、操作系统、型号、规格、预装软件、使用时间、退还时间、用途、紧急程度 |
20 | 【笔记本相关】 | 续用笔记本 | 使用人、部门、资产编码、型号、退还时间、原因、紧急程度 |
21 | 【笔记本相关】 | 维修笔记本 | 使用人、部门、资产编码、型号、是否为公司电脑、维修方式、故障现象、故障原因、紧急程度 |
22 | 【笔记本相关】 | 更换笔记本 | 使用人、部门、资产编码、型号、现规格型号、期望规格型号、原因、紧急程度 |
23 | 【笔记本相关】 | 退还笔记本 | 使用人、部门、资产编码、型号、原因 |
24 | 【笔记本相关】 | 安装办公软件 | 使用人、部门、资产编码、型号、操作系统、软件名称、软件版本、用途、紧急程度 |
25 | 【办公设备相关】 | 申请办公设备 | 使用人、部门、设备类型、使用时间、退还时间、用途、其他要求、紧急程度 |
26 | 【办公设备相关】 | 续用办公设备 | 使用人、部门、资产编码、设备类型、型号、退还时间、原因、紧急程度 |
27 | 【办公设备相关】 | 维修办公设备 | 使用人、部门、资产编码、设备类型、型号、故障现象、故障原因 |
28 | 【办公设备相关】 | 更换办公设备 | 使用人、部门、资产编码、设备类型、现规格型号、期望规格型号、原因、紧急程度 |
29 | 【办公设备相关】 | 退还办公设备 | 使用人、部门、资产编码、型号、原因 |
30 | 【办公设备相关】 | 打印机加纸 | 设备位置、紧急程度 |
31 | 【办公设备相关】 | 更换墨盒 | 设备位置、紧急程度 |
32 | 【门禁相关】 | 申请门禁账号 | 使用人、工号、部门、使用时间、注销时间、原因、紧急程度 |
33 | 【门禁相关】 | 续用门禁帐号 | 使用人、工号、部门、注销时间、原因、紧急程度 |
34 | 【门禁相关】 | 重置门禁密码 | 使用人、工号、部门、原因、紧急程度 |
35 | 【门禁相关】 | 注销门禁账号 | 使用人、工号、部门、原因、紧急程度 |
36 | 【告警转工单】 | 告警转工单 | 标题、关联业务、影响范围、紧急程度、优先级、描述 |