嘉为蓝鲸WeOps 4.9 内容说明
1、资源模型内置说明
操作系统、数据库、中间件、容器等对象进行资源模型内置,具体模型、字段、自动发现和采集能力详见列表
查看资产和模型字段的具体信息,点击可下载WeOps内置的模型说明表格,包括WeOps初始化内置的资产模型和字段,以及自动发现和采集能力。
1.1 操作系统模型内置情况
类型 | 纳管对象 | 内置模型字段 | 自动发现采集情况 |
---|---|---|---|
操作系统 | Windows Server | 内网IP、外网IP、主机名称、操作系统类型、操作系统名称、操作系统版本、操作系统位数、CPU逻辑核心数、CPU频率、CPU型号、内存容量(MB)、备注、主机类型、虚拟内存大小、系统语言、逻辑磁盘数量、子网掩码、DNS服务器、内网MAC地址、外网MAC、网关、网卡速率、时区设置、时钟同步服务器、上次补丁安装时间、上次重启时间、主机状态、最近备份时间、防火墙状态、主要维护人、录入时间、录入方式、主机安装时间、备份维护人 | 支持自动发现采集,采集字段如下: 内网IP、主机名称、操作系统类型、CPU逻辑核心数、内存容量(MB)、磁盘容量(GB)、录入时间、录入方式、内网MAC地址、外网MAC、操作系统版本、操作系统位数、CPU型号 |
操作系统 | linux | 内网IP、外网IP、主机名称、操作系统类型、操作系统名称、操作系统版本、操作系统位数、CPU逻辑核心数、CPU频率、CPU型号、内存容量(MB)、备注、主机类型、虚拟内存大小、系统语言、逻辑磁盘数量、子网掩码、DNS服务器、内网MAC地址、外网MAC、网关、网卡速率、时区设置、时钟同步服务器、上次补丁安装时间、上次重启时间、主机状态、最近备份时间、防火墙状态、主要维护人、录入时间、录入方式、主机安装时间、备份维护人 | 支持自动发现采集,采集字段如下: 内网IP、主机名称、操作系统类型、CPU逻辑核心数、内存容量(MB)、磁盘容量(GB)、录入时间、录入方式、内网MAC地址、外网MAC、操作系统版本、操作系统位数、CPU型号 |
1.2 数据库模型内置情况
类型 | 纳管对象 | 内置模型字段 | 自动发现采集情况 |
---|---|---|---|
数据库 | Oracle | 蓝鲸实例名、IP地址、端口、SID、数据库名、数据库版本、最大内存、最大连接数、是否开启归档、归档目录、数据库总数据大小、字符集、数据库角色、是否集群、部署时间、主要维护人、最后一次备份时间 | 支持自动发现采集,自动发现采集字段如下: 实例名、IP地址、端口、SID、最大内存(MB)、最大连接数、数据库名称、数据库版本、数据库角色、是否自动发现、上次更新时间 |
数据库 | MySQL | IP地址、端口、数据库版本、是否开启binlog、最大连接数、最大内存、数据库总数据大小、字符集、部署时间、主要维护人、最后一次备份时间 | 支持自动发现采集,自动发现采集字段如下: 蓝鲸实例名、IP地址、端口、数据库版本、是否开启binlog、最大连接数、最大内存、字符集、数据库角色、是否自动发现、上次更新时间 |
数据库 | MSSQL | ip地址、端口、数据库实例名、数据库版本、最大连接数、最大内存、数据库总数据大小、排序规则、高可用模式、部署时间、主要维护人、最后一次备份时间 | |
数据库 | REDIS | IP地址、端口、版本、最大连接数、持久化机制、最大内存、数据库角色、部署时间、主要维护人、最后一次备份时间 | 支持自动发现采集,自动发现采集字段如下: 蓝鲸实例名、IP地址、端口、版本、最大连接数、持久化机制、最大内存、数据库角色、是否自动发现、上次更新时间 |
数据库 | MongoDB | IP地址、端口、数据库总数据大小、版本、数据库角色、部署时间、主要维护人、最后一次备份时间 | |
数据库 | ElasticSearch | 蓝鲸实例名、IP地址、端口、版本、数据库角色 | |
数据库 | PostgreSQL | 蓝鲸实例名、IP地址、端口、版本、数据库角色 | 支持自动发现和采集,具体字段详见《WeOps内置的模型说明表格》 |
数据库 | DB2 | 蓝鲸实例名、IP地址、端口、版本、数据库角色、数据库主备角色 | |
数据库 | 数据库集群 | 蓝鲸实例名、IP地址、端口、集群类型、描述 |
1.3 中间件模型内置情况
类型 | 纳管对象 | 内置模型字段 | 自动发现采集情况 |
---|---|---|---|
中间件 | Apache | 实例名、httpd路径、httpd配置文件路径、IP地址、listen端口、文档根路径、INCLUDE、版本、维护人、最近备份时间 | |
中间件 | Tomcat | 实例名、catalina路径、version路径、端口、MAXPERMSIZE、PERMSIZE、XMS、XMX、jdk版本、版本号、维护人、最近备份时间 | |
中间件 | Nginx | 实例名、IP地址、监听端口、版本、INCLUDE、bin路径、域名、log路径、ssl版本、维护人、最近备份时间 | |
中间件 | IIS | 实例标识、IP地址、软件版本、应用池数量、应用程序数量、维护人、最近备份时间 | |
中间件 | RabbitMQ | 实例名、IP地址、端口、所有端口、节点名称、版本号、erlange版本、java版本 | |
中间件 | WebLogic | 实例名、IP地址、管理实例端口、管理实例名称、wlst路径、版本号、域版本、java版本 | |
中间件 | Kafka | 详见表格【WeOps内置的模型说明表格】 | |
中间件 | IBM MQ | 详见表格【WeOps内置的模型说明表格】 | |
中间件 | ZooKeeper | 详见表格【WeOps内置的模型说明表格】 |
1.4 K8S模型内置情况
类型 | 纳管对象 | 内置模型字段 | 自动发现采集情况 |
---|---|---|---|
K8S | K8S集群 | 实例名 | |
K8S | K8S命名空间 | 实例名、命名空间名称 | 支持自动发现采集,采集字段如下: 支持自动发现采集,自动发现采集字段如下: 实例名、命名空间名称、是否自动发现、上次更新时间 |
K8S | K8S工作负载 | 实例名、工作负载名称、工作负载类型 | 支持自动发现采集,自动发现采集字段如下: 实例名、工作负载名称、工作负载类型、是否自动发现、上次更新时间 |
K8S | Pod | 实例名、Node名称、IP地址、角色、CPU总容量(GHz)、内存总容量(GB)、存储总容量(GB)、操作系统版本、kubelet版本、内核版本、 容器运行时版本、Pod IP地址段 | 支持自动发现采集,自动发现采集字段如下: 实例名、Pod名称、IP地址、CPU Limit(GHz)、Memory Limit(GB)、CPU Request(GHz)、Memory Request(GB)、是否自动发现、上次更新时间 |
K8S | Node | 实例名、Pod名称、IP地址、CPU Limit(GHz)、Memory Limit(GB)、CPU Request(GHz)、Memory Request(GB) | 支持自动发现采集,自动发现采集字段如下: 实例名、IP地址、角色、CPU总容量(GHz)、内存总容量(GB)、存储总容量(GB)、操作系统版本、kubelet版本、内核版本、容器运行时版本、Pod IP地址段、是否自动发现、上次更新时间 |
1.5 云平台模型内置情况
类型 | 纳管对象 | 内置模型字段 | 自动发现采集情况 |
---|---|---|---|
VMware | Vcenter | 实例名、IP地址、VC版本、资产编码、是否自动发现、上次更新时间、接入点 | |
VMware | VMware虚拟机 | 实例名、IP地址、资源ID、虚拟机名称、操作系统名称、vCPU数、内存容量(MB)、资产编码、是否自动发现、上次更新时间、接入点 | 实例名、IP地址、资源ID、虚拟机名称、操作系统名称、vCPU数、内存容量(MB)、资产编码、是否自动发现、上次更新时间、接入点 |
VMware | ESXI | 实例名、IP地址、资源ID、CPU型号、CPU核数、vCPU数、内存容量(MB)、ESXi版本、资产编码、是否自动发现、上次更新时间、接入点 | 实例名、IP地址、资源ID、CPU型号、CPU核数、vCPU数、内存容量(MB)、ESXi版本、资产编码、是否自动发现、上次更新时间、接入点 |
VMware | 数据存储 | 实例名、资源ID、文件系统类型、总容量(GB)、URL、资产编码、是否自动发现、上次更新时间、接入点 | 实例名、资源ID、文件系统类型、总容量(GB)、URL、资产编码、是否自动发现、上次更新时间、接入点 |
阿里云 | 阿里云账号 | 实例名、资产编码 | |
阿里云 | ECS | 实例名、资源名称、资源ID、内网IP、公网IP、地域、可用区、VPC、状态、规格、操作系统名称、vCPU数、内存容量(MB)、资产编码、付费类型、创建时间、到期时间、是否自动发现、上次更新时间、接入点 | 实例名、资源名称、资源ID、内网IP、公网IP、地域、可用区、VPC、状态、规格、操作系统名称、vCPU数、内存容量(MB)、资产编码、付费类型、创建时间、到期时间、是否自动发现、上次更新时间、接入点 |
腾讯云 | 腾讯云账号 | 实例名、资产编码 | |
腾讯云 | CVM | 实例名、资源名称、资源ID、内网IP、公网IP、地域、可用区、VPC、状态、规格、操作系统名称、vCPU数、内存容量(MB)、资产编码 | 实例名、资源名称、资源ID、内网IP、公网IP、地域、可用区、VPC、状态、规格、操作系统名称、vCPU数、内存容量(MB)、资产编码 |
华为云 | ManageOne平台 | 实例名、全局域名、运维域名、资产编码 | |
华为云 | ManageOne云服务器 | 实例名、资源名称、资源ID、内网IP、地域、状态、操作系统名称、vCPU数、资产编码、付费类型、创建时间、到期时间、是否自动发现、上次更新时间、接入点 | 实例名、资源名称、资源ID、内网IP、地域、状态、操作系统名称、vCPU数、资产编码、付费类型、创建时间、到期时间、是否自动发现、上次更新时间、接入点 |
华为云 | ManageOne宿主机 | 支持自动发现和采集,详见表格【WeOps内置的模型说明表格】 | 详见表格【WeOps内置的模型说明表格】 |
华为云 | ManageOne数据存储 | 支持自动发现和采集,详见表格【WeOps内置的模型说明表格】 | 详见表格【WeOps内置的模型说明表格】 |
华为云 | ManageOne云平台 | 详见表格【WeOps内置的模型说明表格】 | 支持自动发现和采集,详见表格【WeOps内置的模型说明表格】 |
华为云 | 华为云账号 | 详见表格【WeOps内置的模型说明表格】 | |
华为云 | 华为云ECS | 详见表格【WeOps内置的模型说明表格】 | 支持自动发现和采集,详见表格【WeOps内置的模型说明表格】 |
深信服超融合(SangforHCI) | SangforHCI平台 | 详见表格【WeOps内置的模型说明表格】 | |
深信服超融合(SangforHCI) | SangforHCI虚拟机 | 详见表格【WeOps内置的模型说明表格】 | 支持自动发现和采集,详见表格【WeOps内置的模型说明表格】 |
华为大数据平台 | FusionInsight平台 | 详见表格【WeOps内置的模型说明表格】 | |
华为大数据平台 | FusionInsight集群 | 详见表格【WeOps内置的模型说明表格】 | 支持自动发现和采集,详见表格【WeOps内置的模型说明表格】 |
华为大数据平台 | FusionInsight主机 | 详见表格【WeOps内置的模型说明表格】 | 支持自动发现和采集,详见表格【WeOps内置的模型说明表格】 |
1.6 基础设备模型内置情况
类型 | 纳管对象 | 内置模型字段 | 自动发现采集情况 |
---|---|---|---|
基础设备 | 交换机 | 实例名、管理IP、管理端口、型号、SNMP版本、品牌 | 支持自动发现采集,自动发现采集字段如下: 实例名、管理IP、管理端口、型号、SNMP版本、品牌 |
基础设备 | 路由器 | 实例名、管理IP、管理端口、SNMP版本、型号、品牌 | 支持自动发现采集,自动发现采集字段如下: 实例名、管理IP、管理端口、SNMP版本、型号、品牌 |
基础设备 | 防火墙设备 | 实例名、管理IP、管理端口、型号、SNMP版本、品牌 | 支持自动发现采集,自动发现采集字段如下: 实例名、管理IP、管理端口、型号、SNMP版本、品牌 |
基础设备 | 负载均衡设备 | 实例名、管理IP、管理端口、SNMP版本、型号、品牌 | 支持自动发现采集,自动发现采集字段如下: 实例名、管理IP、管理端口、型号、SNMP版本、品牌 |
基础设备 | 物理机 | 实例名、IP地址、型号、类型、硬盘大小、CPU型号、型号、品牌、sn设备序列号、网卡数量、内存大小、MAC地址、维护人、过保日期、存放地点、资产编号 | |
基础设备 | 网络设备端口 | 实例名、品牌 |
1.7 硬件设备模型内置情况
类型 | 纳管对象 | 内置模型字段 |
---|---|---|
硬件设备 | 硬件服务器 | 详见表格【WeOps内置的模型说明表格】 |
硬件设备 | 存储 | 详见表格【WeOps内置的模型说明表格】 |
硬件设备 | 安全设备 | 详见表格【WeOps内置的模型说明表格】 |
1.8 其他模型内置情况
类型 | 纳管对象 | 内置模型字段 | 自动发现采集情况 |
---|---|---|---|
目录服务 | Active Directory | 蓝鲸实例名、计算机名、IP地址、所属域、所属林、所属站点、林功能级别、域功能级别、是否为全局编录、是否为只读域控、主机角色、数据库目录、数据库日志文件目录、SYSVOL目录、系统版本 | |
邮件服务 | Exchange Server | 蓝鲸实例名、计算机名、IP地址、所属域、所属林、所属站点、安装目录、Exchange版本、Exchange角色、owa虚拟目录内部URL、owa虚拟目录外部URL、ecp虚拟目录内部URL、ecp虚拟目录外部URL、ews虚拟目录内部URL、ews虚拟目录外部URL、mapi虚拟目录内部URL、mapi虚拟目录外部URL、oab虚拟目录内部URL、oab虚拟目录外部URL、activesync虚拟目录内部URL、activesync虚拟目录外部URL、autodiscover内部URI、outlookanywhere内部主机名、outlookanywhere外部主机名、outlookanywhere身份验证方式、pop3身份验证方式、imap4身份验证方式、接收连接器名称、发送连接器名称、数据库名称、所属DAG名称 | |
证书 | SSL证书 | 详见表格【WeOps内置的模型说明表格】 |
2、监控指标说明
2.0 各对象支持监控方式汇总
对象类型 | 对象名称 | 支持的监控方式 |
---|---|---|
操作系统 | linux、Windows等 | 1、Agent采集 2、自定义脚本监控插件(shell、powershell) |
数据库 | Oracle、MySQL、MSSQL | 1、内置监控插件 2、自定义脚本监控插件(shell、powershell) 3、SQL监控插件 |
MongoDB、Redis、PGSQL、其他扩展数据库 | 1、内置监控插件 2、自定义脚本监控插件(shell、powershell) | |
中间件 | Apache、Nginx、Tomcat... | 1、内置监控插件 2、自定义脚本监控插件(shell、powershell、BK-pull) |
云平台 | 阿里云、腾讯云、华为公有云...... | 1、内置监控插件 |
网络设备snmp | 交换机、路由器、防火墙、负载均衡 | 1、内置监控插件 2、自定义SNMP监控模板 |
硬件设备IPMI | 硬件服务器..... | 1、内置监控插件 |
操作系统、数据库、中间件等对象内置监控插件的监控指标,具体如下表。(部分对象已经内置监控插件、内置关键指标、内置监控策略详见列表)
点击可下载WeOps内置的监控指标说明表格,包括WeOps初始化内置的资产指标、指标说明和推荐阈值等信息
2.1 操作系统监控指标
序号 | 对象类型 | 指标数量 | 指标/事件 | 内置监控插件 | 内置监控策略 |
---|---|---|---|---|---|
1 | 操作系统-Windows | 97 | 详见【WeOps内置的监控指标说明表格】 | 已内置监控插件 | 详见【WeOps内置的监控指标说明表格】 |
2 | 操作系统-Linux | 97 | 详见【WeOps内置的监控指标说明表格】 | 已内置监控插件 | 详见【WeOps内置的监控指标说明表格】 |
2.2 数据库监控指标
序号 | 对象类型 | 指标数量 | 指标/事件 | 内置监控插件 | 内置监控策略 |
---|---|---|---|---|---|
1 | 数据库-MySQL | 21 | 详见【WeOps内置的监控指标说明表格】 | 已内置监控插件 | 详见【WeOps内置的监控指标说明表格】 |
2 | 数据库-MSSQL | 20 | 详见【WeOps内置的监控指标说明表格】 | 已内置监控插件 | 详见【WeOps内置的监控指标说明表格】 |
3 | 数据库-Oracle | 25 | 详见【WeOps内置的监控指标说明表格】 | 已内置监控插件 | 详见【WeOps内置的监控指标说明表格】 |
4 | 数据库-MongoDB | 27 | 详见【WeOps内置的监控指标说明表格】 | 已内置监控插件 | 详见【WeOps内置的监控指标说明表格】 |
5 | 数据库-Redis | 30 | 详见【WeOps内置的监控指标说明表格】 | 已内置监控插件 | 详见【WeOps内置的监控指标说明表格】 |
6 | 数据库-PGSQL | 74 | 详见【WeOps内置的监控指标说明表格】 | 已内置监控插件 | 详见【WeOps内置的监控指标说明表格】 |
7 | 数据库-MongoDB | 74 | 详见【WeOps内置的监控指标说明表格】 | 已内置监控插件 | 详见【WeOps内置的监控指标说明表格】 |
8 | 数据库-ElasticSearch | 详见【WeOps内置的监控指标说明表格】 | 已内置监控插件 | 详见【WeOps内置的监控指标说明表格】 |
2.3 中间件监控指标
序号 | 对象类型 | 指标数量 | 指标/事件 | 内置关键指标 | 内置监控插件 | 内置监控策略 |
---|---|---|---|---|---|---|
1 | 中间件-Tomcat | 详见【WeOps内置的监控指标说明表格】 | 详见【WeOps内置的监控指标说明表格】 | 已内置监控插件 | 详见【WeOps内置的监控指标说明表格】 | |
2 | 中间件-Nginx | 8 | 详见【WeOps内置的监控指标说明表格】 | 详见【WeOps内置的监控指标说明表格】 | 已内置监控插件 | 详见【WeOps内置的监控指标说明表格】 |
3 | 中间件-Apache | 详见【WeOps内置的监控指标说明表格】 | 详见【WeOps内置的监控指标说明表格】 | 已内置监控插件 | 详见【WeOps内置的监控指标说明表格】 | |
4 | 中间件-IIS | 详见【WeOps内置的监控指标说明表格】 | 详见【WeOps内置的监控指标说明表格】 | 已内置监控插件 | 详见【WeOps内置的监控指标说明表格】 | |
5 | 中间件-Kafka | 详见【WeOps内置的监控指标说明表格】 | 详见【WeOps内置的监控指标说明表格】 | 已内置监控插件 | 详见【WeOps内置的监控指标说明表格】 | |
6 | 中间件-RabbitMQ | 详见【WeOps内置的监控指标说明表格】 | 详见【WeOps内置的监控指标说明表格】 | 已内置监控插件 | 详见【WeOps内置的监控指标说明表格】 | |
7 | 中间件-IBM MQ | 详见【WeOps内置的监控指标说明表格】 | 详见【WeOps内置的监控指标说明表格】 | 已内置监控插件 | 详见【WeOps内置的监控指标说明表格】 | |
8 | 中间件-ZooKeeper | 详见【WeOps内置的监控指标说明表格】 | 详见【WeOps内置的监控指标说明表格】 | 已内置监控插件 | 详见【WeOps内置的监控指标说明表格】 |
2.4 K8S监控指标
序号 | 对象类型 | 指标数量 | 指标 | 内置关键指标 | 内置监控插件 | 内置监控策略 |
---|---|---|---|---|---|---|
1 | K8S-Pod | 17 | 详见【WeOps内置的监控指标说明表格】 | CPU使用率、容器CPU使用率、内存使用量、容器内存使用量 | 已内置监控指标 | CPU使用率>80%、容器CPU使用率>80%、memory limit %>80%、container memory limit %>80% |
2 | K8S-Node | 14 | 详见【WeOps内置的监控指标说明表格】 | CPU使用率、应用内存使用量、1分钟平均负载、文件系统使用率 | 已内置监控指标 | CPU使用率>80%、应用内存使用率>80%、物理内存使用率>80%、文件系统使用率>80% |
2.5 云平台监控指标
序号 | 云平台 | 类型 | 指标数量 | 指标 |
---|---|---|---|---|
1 | VMware | 数据存储 | 3 | 详见【WeOps内置的监控指标说明表格】 |
2 | VMware | ESXI | 10 | 详见【WeOps内置的监控指标说明表格】 |
3 | VMware | 虚拟机 | 12 | C详见【WeOps内置的监控指标说明表格】 |
4 | 阿里云 | ECS | 8 | 详见【WeOps内置的监控指标说明表格】 |
5 | 腾讯云 | CVM | 11 | 详见【WeOps内置的监控指标说明表格】 |
6 | 腾讯云 | TDSQL | 详见【WeOps内置的监控指标说明表格】 | |
7 | 腾讯云 | TDMQ | 详见【WeOps内置的监控指标说明表格】 | |
8 | 腾讯云 | Serverless | 详见【WeOps内置的监控指标说明表格】 | |
9 | 华为云-manageone | 云服务器 | 9 | 详见【WeOps内置的监控指标说明表格】 |
10 | 华为云-manageone | 宿主机 | / | 详见【WeOps内置的监控指标说明表格】 |
11 | 华为云-manageone | 数据存储 | / | 详见【WeOps内置的监控指标说明表格】 |
12 | 华为云-manageone | 云平台 | / | 详见【WeOps内置的监控指标说明表格】 |
13 | 华为公有云 | 华为云ECS | / | 详见【WeOps内置的监控指标说明表格】 |
14 | SangforHCI | SangforHCI虚拟机 | / | 详见【WeOps内置的监控指标说明表格】 |
15 | 华为FusionInsight | 云服务器 | / | 详见【WeOps内置的监控指标说明表格】 |
16 | NutanixHCI(路坦力) | 虚拟机、物理机、磁盘、虚拟磁盘、存储容器、存储池、卷组、集群 | / | 详见【WeOps内置的监控指标说明表格】 |
2.6 网络设备监控指标
以下展示的是内置的网络设备指标模板,WeOps提供拓展能力,可支持不同品牌和型号的设备(通过自定义监控模板的方式进行能力拓展)。
序号 | 对象类型 | 厂商 | 指标数量 | 指标 |
---|---|---|---|---|
1 | 防火墙 | Cisco | 40 | 详见【WeOps内置的监控指标说明表格】 |
3 | 防火墙 | 华为 | 33 | 详见【WeOps内置的监控指标说明表格】 |
4 | 防火墙 | NETGEAR | 详见【WeOps内置的监控指标说明表格】 | |
5 | 防火墙 | WatchGuard | 详见【WeOps内置的监控指标说明表格】 | |
6 | 防火墙 | 东软Neteye | 详见【WeOps内置的监控指标说明表格】 | |
7 | 防火墙 | 飞塔 | 详见【WeOps内置的监控指标说明表格】 | |
8 | 防火墙 | Checkpoint | 详见【WeOps内置的监控指标说明表格】 | |
9 | 负载均衡设备 | Riverbed | 详见【WeOps内置的监控指标说明表格】 | |
10 | 负载均衡设备 | Superiority | 详见【WeOps内置的监控指标说明表格】 | |
11 | 负载均衡设备 | F5负载均衡 | 详见【WeOps内置的监控指标说明表格】 | |
12 | 负载均衡设备 | A10负载均衡 | 详见【WeOps内置的监控指标说明表格】 | |
13 | 交换机 | Cisco | 40 | 详见【WeOps内置的监控指标说明表格】 |
14 | 交换机 | H3C | 40 | 详见【WeOps内置的监控指标说明表格】 |
11 | 交换机 | 华为 | 33 | 详见【WeOps内置的监控指标说明表格】 |
12 | 交换机 | MOXA | 详见【WeOps内置的监控指标说明表格】 | |
13 | 交换机 | NETGEAR | 详见【WeOps内置的监控指标说明表格】 | |
14 | 交换机 | 派凌 | 详见【WeOps内置的监控指标说明表格】 | |
15 | 交换机 | 神州数码 | 详见【WeOps内置的监控指标说明表格】 | |
16 | 交换机 | Cisco Nexus | 详见【WeOps内置的监控指标说明表格】 | |
17 | 交换机 | 锐捷 | 详见【WeOps内置的监控指标说明表格】 | |
18 | 交换机 | Alcatel-Timetra交换机 | 提供网络设备监控模板,可导入使用 | |
19 | 交换机 | Brocade-FC交换机 | 提供网络设备监控模板,可导入使用 | |
20 | 交换机 | Brocade-Foundry交换机 | 提供网络设备监控模板,可导入使用 | |
21 | 交换机 | Dell-Force S-Series交换机 | 提供网络设备监控模板,可导入使用 | |
22 | 交换机 | D-Link-Des交换机 | 提供网络设备监控模板,可导入使用 | |
23 | 交换机 | D-Link-Des7200交换机 | 提供网络设备监控模板,可导入使用 | |
24 | 交换机 | Extreme | 提供网络设备监控模板,可导入使用 | |
25 | 交换机 | Intel-QLogic InfiniBand交换机 | 提供网络设备监控模板,可导入使用 | |
26 | 交换机 | Juniper | 提供网络设备监控模板,可导入使用 | |
27 | 交换机 | Mellanox | 提供网络设备监控模板,可导入使用 | |
28 | 交换机 | Q-Tech | 提供网络设备监控模板,可导入使用 | |
29 | 交换机 | Ubiquiti-AirOS交换机 | 提供网络设备监控模板,可导入使用 | |
30 | 交换机 | zyxel-aam1212-51 | 提供网络设备监控模板,可导入使用 | |
31 | 交换机 | zyxel-es3500-8pd | 提供网络设备监控模板,可导入使用 | |
32 | 交换机 | zyxel-gs4012f | 提供网络设备监控模板,可导入使用 | |
33 | 交换机 | zyxel-ies-500x | 提供网络设备监控模板,可导入使用 | |
34 | 交换机 | zyxel-ies-6000 | 提供网络设备监控模板,可导入使用 | |
35 | 交换机 | zyxel-mes3500-10 | 提供网络设备监控模板,可导入使用 | |
36 | 交换机 | zyxel-mes3500-24 | 提供网络设备监控模板,可导入使用 | |
37 | 交换机 | zyxel-mes-3528 | 提供网络设备监控模板,可导入使用 | |
38 | 交换机 | zyxel-mgs3500-24s | 提供网络设备监控模板,可导入使用 | |
39 | 交换机 | zyxel-mgs3520-28x | 提供网络设备监控模板,可导入使用 | |
40 | 交换机 | zyxel-mgs-3712 | 提供网络设备监控模板,可导入使用 | |
41 | 交换机 | zyxel-mgs-3712f | 提供网络设备监控模板,可导入使用 | |
42 | 交换机 | zyxel-xgs-4728f | 提供网络设备监控模板,可导入使用 | |
43 | 路由器 | Cisco | 26 | 详见【WeOps内置的监控指标说明表格】 |
44 | 路由器 | H3C | 28 | 详见【WeOps内置的监控指标说明表格】 |
45 | 路由器 | 华为 | 21 | 详见【WeOps内置的监控指标说明表格】 |
46 | 路由器 | Cisco Nexus | 详见【WeOps内置的监控指标说明表格】 | |
47 | 路由器 | 锐捷 | 详见【WeOps内置的监控指标说明表格】 | |
48 | 物理服务器 | Cisco-UCS服务器 | 提供网络设备监控模板,可导入使用 | |
49 | 物理服务器 | Dell-iDRAC服务器 | 提供网络设备监控模板,可导入使用 | |
50 | 物理服务器 | HP-iLO服务器 | 提供网络设备监控模板,可导入使用 | |
51 | 物理服务器 | IBM-IMM服务器 | 提供网络设备监控模板,可导入使用 | |
52 | 物理服务器 | Supermicro-ATEN服务器 | 提供网络设备监控模板,可导入使用 | |
53 | 存储 | 华为-5300 V5存储 | 提供网络设备监控模板,可导入使用 | |
54 | 存储 | NetApp-FAS3220存储 | 提供网络设备监控模板,可导入使用 |
2.7 硬件设备监控指标
序号 | 对象类型 | 指标数量 | 指标/事件 |
---|---|---|---|
1 | 硬件服务器 | 5 | 详见【WeOps内置的监控指标说明表格】 |
2 | 存储 | 5 | 详见【WeOps内置的监控指标说明表格】 |
3 | 安全设备 | 5 | 详见【WeOps内置的监控指标说明表格】 |
2.8 其他监控指标
序号 | 对象类型 | 指标数量 | 指标/事件 | 内置监控插件 |
---|---|---|---|---|
1 | 进程 | 15 | 详见【WeOps内置的监控指标说明表格】 | 已内置监控指标 |
2 | 拨测 | 12 | 详见【WeOps内置的监控指标说明表格】 | 已内置监控指标 |
3 | Active Directory活动目录 | 详见【WeOps内置的监控指标说明表格】 | 已内置监控指标 | |
4 | Exchange邮件系统 | 详见【WeOps内置的监控指标说明表格】 | 已内置监控插件 |
3、监控插件参数和权限说明
WeOps监控插件使用的参数和授予权限说明如下
3.1 MSSQL
参数说明
参数名 | 含义 | 是否必填 | 使用举例 |
---|---|---|---|
SQLEXPORTER_TARGET_DSN | 数据源名称,填写会覆盖配置文件中的数据源data_source_name,注意!在监控平台填写参数时不要用双引号将参数包起来 | 是 | sqlserver://user:password@127.0.0.1:1433 |
-config.file | sql_exporter.yml 采集器全局配置文件, 包含超时设置、最大连接数、目标配置、采集指标配置文件名等 | 是 | 默认已有采集器全局配置文件 |
-log.level | 日志级别 | 否 | info |
-web.listen-address | exporter监听id及端口地址 | 否 | 127.0.0.1:9601 |
collector.file.content | mssql_standard.collector.yml 采集指标配置文件, 包含指标名、维度、sql等内容。注意!该参数为文件参数,非探针执行文件参数! | 是 | 默认已有标准采集指标配置文件 |
采集器全局配置文件说明(sql_exporter.yml)
# 全局配置
global:
# sql语句的超时时间,这个值需要比prometheus的 `scrape_timeout` 值要小。如果配置了下方的 scrape_timeout_offset 值,那么最终的超时时间为, min(scrape_timeout, X-Prometheus-Scrape-Timeout-Seconds - scrape_timeout_offset)
# X-Prometheus-Scrape-Timeout-Seconds 为 prometheus 的超时时间
scrape_timeout: 10s
# 从 prometheus 的超时时间中减去一个偏移量,防止 prometheus 先超时。
scrape_timeout_offset: 500ms
# 各个sql收集器之间运行间隔的秒数
min_interval: 0s
# 允许获取到的数据库最大的连接数, <=0 表示不限制。
max_connections: 3
# 允许空闲连接数的个数,<=0 不做限制
max_idle_connections: 3
# 配置监控的数据库和抓取信息
target:
# 配置数据库链接信息
# sqlserver://user(用户名):password(密码)@127.0.0.1(数据库服务域名或者IP):1433(数据库服务端口号)
data_source_name: "sqlserver://user:password@127.0.0.1:1433"
# 收集器的名字, 对应下方 collector_files 中文件的 collector_name 的值
collectors: [mssql_*]
collector_files:
- "*.collector.yml"
采集指标配置文件(mssql_standard.collector.yml)
# 收集器的名字
collector_name: mssql_standard
metrics:
- metric_name: mssql_version # 指标ID
type: counter # 类型
help: 'Fetched version of instance.' # 描述
key_labels: # 维度值
- ProductVersion
values: [value] # 值
query: | # sql语句
SELECT CONVERT(VARCHAR(128), SERVERPROPERTY ('productversion')) AS ProductVersion, 1 AS value
使用指引
以下是在SQL Server中使⽤命令⾏创建监控⽤户的教程:
- ⽅式⼀:
连接到 MSSQL 数据库服务器,并使⽤具有⾜够权限的管理员⽤户帐户登录。
在 SQL Server Management Studio 中,右键单击 Security,然后选择 "New Login"。
在 "Login - New" 对话框中,输⼊监控⽤户的⽤户名,选择 "SQL Server authentication" 作为登录类型,并 设置⼀个强密码。
在 "Default database" 下拉菜单中,选择⽤户需要访问的数据库,⼀般默认master即可。
在 "Server Roles" 选项卡中,选择 "public" ⻆⾊。
在 "User Mapping" 选项卡中,将需要访问的数据库分配给该⽤户。
单击 "OK" 按钮以创建该⽤户。 在 MSSQL exporter 的配置⽂件中,使⽤此监控⽤户的凭据访问数据库。
- ⽅式⼆: 通过终端与数据库交互
- 打开命令提示符或PowerShell,使⽤sqlcmd命令连接到SQL Server,如下所示:
sqlcmd -S server_address -U sa -P your_password
其中,server_address是SQL Server的访问地址,sa是具有⾜够权限的SQL Server管理员的登录名, your_password是对应的密码。
2 使⽤以下命令创建监控⽤户,该⽤户只具有读取权限,允许⽤户查看所有对象的定义:
CREATE LOGIN monitoring_user WITH PASSWORD = 'your_password';
GRANT VIEW SERVER STATE TO monitoring_user;
GRANT VIEW ANY DEFINITION TO monitoring_user;
GO
其中,monitoring_user是监控⽤户的名称,your_password是对应的密码。
- 如果需要在特定的数据库中监控,请使⽤以下命令授予监控⽤户对该数据库的访问权限:
USE database_name;
CREATE USER monitoring_user FOR LOGIN monitoring_user;
ALTER ROLE db_datareader ADD MEMBER monitoring_user;
GO
其中,database_name是要监控的数据库的名称,⼀般默认使⽤master
3.2 MySQL
参数说明
参数名 | 含义 | 是否必填 | 使用举例 |
---|---|---|---|
MYSQL_USER | mysql登录账户名(环境变量) | 是 | monitor |
MYSQL_PASSWORD | mysql登录账户名的密码(环境变量) | 是 | Monitor123! |
--mysqld.host | mysql服务地址 | 是 | 127.0.0.1 |
--mysqld.port | mysql服务端口号 | 是 | 3306 |
--log.level | 日志级别 | 否 | info |
--web.listen-address | exporter监听id及端口地址 | 否 | 127.0.0.1:9601 |
使用指引
- 连接MySQL
mysql -u[username] -p[password] -h[host] -P[port]
- 创建账户及授权
CREATE USER '[username]'@'%' IDENTIFIED BY '[password]';
GRANT PROCESS, SELECT, REPLICATION CLIENT ON *.* TO '[username]'@'%';
在 MariaDB 10.5+ 版本中,为了支持增量备份,引入了一种新的权限 REPLICA MONITOR。该权限允许用户监视复制进程,并查询与备份有关的信 息。
当 mysql exporter 用于监控 MariaDB 10.5+ 版本的数据库时,它需要使用 REPLICA MONITOR 权限来获取与备份有关的信息。如果没有授予监控用户 REPLICA MONITOR 权限,则无法获取这些信息,导致监控数据不完整或无法正常工作。 因此,在 MariaDB 10.5+ 版本中,需要使用 GRANT 命令为监控用户授予 REPLICA MONITOR 权限。
GRANT REPLICA MONITOR ON *.* TO '[username]'@'%';
3.3 Oracel
参数说明
参数名 | 含义 | 是否必填 | 使用举例 |
---|---|---|---|
DATA_SOURCE_NAME | DSN参数,在连接Oracle数据库时,需要提供一个连接字符串,其中包括Oracle数据库实例的主机名、端口号和服务名称,例如: oracle://username:password@hostname:port/service_name 注意!该参数为环境变量 | 是 | oracle://weops:Weops123@127.0.0.1:1521/ORCLCDB |
--custom.metrics | 自定义指标查询文件路径 注意!该参数在平台层面为文件参数,进程中该参数值为采集配置文件路径(上传文件即可,平台会补充文件路径)! | ||
--query.timeout | 查询超时秒数,默认使用5s | 否 | 5 |
--log.level | 日志级别 | 否 | info |
--web.listen-address | exporter监听id及端口地址 | 否 | 127.0.0.1:9601 |
使用指引
查看Oracle数据库服务名和域名
注意!对于oracle数据库12版本,DSN中数据库名后必须加入域名,其他版本一般不需要
ORCLCDB是Oracle数据库的一个服务名称(Service Name),它用于唯一标识数据库实例中的一个服务。
例: "oracle://system:Weops123!@db12c-oracle-db.oracle:1521/ORCLCDB.localdomain"查看当前数据库实例的
SERVICE_NAME
参数的值。SELECT value FROM v$parameter WHERE name = 'service_names';
查看当前数据库实例的
DB_DOMAIN
参数的值。如果返回结果为空,表示未设置特定的域名。SELECT value FROM v$parameter WHERE name = 'db_domain';
若出现unknown service error
- 需检查监听器的当前状态,确保监听器正在运行并监听正确的端口,运行命令
lsnrctl status
。 - 确认监听器配置文件(
lsnrctl status
会输出监听器配置状态等信息,寻找配置文件,通常是 listener.ora)中是否正确定义了服务名称,并与您尝试连接的服务名称匹配。 lsnrctl
在oracle数据库12版本中,此命令一般存放于/u01/app/oracle/product/12.2.0/dbhome_1/
; 在oracle数据库19版本中,一般存放于/opt/oracle/product/19c/dbhome_1/bin
- 需检查监听器的当前状态,确保监听器正在运行并监听正确的端口,运行命令
连接Oracle数据库
使用操作系统的身份认证(通常是超级用户或管理员),直接以 sysdba 角色登录到数据库sqlplus / as sysdba
使用指定账户登录
sqlplus username/password@host:port/service_name
创建账户及授权
注意!创建账户时必须使用管理员账户# 新建用户
CREATE USER [user] IDENTIFIED BY [password];
# 修改用户的密码,密码若含特殊字符需使用双引号将密码括起来
ALTER USER [user] IDENTIFIED BY [password];
# 允许用户建立数据库会话
GRANT CREATE SESSION TO [user];
# uptime指标授权
GRANT SELECT ON V_$instance to [user];
# rac指标授权
GRANT SELECT ON GV_$instance to [user];
# sessions类指标授权
GRANT SELECT ON V_$session to [user];
# resource类指标授权
GRANT SELECT ON V_$resource_limit to [user];
# asm_diskgroup类指标授权
GRANT SELECT ON V_$datafile to [user];
GRANT SELECT ON V_$asm_diskgroup_stat to [user];
# activity类指标授权
GRANT SELECT ON V_$sysstat to [user];
# process类指标授权
GRANT SELECT ON V_$process to [user];
# wait_time类指标授权
GRANT SELECT ON V_$waitclassmetric to [user];
GRANT SELECT ON V_$system_wait_class to [user];
# tablespace类指标授权
GRANT SELECT ON dba_tablespace_usage_metrics to [user];
GRANT SELECT ON dba_tablespaces to [user];
# asm_disk_stat类指标授权
GRANT SELECT ON V_$asm_disk_stat to [user];
GRANT SELECT ON V_$asm_diskgroup_stat to [user];
GRANT SELECT ON V_$instance to [user];
# asm_space_consumers类指标授权
GRANT SELECT ON V_$asm_alias to [user];
GRANT SELECT ON V_$asm_diskgroup to [user];
GRANT SELECT ON V_$asm_file to [user];
# sga类指标授权
GRANT SELECT ON V_$sga TO weops;
GRANT SELECT ON V_$sgastat TO weops;
# pga类指标授权
GRANT SELECT ON V_$pgastat TO weops;
# dataguard类指标授权
GRANT SELECT ON V_$dataguard_stats TO weops;自定义指标查询文件
文件内容规范
- 每一类自定义查询指标必须含有
[[metric]]
开头 - 对于每个指标部分,需要提供上下文(context)、请求(request)和请求字段与注释之间的映射。
context
指标前缀labels
指标维度数据信息,[维度1], [维度2], [维度3]...metricsdesc
[指标后缀] = [指标的描述信息]metricstype
[指标后缀] = [指标类型]request
sql查询语句,注意sql中字段与labels
和metricsdesc
的映射
- 每一类自定义查询指标必须含有
使用自定义指标查询 (通过命令行参数
--custom.metrics
设置),下方是默认的自定义指标文件配置内容[[metric]]
context = "rac"
metricsdesc = { node = "Number of nodes in the RAC cluster." }
request = "select count(*) as node from gv$instance where database_type='RAC'"
[[metric]]
context = "asm_disk_stat"
labels = [ "inst_id", "node_name", "instance_name", "diskgroup_name", "disk_number", "failgroup", "path" ]
metricsdesc = { reads = "Total number of I/O read requests for the DG.", writes = "Total number of I/O write requests for the DG.", read_time = "Total I/O time (in hundreths of a second) for read requests for the disk", write_time = "Total I/O time (in hundreths of a second) for write requests for the disk", bytes_read = "Total number of bytes read from the DG", bytes_written = "Total number of bytes written from the DG", iops = "Total number of I/O requests for the DG" }
metricstype = { reads = "counter", writes = "counter", bytes_read = "counter", read_time = "counter", write_time = "counter", bytes_written = "counter", iops = "counter" }
request = '''
SELECT i.instance_number AS inst_id,
i.host_name AS node_name,
i.instance_name,
g.name AS diskgroup_name,
ds.disk_number AS disk_number,
ds.failgroup AS failgroup,
ds.reads AS reads,
ds.writes AS writes,
ds.read_time * 1000 AS read_time,
ds.write_time * 1000 AS write_time,
ds.bytes_read AS bytes_read,
ds.bytes_written AS bytes_written,
REGEXP_REPLACE (ds.PATH, '.*/\', '\') AS PATH,
ds.reads + ds.writes AS iops
FROM v$asm_disk_stat ds, v$asm_diskgroup_stat g, v$instance i
WHERE ds.mount_status = 'CACHED' AND ds.group_number = g.group_number
'''
[[metric]]
context = "asm_space_consumers"
labels = [ "inst_id", "diskgroup_name", "node_name", "instance_name", "sid", "file_type" ]
metricsdesc = { size_mb = "Total space usage by db by file_type" , files = "Number of files by db by type" }
request = '''
SELECT i.instance_number AS inst_id,
i.host_name AS node_name,
i.instance_name,
gname AS diskgroup_name,
dbname AS sid,
file_type,
ROUND (SUM (space) / 1024 / 1024) size_mb,
COUNT (*) AS files
FROM v$instance i,
(SELECT gname,
REGEXP_SUBSTR (full_alias_path,
'[[:alnum:]_]*',
1,
1) dbname,
file_type,
space,
aname,
system_created,
alias_directory
FROM ( SELECT CONCAT ('+' || gname,
SYS_CONNECT_BY_PATH (aname, '/'))
full_alias_path,
system_created,
alias_directory,
file_type,
space,
LEVEL,
gname,
aname
FROM (SELECT b.name gname,
a.parent_index pindex,
a.name aname,
a.reference_index rindex,
a.system_created,
a.alias_directory,
c.TYPE file_type,
c.space
FROM v$asm_alias a, v$asm_diskgroup b, v$asm_file c
WHERE a.group_number = b.group_number
AND a.group_number = c.group_number(+)
AND a.file_number = c.file_number(+)
AND a.file_incarnation = c.incarnation(+))
START WITH (MOD (pindex, POWER (2, 24))) = 0
AND rindex IN
(SELECT a.reference_index
FROM v$asm_alias a, v$asm_diskgroup b
WHERE a.group_number =
b.group_number
AND (MOD (a.parent_index,
POWER (2, 24))) =
0)
CONNECT BY PRIOR rindex = pindex)
WHERE NOT file_type IS NULL AND system_created = 'Y')
GROUP BY i.instance_number,
i.host_name,
i.instance_name,
gname,
dbname,
file_type
'''
3.4 postgres
参数说明
参数名 | 含义 | 是否必填 | 使用举例 |
---|---|---|---|
DATA_SOURCE_NAME | DSN参数,PostgreSQL数据源的环境变量,包括数据库地址、端口、数据库名、用户和密码等信息。 注意!该参数为环境变量 | 是 | postgresql://user:password@127.0.0.1:5432/postgres?sslmode=disable |
--extend.query-path | 自定义指标采集文件路径 注意!该参数在平台层面为文件参数,进程中该参数值为采集配置文件路径(上传文件即可,平台会补充文件路径)! | 是 | 上传内容满足规范的文件 |
--log.level | 日志级别 | 否 | info |
--web.listen-address | exporter监听id及端口地址 | 否 | 127.0.0.1:9601 |
additional | 额外参数,可留空内容 | 否 | --disable-default-metrics |
注意
一般连接的数据库名都需要填写为 postgres
额外参数说明
额外参数(additional)不需要赋值,只需要填写对应内容,作为采集器的功能或者采集指标的开关,postgreSQL插件支持的额外参数如下:
- 不采集默认指标,只保留自定义指标采集文件中的指标
--disable-default-metrics - 不采集配置(Setting)类,pg_settings前缀开头的指标
--disable-settings-metrics - 不采集后台写入器(Bgwriter)类,pg_stat_bgwriter前缀开头的指标
--no-collector.bgwriter - 不采集复制槽信息,replication_slot前缀开头的指标
--no-collector.replication_slot
自定义查询配置文件
使用自定义查询配置文件 (通过命令行参数 --extend.query-path
设置) 来采集自定义监控指标,下方是内置自定义查询文件的内容:
pg_postmaster: # 指标名前缀,该项下查询得到的指标都会有该前缀名
query: "SELECT pg_postmaster_start_time as start_time_seconds from pg_postmaster_start_time()" # 指标对应执行的sql查询语句
master: true # 这个参数是一个布尔值,设置这个查询是否应该只在主节点上执行。如果为true,则查询只在主节点上执行,否则在所有节点上执行。
metrics: # 指标列表,定义了要公开的指标名称和相应的监控类型
- start_time_seconds: # 指标名
usage: "GAUGE" # 指标类型
description: "Time at which postmaster started" # 指标描述
pg_replication:
query: "SELECT CASE WHEN NOT pg_is_in_recovery() THEN 0 ELSE GREATEST (0, EXTRACT(EPOCH FROM (now() - pg_last_xact_replay_timestamp()))) END AS lag"
master: true
metrics:
- lag:
usage: "GAUGE"
description: "Replication lag behind master in seconds"
pg_stat_statements:
query: "SELECT t2.rolname, t3.datname, queryid, calls, ( total_plan_time + total_exec_time ) / 1000 as total_time_seconds, ( min_plan_time + min_exec_time ) / 1000 as min_time_seconds, ( max_plan_time + max_exec_time ) / 1000 as max_time_seconds, ( mean_plan_time + mean_exec_time ) / 1000 as mean_time_seconds, ( stddev_plan_time + stddev_exec_time ) / 1000 as stddev_time_seconds, rows, shared_blks_hit, shared_blks_read, shared_blks_dirtied, shared_blks_written, local_blks_hit, local_blks_read, local_blks_dirtied, local_blks_written, temp_blks_read, temp_blks_written, blk_read_time / 1000 as blk_read_time_seconds, blk_write_time / 1000 as blk_write_time_seconds FROM pg_stat_statements t1 JOIN pg_roles t2 ON (t1.userid=t2.oid) JOIN pg_database t3 ON (t1.dbid=t3.oid) WHERE t2.rolname != 'rdsadmin' AND queryid IS NOT NULL"
master: true
metrics:
- rolname:
usage: "LABEL"
description: "Name of user"
- datname:
usage: "LABEL"
description: "Name of database"
- queryid:
usage: "LABEL"
description: "Query ID"
- calls:
usage: "COUNTER"
description: "Number of times executed"
- total_time_seconds:
usage: "COUNTER"
description: "Total time spent in the statement, in milliseconds"
- min_time_seconds:
usage: "GAUGE"
description: "Minimum time spent in the statement, in milliseconds"
- max_time_seconds:
usage: "GAUGE"
description: "Maximum time spent in the statement, in milliseconds"
- mean_time_seconds:
usage: "GAUGE"
description: "Mean time spent in the statement, in milliseconds"
- stddev_time_seconds:
usage: "GAUGE"
description: "Population standard deviation of time spent in the statement, in milliseconds"
- rows:
usage: "COUNTER"
description: "Total number of rows retrieved or affected by the statement"
- shared_blks_hit:
usage: "COUNTER"
description: "Total number of shared block cache hits by the statement"
- shared_blks_read:
usage: "COUNTER"
description: "Total number of shared blocks read by the statement"
- shared_blks_dirtied:
usage: "COUNTER"
description: "Total number of shared blocks dirtied by the statement"
- shared_blks_written:
usage: "COUNTER"
description: "Total number of shared blocks written by the statement"
- local_blks_hit:
usage: "COUNTER"
description: "Total number of local block cache hits by the statement"
- local_blks_read:
usage: "COUNTER"
description: "Total number of local blocks read by the statement"
- local_blks_dirtied:
usage: "COUNTER"
description: "Total number of local blocks dirtied by the statement"
- local_blks_written:
usage: "COUNTER"
description: "Total number of local blocks written by the statement"
- temp_blks_read:
usage: "COUNTER"
description: "Total number of temp blocks read by the statement"
- temp_blks_written:
usage: "COUNTER"
description: "Total number of temp blocks written by the statement"
- blk_read_time_seconds:
usage: "COUNTER"
description: "Total time the statement spent reading blocks, in milliseconds (if track_io_timing is enabled, otherwise zero)"
- blk_write_time_seconds:
usage: "COUNTER"
description: "Total time the statement spent writing blocks, in milliseconds (if track_io_timing is enabled, otherwise zero)"
使用指引
连接Postgres数据库 输入连接指令后输入对应的密码即可进入数据库。
psql -U [user] -h [host] -p [port] -d [database]
创建账户及授权
执行下方sql可以创建具有监控权限的账户,用户名weops
,密码Weops123!
。 注意! 数据库版本 >= 10才需要执行GRANT pg_monitor TO weops;
,9.x版本无法执行该授权。CREATE OR REPLACE FUNCTION __tmp_create_user() returns void as $$
BEGIN
IF NOT EXISTS (
SELECT -- SELECT list can stay empty for this
FROM pg_catalog.pg_user
WHERE usename = 'weops') THEN
CREATE USER weops;
END IF;
END;
$$ language plpgsql;
SELECT __tmp_create_user();
DROP FUNCTION __tmp_create_user();
ALTER USER weops WITH PASSWORD 'Weops123!';
ALTER USER weops SET SEARCH_PATH TO weops,pg_catalog;
GRANT CONNECT ON DATABASE postgres TO weops;
GRANT pg_monitor TO weops; -- 数据库版本 >= 10 才需要执行这条sql
CREATE SCHEMA IF NOT EXISTS weops;
GRANT USAGE ON SCHEMA weops TO weops;
CREATE OR REPLACE FUNCTION get_pg_stat_activity() RETURNS SETOF pg_stat_activity AS
$$ SELECT * FROM pg_catalog.pg_stat_activity; $$
LANGUAGE sql
VOLATILE
SECURITY DEFINER;
CREATE OR REPLACE VIEW weops.pg_stat_activity
AS
SELECT * from get_pg_stat_activity();
GRANT SELECT ON weops.pg_stat_activity TO weops;
CREATE OR REPLACE FUNCTION get_pg_stat_replication() RETURNS SETOF pg_stat_replication AS
$$ SELECT * FROM pg_catalog.pg_stat_replication; $$
LANGUAGE sql
VOLATILE
SECURITY DEFINER;
CREATE OR REPLACE VIEW weops.pg_stat_replication
AS
SELECT * FROM get_pg_stat_replication();
GRANT SELECT ON weops.pg_stat_replication TO weops;
CREATE EXTENSION IF NOT EXISTS pg_stat_statements;
CREATE OR REPLACE FUNCTION get_pg_stat_statements() RETURNS SETOF pg_stat_statements AS
$$ SELECT * FROM public.pg_stat_statements; $$
LANGUAGE sql
VOLATILE
SECURITY DEFINER;
CREATE OR REPLACE VIEW weops.pg_stat_statements
AS
SELECT * FROM get_pg_stat_statements();
GRANT SELECT ON weops.pg_stat_statements TO weops;
3.5 Redis
参数说明
参数名 | 含义 | 是否必填 | 使用举例 |
---|---|---|---|
REDIS_USER | 用于身份验证的用户名(环境变量),Redis ACL for Redis 6.0+, 默认为空 | 否 | admin |
REDIS_PASSWORD | redis密码(环境变量),若为空则不填,默认为空 | 否 | 123456 |
-redis.addr | redis 实例地址 | 是 | redis://localhost:6379 |
-include-system-metrics | 是否包含系统指标,比如total_system_memory_bytes, 默认为false | 否 | true |
-is-cluster | 是否集群模式, 默认为false | 是 | false |
-ping-on-connect | 连接后是否ping redis 实例并将持续时间记录为指标,默认为false | 否 | true |
-connection-timeout | 连接到redis的超时时间, 默认为15s | 否 | 15s |
-web.listen-address | exporter监听id及端口地址 | 否 | 127.0.0.1:9601 |
使用指引
验证redis密码
./redis-cli -h redis地址 -p 端口号
./redis-cli -h 127.0.0.1 -p 6379
# 进入后会出现 127.0.0.1:6379>
# 在右侧输入AUTH 密码, 如果正确会返回OK, 下面是一些示例
root@5a3f395bab17:/usr/local/bin# ./redis-cli -h 127.0.0.1 -p 6379 -a wsbs201712
Warning: Using a password with '-a' or '-u' option on the command line interface may not be safe.
127.0.0.1:6379>
127.0.0.1:6379> AUTH 1234567
(error) ERR invalid password
127.0.0.1:6379> AUTH 123456
OK
127.0.0.1:6379> config get requirepass
1) "requirepass"
2) "123456"查看redis密码 方法1: 通过redis-cli进入redis后执行config get requirepass命令
# 返回示例,密码为空
127.0.0.1:6379> config get requirepass
1) "requirepass"
2) ""
# 返回示例,密码不为空
127.0.0.1:6379> config get requirepass
(error) NOAUTH Authentication required.方法2: 寻找Redis的配置文件, 默认在/etc/redis.conf,找到字样"requirepass" requirepass redis密码
3.6 MongoDB
参数说明
参数名 | 含义 | 是否必填 | 使用举例 |
---|---|---|---|
MONGODB_URI | mongodb URI参数,在连接mongodb时,需要提供一个连接字符串,例如: mongodb://username:password@host:port/database_name 注意!该参数为环境变量 | 是 | mongodb://weops:Weops123@127.0.0.1:27017/weops |
--collect-all | 是否采集所有collectors的指标,默认采集所有 | 是 | true |
--timeout | 连接mongodb超时时间(seconds), 默认为10s | 否 | 5 |
--log.level | 日志级别 | 否 | info |
--web.listen-address | exporter监听id及端口地址 | 否 | 127.0.0.1:9601 |
- 额外参数说明
,mongoDB插件支持的额外参数如下:
- collect-all默认使用采集以下所有collector指标,如果不需要采集所有,可选择赋值--collect-all=false并单独启用以下的collector, 若启用则赋值true
--collector.diagnosticdata: getDiagnosticData类指标
--collector.replicasetstatus: replSetGetStatus类指标
--collector.dbstats: dbStats类指标
--collector.topmetrics: top admin command类指标
--collector.indexstats: $indexStats类指标
--collector.collstats: $collStats类指标
使用指引
连接mongoDB
输入连接指令后输入对应的账户配置即可进入。有多种方式进入MongoDB,下面列出常用的使用方式
# 常用
mongo -u [username] -p [password] --host [host] --port [port]
# 连接MongoDB并指定端口
mongo 127.0.0.1:27017
# 使用用户名和密码连接到指定的MongoDB数据库
mongo 127.0.0.1:27017/test -u [username] -p [password]如果没有mongo命令,可尝试使用mongosh命令,具体使用方式与上面mongo连接命令方式一致,MongoDB Shell下载地址: https://www.mongodb.com/try/download/shell
创建账户及授权
需要注意auth授权的账户密码是管理员, 创建的用户是新的账户密码
管理员授权命令若失败,可尝试直接创建账户,一般管理员为admin
创建账户
创建在admin下的账户use admin;
db.auth('admin', '管理员密码');
db.createUser({
user: 'weops',
pwd: 'Weops123',
roles: [{ role: 'read', db: 'admin' }, 'clusterMonitor'],
mechanisms: ['SCRAM-SHA-256']
});创建在其他数据库下的账号
use admin;
db.auth('admin', '管理员密码');
use weops;
db.createUser({
user: 'weops',
pwd: 'Weops123',
roles: [{ role: 'read', db: 'weops' }],
mechanisms: ['SCRAM-SHA-256']
});
db.grantRolesToUser('weops', [{ role: 'clusterMonitor', db: 'admin' }]);需要注意mongodb的版本,
mechanisms: ['SCRAM-SHA-256']
身份认证一般用于 >= 4.0, 若mongodb < 4.0 (比如3.6), 那么可以去掉mechanisms: ['SCRAM-SHA-256']
, 或者使用mechanisms: ['SCRAM-SHA-1']
mongo相关命令指引
查询特定数据库下的用户属性
use weops;
db.getUser('weops');
# 执行命令返回的用户信息
{
"_id" : "weops.weops",
"userId" : UUID("2a14dcf6-fd72-4247-9a45-092ea128c775"),
"user" : "weops",
"db" : "weops",
"roles" : [
{
"role" : "read",
"db" : "weops"
},
{
"role" : "clusterMonitor",
"db" : "admin"
}
],
"mechanisms" : [
"SCRAM-SHA-256"
]
}
查看全局所有用户
db.system.users.find().pretty();
查看所有数据库
show dbs;
3.7 IIS
参数说明
IIS exporter采集目前只可以设置日志级别参数,直接下发到windows服务器即可。
使用指引
- 检查 IIS 服务是否已启动:
- 打开 IIS 管理器:
直接进入 IIS 管理器:
在计算机中搜索并运行 "IIS 管理器"。选择你的服务器,然后在左侧面板中展开 "服务器名",选择 "应用程序池",在右侧窗口中查看应用程序池的状态。
使用服务器管理器进入 IIS 管理器: 使用开始菜单或搜索栏找到 "服务器管理器" 并打开。打开 "服务器管理器",在左侧面板中选择 "IIS"。右键点击你的服务器,选择 "InternetInformation Services (IIS) 管理器"。
- 检查应用程序池和网站状态:
在 IIS 管理器中,展开 "服务器名",然后选择 "应用程序池"。在应用程序池窗口内查看应用程序池的状态。同时,选择 "网站",然后右键点击网站,在管理网站选项中查看是否已启动。
- 验证 IIS 服务是否启动:
在浏览器中输入默认的 IIS 服务地址:http://127.0.0.1。如果 IIS 服务已启动并运行,你应该会看到 "Internet Information Services" 或类似的内 容页面。否则,可能会显示连接错误或无法访问页面。
- 检查性能计数器 Get-Counter '\Web Service(_total)*' 此命令将返回有关IIS Web服务的总体性能计数器信息
3.8 AD
使用说明
AD Exporter用于采集Windows Active Directory域控制器的指标,通过 Windows Management Instrumentation (WMI) 提供的接口来采集数据。
版本支持
操作系统支持: windows
是否支持arm: 否
组件支持版本:
可以在支持 WMI 的 Windows 操作系统上采集数据。
是否支持远程采集:
否
参数说明
AD exporter采集目前只可以设置日志级别参数,直接下发到windows服务器即可。
3.9 Exchange
使用说明
Windows Exchange Exporter用于采集Windows Exchange的指标,通过 Windows Management Instrumentation (WMI) 提供的接口来采集数据。
版本支持
操作系统支持: windows
是否支持arm: 否
组件支持版本:
可以在支持 WMI 的 Windows 操作系统上采集数据。
是否支持远程采集:
否
参数说明
Exchange exporter采集目前只可以设置日志级别参数,直接下发到windows服务器即可。
3.10 ElasticSearch
使用说明
版本支持
操作系统支持: linux, windows
是否支持arm: 支持
组件支持版本:
elasticsearch版本: 5.x, 6.x, 7.x, 8.x 部署模式支持: 单机(Standalone), 集群(Cluster)
是否支持远程采集:
是
参数说明
参数名 | 含义 | 是否必填 | 使用举例 |
---|---|---|---|
ES_USERNAME | elasticsearch账户名, 填入则会覆盖uri中的账户, 特殊字符不需要转义 | 否 | weops |
ES_PASSWORD | elasticsearch密码, 填入则会覆盖uri中的密码, 特殊字符不需要转义 | 否 | Weops@123 |
--es.uri | elasticsearch访问地址, 注意区分http和https, uri中的账户密码特殊字符需要转义 | 是 | http://127.0.0.1:9200 |
--es.all | 全节点采集开关(开关参数), 如果打开则采集集群中所有节点, 否则只采集填写的连接地址的节点数据, 默认关闭 | 是 | |
--es.ssl-skip-verify | 跳过SSL认证开关(开关参数), 如果打开则跳过SSL认证, 默认关闭 | 是 | |
--es.indices | 索引采集开关(开关参数), 如果打开则采集所有在集群中的索引, 默认关闭 | 否 | |
--es.indices_settings | 索引配置采集开关(开关参数), 如果打开则采集所有在集群中的索引配置信息, 默认关闭 | 否 | |
--es.indices_mappings | 索引映射采集开关(开关参数), 如果打开则采集所有在集群中的索引映射信息, 默认关闭 | 否 | |
--es.shards | 分片采集开关(开关参数), 如果打开则采集所有在集群中的分片信息, 默认关闭 | 否 | |
--es.slm | 快照管理采集开关(开关参数), 如果打开则采集快照管理信息, 默认关闭 | 否 | |
--collector.clustersettings | 集群配置采集开关(开关参数), 如果打开则采集集群配置信息, 默认关闭 | 否 | |
--collector.snapshots | 快照采集开关(开关参数), 如果打开则采集快照信息, 默认关闭 | 否 | |
--es.clusterinfo.interval | 集群配置信息更新时间间隔,默认5m | 否 | 5m |
--es.timeout | 连接elasticsearch超时时间, 默认5s | 否 | 5s |
--web.listen-address | exporter监听id及端口地址 | 否 | 127.0.0.1:9601 |
--log.level | 日志级别 | 否 | info |
使用指引
- 配置监控账户 示例:
设置 | 所需权限 | 描述 |
---|---|---|
exporter defaults | cluster monitor | 所有集群的只读操作,如集群健康和状态、热线程、节点信息、节点和集群统计以及待处理的集群任务。 |
cluster_settings | cluster monitor | |
indices | indices monitor | 所有监控所需的操作(恢复、段信息、索引统计和状态)。 可对每个索引或 *(通配符)应用此权限。 |
indices_settings | indices monitor | 可对每个索引或 *(通配符)应用此权限。 |
indices_mappings | indices view_index_metadata | 可对每个索引或 *(通配符)应用此权限。 |
shards | 不确定是indices、cluster monitor还是两者都是 | |
snapshots | cluster:admin/snapshot/status 和 cluster:admin/repository/get | ES Forum Post |
slm | read_slm | |
data_stream | monitor 或 manage | 可对每个数据流或 *(通配符)应用此权限。 |
不同版本的elasticsearch配置监控账户的方式和可配置权限不同,具体可参考官方文档
- 采集参数
探针每次从 Elasticsearch 服务抓取监控指标时都会获取新的信息。
因此,需要注意频繁的采集频率可能会对 Elasticsearch 服务造成过大的压力,
特别是当打开了
--es.all
和--es.indices
的采集开关。 建议首先测量从/_nodes/stats
和/_all/_stats
获取数据所需的时间,然后根据实际情况来调整采集频率。
3.11 Kafka
使用说明
插件功能 连接到Kafka,获取与主题、消费者组以及其他相关数据。帮助用户监控Kafka健康状态、性能指标以及消费者行为。
版本支持
操作系统支持: linux, windows
是否支持arm: 支持
组件支持版本:
kafka版本: >= 0.10.1.0 部署模式支持: 单机(Standalone), 集群(Cluster)
是否支持远程采集:
是
参数说明
参数名 | 含义 | 是否必填 | 使用举例 |
---|---|---|---|
--kafka.server | kafka服务主机ip:服务端口,若为集群,也请填写单个ip和服务端口 | 是 | 127.0.0.1:9092 |
--kafka.version | kafka服务版本 | 是 | 0.10.1.0 |
--sasl.enabled | SASL认证开关(开关参数) | 是 | |
SASL_USERNAME | kafka SASL用户名(环境变量) | 是 | weops |
SASL_PASSWORD | kafka SASL用户的密码(环境变量) | 是 | weops123 |
SASL_MECHANISM | kafka SASL机制(环境变量),若不开启SASL则填空,否则可填plain、scram-sha512、scram-sha256 | 否 | plain |
TOPIC_FILTER | 筛选并留下含有正则关键字的主题(环境变量),默认不过滤 | 是 | .* |
TOPIC_EXCLUDE | 筛选并排除含有正则关键字的主题(环境变量),默认不过滤 | 是 | ^$ |
GROUP_FILTER | 筛选并留下含有正则关键字的消费者组(环境变量),默认不过滤 | 是 | .* |
GROUP_EXCLUDE | 筛选并排除含有正则关键字的消费者组(环境变量),默认不过滤 | 是 | ^$ |
--verbosity | 日志级别,默认为0,0(ERROR级别),1(INFO级别),(DEBUG级别) | 否 | 0 |
--web.listen-address | exporter监听id及端口地址 | 否 | 127.0.0.1:9601 |
使用指引
查看kafka版本 有以下几种方式:
- 进入kafka安装目录,比如
/opt/kafka_2.11-0.11.0.3/bin
,那么该kafka版本为0.11.0.3
- 进入kafka目录,比如
/opt/kafka/libs
,该路径底下的包会含有版本信息,比如kafka_2.12-0.10.2.0.jar
,那么该kafka版本为0.10.2.0
- 进入kafka安装目录,比如
主题和消费者组过滤选项 支持主题和消费者组的过滤,需要注意如果主题过多或者在集群的模式下,可能监控获取到的数据量会较大,指标抓取时长会增加并且会占用较多的cpu资源, 一般建议缩小监控的主题和消费者组范围,减少指标抓取时长和资源占用。若需要全部数据,注意要增加抓取时长等待时间(采集任务采集周期)。
3.12 Tomcat
使用说明
通过抓取和公开JMX目标的mBeans来收集有关应用程序的度量数据,并将这些度量数据转换为Prometheus监控指标格式。
版本支持
操作系统支持: linux, windows
是否支持arm: 支持
组件支持版本:
tomcat版本: 6.x, 7.x, 8.x, 9.x, 10.x
是否支持远程采集:
是
参数说明
参数名 | 含义 | 是否必填 | 使用举例 |
---|---|---|---|
host | 监听IP(采集器IP),建议使用默认的127.0.0.1 | 是 | 127.0.0.1 |
port | 监听端口(采集器监听端口),一般为9601,注意不要与已使用端口冲突 | 是 | 9601 |
username | jmx认证用户名,若未配置则留空 | 否 | |
password | jmx认证密码,若未配置则留空 | 否 | |
jmx_url | jmx 连接字符串,格式为service:jmx:rmi:///jndi/rmi://${target_host}:${target_port}/jmxrmi | 是 | service:jmx:rmi:///jndi/rmi://127.0.0.1:1234/jmxrmi |
使用指引
配置tomcat jmx参数
打开tomcat的bin目录下的catalina.sh文件
在文件中找到CATALINA_OPTS变量,添加如下参数
-Dcom.sun.management.jmxremote
-Dcom.sun.management.jmxremote.port=1234
-Dcom.sun.management.jmxremote.ssl=false
-Dcom.sun.management.jmxremote.authenticate=false例如:
CATALINA_OPTS="$CATALINA_OPTS -Dcom.sun.management.jmxremote -Djava.rmi.server.hostname=192.168.1.1 -Dcom.sun.management.jmxremote.port=1234 -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false"
配置JMX的账号密码验证(选择性):
CATALINA_OPTS="$CATALINA_OPTS -Dcom.sun.management.jmxremote -Djava.rmi.server.hostname=192.168.1.1 -Dcom.sun.management.jmxremote.port=1234 -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=true -Dcom.sun.management.jmxremote.access.file=./jmx.access -Dcom.sun.management.jmxremote.password.file=./jmx.password"
jmx.access文件内容参考:
#用户名 权限
monitor readonlyjmx.password参考内容:
注意:若无法启动tomcat则建议修改jmx.password文件的权限,权限设置为400或600
#用户名 密码
monitor monitor重启tomcat
验证jmx端口是否生效:
netstat -antlp |grep 1234
3.13 Apache
使用说明
向Apache服务器的server-status模块页面发送请求,获取服务器的运行状态信息。
版本支持
操作系统支持: linux, windows
是否支持arm: 支持
组件支持版本:
Apache版本: 2.2, 2.4
是否支持远程采集:
是
参数说明
参数名 | 含义 | 是否必填 | 使用举例 |
---|---|---|---|
SCRAPE_URI | apache server-status模块访问地址(环境变量),如果有http auth则使用http://user:password@localhost/server-status?auto | 是 | http://localhost/server-status/?auto |
--web.listen-address | exporter监听id及端口地址 | 否 | 127.0.0.1:9601 |
--log.level | 日志级别 | 否 | info |
使用指引
配置server-status 默认配置文件存放于
/etc/httpd/conf/httpd.conf
需要先检查是否开启mod_status模块,检查文件内容是否含有LoadModule status_module modules/mod_status.so
,若没有则需要手动添加 开启模块后,在文件末尾添加以下内容,若已存在则修改对应配置ExtendedStatus On # 开启ExtendedStatus
<Location /server-status> # server-status服务地址,按需配置
SetHandler server-status # 开启server-status服务
Deny from all # 禁止任何来源访问,按需配置
Allow from 127.0.0.1 # 允许指定IP访问
</Location>修改后使用
apachectl -t
检查配置文件内容是否正确,如果正确会返回Syntax OK
,否则会返回错误信息注意: 配置更改后需要重启服务,使用
apachectl graceful
重启apache服务不会中断原有连接验证server-status 配置完成后,使用
curl http://localhost/server-status?auto
验证server-status是否正常工作,如果正常会返回以下内容Total Accesses: 1
Total kBytes: 0
CPULoad: .000797
Uptime: 884
ReqPerSec: .00113208
BytesPerSec: .000797
BytesPerReq: 702.5
BusyWorkers: 1
IdleWorkers: 7
Scoreboard: _W_______如果返回
Forbidden
,则需要检查配置文件中的Allow from
是否正确配置,如果返回Not Found
,则需要检查配置文件中的Location
是否正确配置
4、告警源插件说明
序号 | 告警源插件 | 版本 |
---|---|---|
1 | REST API | 无需版本适配 |
2 | VCenter | 5.5及以上 |
3 | 华为云 | |
4 | 阿里云 | |
5 | 腾讯云 | |
6 | 听云 | |
6 | Zabbix | 3.X、4.X、5.X |
7 | Prometheus | 2.15 |
8 | 日志易 | 3.6 |
9 | H3C-IMC | |
10 | 华为esight系统 | |
11 | 绿盟日志审计系统 | V2.0 |
5、日志内容说明
5.1 日志探针说明
Weops支持日志探针管理和安装,并内置探针对应的配置文件模板详情如下,若查看更加详细内容可下载表格WeOps内置日志探针说明
序号 | 探针名称 | 探针说明 | 内置模板 |
---|---|---|---|
1 | Filebeat | 能够采集操作系统中的任意日志文件。 | 1、自定义模板 2、内置模板:ActiveMQ 、Coredns 、Elasticsearch、IIS、Kafka、mongodb、mssql、MySQL、Nginx、Oracle、PostgreSQL、RabbitMQ、Redis、Apache Tomcat |
2 | Packetbeat | 能够采集操作系统中的流量数据 | 1、自定义模板 2、内置模板:AMQP、Cassandra、DHCPv4、DNS、HTTP、ICMP、Memcache、MongoDb、MySQL、NFS、PostgreSQL(pgSQL)、Redis、SIP、Thrift-RPC、Detailed TLS |
3 | Auditbeat | 能够监听文件或操作系统的变更动态,例如文件发生了修改、用户登录了操作系统等。 | 1、自定义模板 2、内置模板:文件变化日志、系统变更日志 |
4 | Metricbeat | 轻量级的指标收集器,用于监控和收集系统和应用程序的指标数据 | 1、自定义模板 2、内置模板:system指标日志、Window指标日志、linux指标日志、docker指标日志 |
5 | Winlogbeat | 能够采集Windows事件 | 1、自定义模板 2、内置模板:应用程序日志、安全事件日志、系统事件日志 |
6 | Uniprobe | 与packetbeat功能类似,额外具备http请求的响应延迟、操作系统的网络环境质量等数据 | 1、自定义模板 |
5.2 日志提取器说明
WeOps支持的提取器如下表
提取器名称 | 适用 | 说明 |
---|---|---|
复制输入 | 适用于需要从非结构化的日志数据中提取特定字段或值的场景。 | 将原始消息中的一部分数据复制到提取器的规则中,并将其存储在结构化的数据字段中 |
Grok模式 | 适用于需要从非结构化的日志数据中提取特定字段或值的场景。 | 用于从非结构化的日志数据中提取结构化数据。它使用预定义的Grok模式或自定义Grok模式来匹配和提取数据,包括一些特殊的模式,用于匹配常见的数据格式,如IP地址、日期、时间戳等。(WeOps内置常用的Grok表达式)(Grok表达式是一种用于解析非结构化或半结构化数据的模式匹配工具。它是由Elasticsearch社区开发的一种基于正则表达式的模式匹配语言) |
JSON | 适用于处理JSON格式的日志数据的场景。 | 可以从JSON格式的数据中提取特定的字段,并将它们存储在结构化的数据字段中。 |
正则表达式 | 适用于需要从未结构化的日志数据中提取特定字段或值的场景。 | 使用正则表达式从数据中提取特定的字段,并将它们存储在结构化的数据字段中 |
正则表达式替换 | 适用于需要替换日志数据中特定字符串的场景。 | 正则表达式替换器可以使用正则表达式从数据中匹配特定的模式,并将其替换为指定的字符串 |
分隔 | 适用于需要从日志数据中提取特定字段或值的场景。 | 使用指定的分隔符将数据分割成多个部分,并将它们存储在结构化的数据字段中 |
子窜捕获 | 适用于需要从日志数据中提取特定子字符串的场景。 | 使用指定的开始和结束字符串或位置来捕获数据中的子串,并将它们存储在结构化的数据字段中 |
6、APM内容说明
6.1 APM应用服务接入支持框架说明
WeOps目前封装支持两类开发语言,java和python,具体的框架如下
(1)Java
库/框架 | 支持版本 |
---|---|
Akka Actors | 2.5+ |
Akka HTTP | 10.0+ |
Apache Axis2 | 1.6+ |
Apache Camel | 2.20+ (不包括3.x) |
Apache DBCP | 2.0+ |
Apache CXF JAX-RS | 3.2+ |
Apache CXF JAX-WS | 3.0+ |
Apache Dubbo | 2.7+ |
Apache HttpAsyncClient | 4.1+ |
Apache HttpClient | 2.0+ |
Apache Kafka Producer/Consumer API | 0.11+ |
Apache Kafka Streams API | 0.11+ |
Apache MyFaces | 1.2+ (不包括3.x) |
Apache Pulsar | 2.8+ |
Apache RocketMQ gRPC/Protobuf-based Client | 5.0.0+ |
Apache RocketMQ Remoting-based Client | 4.8+ |
Apache Struts 2 | 2.3+ |
Apache Tapestry | 5.4+ |
Apache Wicket | 8.0+ |
Armeria | 1.3+ |
AsyncHttpClient | 1.9+ |
AWS Lambda | 1.0+ |
AWS SDK | 1.11.x和2.2.0+ |
Azure Core | 1.14+ |
Cassandra Driver | 3.0+ |
Couchbase Client | 2.0+和3.1+ |
c3p0 | 0.9.2+ |
Dropwizard Metrics | 4.0+ (默认禁用) |
Dropwizard Views | 0.7+ |
Eclipse Grizzly | 2.3+ |
Eclipse Jersey | 2.0+ (不包括3.x) |
Eclipse Jetty HTTP Client | 9.2+ (不包括10+) |
Eclipse Metro | 2.2+ (不包括3.x) |
Eclipse Mojarra | 1.2+ (不包括3.x) |
Elasticsearch API Client | 7.16+和8.0+ |
Elasticsearch REST Client | 5.0+ |
Elasticsearch Transport Client | 5.0+ |
Finatra | 2.9+ |
Geode Client | 1.4+ |
Google HTTP Client | 1.19+ |
Grails | 3.0+ |
GraphQL Java | 12.0+ |
gRPC | 1.6+ |
Guava ListenableFuture | 10.0+ |
GWT | 2.0+ |
Hibernate | 3.3+ (not including 6.x yet) |
HikariCP | 3.0+ |
HttpURLConnection Java | 8+ |
Hystrix | 1.4+ |
Java Executors | Java 8+ |
Java Http Client | Java 11+ |
java.util.logging | Java 8+ |
Java Platform | Java 8+ |
JAX-RS | 0.5+ |
JAX-RS Client | 1.1+ |
JAX-WS | 2.0+ (not including 3.x yet) |
JBoss Log Manager | 1.1+ |
JDBC | Java 8+ |
Jedis | 1.4+ |
JMS | 1.1+ |
Jodd Http | 4.2+ |
JSP | 2.3+ |
Kotlin Coroutines | 1.0+ |
Ktor | 1.0+ |
Kubernetes Client | 7.0+ |
Lettuce | 4.0+ |
Log4j 1 | 1.2+ |
Log4j 2 | 2.11+ |
Logback | 1.0+ |
Micrometer | 1.5+ |
MongoDB Driver | 3.1+ |
Netty | 3.8+ |
OkHttp | 2.2+ |
Oracle UCP | 11.2+ |
OSHI | 5.3.1+ |
Play | 2.4+ |
Play WS | 1.0+ |
Quartz | 2.0+ |
R2DBC | 1.0+ |
RabbitMQ Client | 2.7+ |
Ratpack | 1.4+ |
Reactor | 3.1+ |
Reactor Netty | 0.9+ |
Rediscala | 1.8+ |
Redisson | 3.0+ |
RESTEasy | 3.0+ |
Restlet | 1.0+ |
RMI Java | 8+ |
RxJava | 1.0+ |
Scala ForkJoinPool | 2.8+ |
Servlet | 2.2+ |
Spark Web Framework | 2.3+ |
Spring Boot | |
Spring Batch | 3.0+ (not including 5.0+ yet) |
Spring Data | 1.8+ |
Spring Integration | 4.1+ (not including 6.0+ yet) |
Spring JMS | 2.0+ |
Spring Kafka | 2.7+ |
Spring RabbitMQ | 1.0+ |
Spring Scheduling | 3.1+ |
Spring RestTemplate | 3.1+ |
Spring Web MVC | 3.1+ |
Spring Web Services | 2.0+ |
Spring WebFlux | 5.3+ |
Spymemcached | 2.12+ |
Tomcat JDBC Pool | 8.5.0+ |
Twilio | 6.6+ (not including 8.x yet) |
Undertow | 1.4+ |
Vaadin | 14.2+ |
Vert.x Web | 3.0+ |
Vert.x HttpClient | 3.0+ |
Vert.x Kafka Client | 3.6+ |
Vert.x RxJava2 | 3.5+ |
Vert.x SQL Client | 4.0+ |
Vibur DBCP | 11.0+ |
ZIO | 2.0.0+ |
(2)python
库/框架 |
---|
aio_pika |
aiohttp_client |
aiopg |
asgi |
asyncpg |
aws_lambda |
base |
boto |
boto3sqs |
botocore |
celery |
confluent_kafka |
dbapi |
django |
elasticsearch |
falcon |
fastapi |
flask |
grpc |
httpx |
jinja2 |
kafka_python |
logging |
mysql |
mysqlclient |
pika |
psycopg2 |
pymemcache |
pymongo |
pymysql |
pyramid |
redis |
remoulade |
requests |
sqlalchemy |
sqlite3 |
starlette |
system_metrics |
tornado |
tortoiseorm |
urllib |
urllib3 |
wsgi |
(3)其他
库/框架 |
---|
Node.js |
TypeScript |
7、仪表盘说明
7.1 仪表盘说明
序号 | 仪表盘名称 | 关键指标 |
---|---|---|
1 | 单主机运行状态 | CPU使用率、应用内存可用率、磁盘空间使用率、1分钟系统负载、系统进程数、磁盘IO使用率、当前连接数、网卡出流量、网卡入流量、可用inode数量 |
2 | 应用主机运行状态 | CPU使用率、内存剩余空间、磁盘空间使用率、5分钟系统负载、磁盘IO使用率、当前连接数、网卡出流量、网卡入流量 |
3 | Oracle监控 | 数据库状态、服务器CPU使用率、服务器内存使用率、进程使用率、活跃用户会话数、阻塞超过3分钟个数、软解析率、PGA使用率、SGA使用率、SharePool使用率、缓冲区命中率、表空间使用率、Top5等待事件及数量、ASM磁盘状态、ASM磁盘使用率、ScanIP监听状态、redolog1小时内切换次数、VIP监听状态、归档日志空间使用率 |
4 | MySQL监控 | 服务器CPU使用率、服务器内存使用率、数据文件所在空间使用率、binlog日志所在空间使用率、当前已连接的线程数、查询缓存命中率、每分钟执行语句的次数、每分钟查询次数、每分钟慢查询的次数、InnoDB缓冲池的使用率、InnoDB每分钟写日志请求数、主从同步状态、主从延迟时间、线程使用率 |
5 | MSSQL监控 | 用户连接数、作业执行状态、数据库缓存页面数、每秒连接错误数、服务器CPU使用率、服务器内存使用率、数据库连接数、平均磁盘队列长度、缓冲区命中率、阻塞进程数、等待内存授予的进程数、数据库文件使用率、数据库日志文件使用率、每秒刷新的脏页数、每秒全表扫描数、每秒惰性写入、排队等待物理磁盘的物理读写请求的平均数、每秒锁等待数、每秒锁超时数、每秒等待内存页I/O锁的时间 |
6 | Redis监控仪表盘 | redis可用性、内存碎片率、Redis分配器分配的内存总量、客户端连接数、拒绝的连接数、退出的秘钥数量、过期的密钥总数、keyspace命中成功率、每秒处理命令数、每秒输入字节数、每秒输出字节数、服务器CPU使用率、服务器内存使用率、数据占用的内存大小的百分比 |
7 | Apache监控仪表盘 | Apache状态、运行时间、忙碌的worker数、空闲的worker数、服务器CPU使用率、服务器内存使用率、进程IO写速率、进程IO读速率、不同状态计分版数量统计、每个请求的字节数、每秒传输的字节数、每分钟平均请求数 |
8 | Tomcat监控仪盘 | 活动连接数、会话数、全局请求数、线程数、堵塞线程数、接收的流量、发送的流量、过期会话数、错误请求数、线程池状态、服务器CPU使用率、服务器内存使用率 |
9 | Nginx监控仪盘 | Nginx监控状态、正在处理的活跃的连接数、驻留(等待)等待连接数、每分钟成功握手次数、服务器CPU使用率、服务器内存使用率、读连接数、写连接数、每分钟成功处理请求数、每分钟处理未丢失的请求数 |
7.2 仪表盘各个组件说明
所属模块 | 组件名称 | 作用 | 支持的配置 |
---|---|---|---|
监控 | 仪表盘 | 展示指定时间范围内,该监控指标的最近数值 | 1、配置需要展示的监控指标 2、可以根据选择的维度汇聚方式展示“最大值”“最小值”“平均值”“累加值”“维度数量” 3、支持配置仪表盘展示的最大值/最小值,支持选择各个阈值的配色 |
监控 | 单值 | 展示指定时间范围内,该监控指标的最近数值 | 1、配置需要展示的监控指标 2、可以根据选择的维度汇聚方式展示“最大值”“最小值”“平均值”“累加值”“维度数量” |
监控 | 饼形图 | 指定时间范围内,该监控指标的最近数值,每个饼状图代表一项资产,若有多维度则展示百分比 | 1、配置需要展示的监控指标 |
监控 | 柱状图 | 展示指定时间范围内,该监控指标的最近数值;柱状图的每一簇代表一项资产,若资产有多维度,则展示多条 | 1、配置需要展示的监控指标 |
监控 | 折线图 | 以时间为横坐标展示指定时间内该监控指标的数值变化,多资产和多维度都在用一个折线图中展示 | 1、配置需要展示的监控指标 2、支持配置阈值线 3、支持配置是否面积填充 |
资产 | 资产表格 | 展示选中的资产基本配置信息 | 1、支持配置所有资产管理的资产 2、支持选择展示的字段 3、对于枚举型字段等特殊字段,支持筛选/排序等操作 |
自动化 | 运维工具 | 展示/执行各个运维工具 | 1、配置展示不同的运维工具 2、在仪表盘直接使用该工具对选中的资产进行操作,并展示执行结果 |
日志 | 日志消息 | 展示日志的原始消息 | 1、配置搜索条件 2、配置展示字段 3、支持配置某个字段的升序/降序 |
日志 | 单值 | 展示单个数值或统计结果,最近数据的第一个值 | 1、配置分组和度量,确定统计的角度和值 2、设置趋势:越大越好、越小越好,普通 |
日志 | 表格 | 以表格的形式展示各个分组的度量统计数值 | 1、配置搜索语句 2、配置分组和度量,确定统计的角度和值 3、配置排序,分组和度量的字段可以设置排序 |
日志 | 饼形图 | 按照特定度量字段,统计各个分组该度量值所占的百分比 | 1、配置搜索语句 2、配置分组和度量,确定统计的角度和值 3、配置排序,分组和度量的字段可以设置排序 |
日志 | 折线图 | 用于展示统计数据的变化趋势,比如随时间的变化趋势 | 1、配置搜索语句 2、配置分组和度量,确定统计的角度和值 3、配置排序,分组和度量的字段可以设置排序 |
日志 | 柱状图 | 以柱形图展示日志数据,展示各个分组的度量值 | 1、配置搜索语句 2、配置分组和度量,确定统计的角度和值 3、配置排序,分组和度量的字段可以设置排序 4、支持设置堆叠/分组模式 |
日志 | 地图 | 以地图的形式展示IP地址的地域分布情况 | 1、配置搜索语句 2、选择中国地图/世界地图 3、配置地域字段 4、支持阈值配色 |
高级 | 单值 | 填写Trino语句,获取对应数据后,以单值形式呈现 | 1、填写Trino语句 |
高级 | 折线图 | 填写Trino语句,获取对应数据后,以折线图形式呈现 | 1、填写Trino语句 2、配置X轴、Y轴展示的数值和维度数值 |
高级 | 饼形图 | 填写Trino语句,获取对应数据后,以饼形图形式呈现 | 1、填写Trino语句 2、配置分组(组别)和度量值 |
高级 | 柱状图 | 填写Trino语句,获取对应数据后,以柱状图形式呈现 | 1、填写Trino语句 2、配置X轴、Y轴展示的数值和维度数值 |
高级 | 表格 | 填写Trino语句,获取对应数据后,以表格形式呈现 | 1、填写Trino语句 |
高级 | 流量拓扑 | 填写Trino语句,获取对应数据后,以流量拓扑形式呈现 | 1、填写Trino语句 2、配置源对象和目标对象 3、配置连线数值和阈值配色 |
高级 | 桑基图 | 填写Trino语句,获取对应数据后,以桑基图形式呈现 | 1、填写Trino语句 2、配置源对象、目标对象和度量值 |
8、健康扫描包说明
共内置11个扫描包,各个扫描包的介绍和相关指标见下表
序号 | 扫描包名称 | 对象 | 操作系统 | 检查项数量 | 检查项 |
---|---|---|---|---|---|
1 | 基础健康检查-Windows | 主机 | Windows | 10 | Windows是否激活、内存可用大小、磁盘空间使用率(Windows)、磁盘可用空间(Windows)、磁盘IO读速率、磁盘IO写速率、DCP时间百分比、处理器队列长度、逻辑磁盘队列长度、每秒页面错误数 |
2 | 基础健康检查-Linux | 主机 | Linux | 8 | 磁盘空间使用率(Linux)、磁盘可用空间(Linux)、交换空间使用率、iNode可用大小、iNode使用率、僵尸进程数、TIME_WAIT状态的连接数、passwd文件权限 |
3 | 基础健康检查-ActiveDirectory | ActiveDirectory | 4 | AD数据库文件盘可用空间、AD数据库日志文件盘可用空间、AD健康性检查、时间偏差检查 | |
4 | 基础健康检查-ExchangeServer | ExchangeServer(支持系统为Exchange Server 2016/2019的邮箱角色) | 22 | 关键服务测试、活动目录连接测试、ActiveSync连接测试、Ecp连接测试、Imap连接测试、Owa连接测试、Pop连接测试、Outlook连接测试、Smtp连接测试、复制健康性测试、数据包出站错误、数据库平均读延迟、数据库平均写延迟、数据库日志平均读延迟、数据库日志平均写延迟、应用重启次数、工作进程重启次数、应用队列中的请求数、RPC请求数(信息存储进程)、RPC平均延迟(客户端协议)、RPC平均延迟(数据库)、证书过期时间 | |
5 | 基础健康检查- MSSQL(Windows) | MSSQL | Windows | 26 | 缓冲区命中率、磁盘空间使用率、可用连接数、MSSQL内存可用大小、阻塞源会话(近一个小时)、死锁情况(近一个小时)、长事务(TOP5)、页生存周期、实例内存使用情况、数据库使用内存、可用线程数、资源等待Top5、磁盘队列数、群集资源状态、群集网络状态、群集仲裁状态、AlwaysOn同步健康状态、AlwaysOn发送队列大小、AlwaysOn重做队列大小、AlwaysOn重做延迟时长、文件组可用大小、错误日志磁盘可用大小、作业执行失败Top20、最近备份时间、SQL代理服务启动方式、最近完整备份时间 |
6 | 基础健康检查- MySQL(Windows) | MySQL | Windows | 17 | InnoDB缓冲区命中率、每秒查询数、每秒事务数、每秒全表扫描数量、慢查询数量、数据空间使用率、Binlog日志空间使用率、不能立即获得表锁次数、InnoDB行锁次数、可用连接数、数据文件总大小、InnoDB缓存池可用大小、锁等待数量、操作系统CPU使用率、操作系统内存使用率、操作系统内存可用大小、操作系统交换空间使用率 |
7 | 基础健康检查- MySQL(Linux) | MySQL | Linux | 17 | InnoDB缓冲区命中率、每秒查询数、每秒事务数、每秒全表扫描数量、慢查询数量、数据空间使用率、Binlog日志空间使用率、不能立即获得表锁次数、InnoDB行锁次数、可用连接数、数据文件总大小、InnoDB缓存池可用大小、锁等待数量、操作系统CPU使用率、操作系统内存使用率、操作系统内存可用大小、操作系统交换空间使用率 |
8 | 基础健康检查- Oracle(Windows) | Oracle | Windows | 20 | 缓冲区命中率、共享池命中率、表空间空间使用率、归档空间使用率、数据空间使用率、ASM磁盘组空间使用率、可用会话数、可用进程数、SQL硬解析百分比、内存排序百分比、无效索引个数、行锁等待大于1分钟数量、联机日志每小时切换次数、DG状态、最近备份成功状态、实例状态、监听状态、Oracle目录使用率、操作系统内存使用率、操作系统内存可用大小 |
9 | 基础健康检查- Oracle(Linux) | Oracle | Linux | 14 | 缓冲区命中率、共享池命中率、表空间空间使用率、可用会话数、可用进程数、SQL硬解析百分比、内存排序百分比、无效索引个数、行锁等待大于1分钟数量、联机日志每小时切换次数、最近备份成功状态、实例状态、监听状态、Oracle目录使用率 |
10 | 基础健康检查- vCenter(Windows) | vCenter | Windows | 7 | 物理机最新启动时间、物理机cpu使用率、物理机内存使用率、物理机上虚拟机数量、存储空间使用率、物理机NTP服务器、物理机NTP服务状态 |
11 | 基础健康检查- vCenter(Linux) | vCenter | Linux | 7 | 物理机最新启动时间、物理机cpu使用率、物理机内存使用率、物理机上虚拟机数量、存储空间使用率、物理机NTP服务器、物理机NTP服务状态 |
9、运维工具说明
内置的脚本工具的介绍见下表
序号 | 工具类型 | 工具名 | 脚本类型 | 工具介绍 |
---|---|---|---|---|
1 | 操作系统类 | 查询消耗系统内存最多的进程 | shell(Linux) | 查找出Linux系统当前占用内存资源最多的TopN进程 |
2 | 操作系统类 | 查询消耗系统CPU最多的进程 | shell(Linux) | 查找出Linux系统当前占用CPU资源最多的TopN进程 |
3 | 操作系统类 | MSSQL全库备份 | powershell(Windows) | 将MSSQL全库备份到所选服务器的指定目录,支持SQL Server 2008 R2及以上版本 |
4 | 操作系统类 | 修改Windows本地账号密码 | powershell(Windows) | 修改Windows本地账号密码,支持Powershell 5.2及以上版本 |
5 | 操作系统类 | 修改Linux账号密码 | shell(Linux) | 修改Linux账号密码 |
6 | 操作系统类 | 查询系统本地帐户信息 | powershell(Windows) | 查找出Windows系统所有本地帐户的信息 |
7 | 操作系统类 | 查询AD用户上次登陆时间 | powershell(Windows) | 查找出指定的AD用户上次登陆时间,需在域服务器执行该脚本 |
8 | 操作系统类 | 查询服务进程状态信息 | shell(Linux) | 查找出Linux系统指定进程的状态信息 |
9 | 操作系统类 | 查询占用空间最大的目录和文件 | shell(Linux) | 查找出Linux系统指定目录下占用空间最大的top N目录和文件 |
10 | 操作系统类 | Ping | shell(Linux) | 测试所选主机与目标主机的数据连通性是否正常 |
11 | 操作系统类 | 查看Linux日志文件 | shell(Linux) | 查看Linux日志文件,协助问题排查 |
12 | 操作系统类 | AD密码质量审计 | powershell(Windows) | 执行AD审计,检查AD账号使用弱密码、重复密码、默认密码和空密码等情况 |
13 | 操作系统类 | 查找容量最大的文件 | shell(Linux) | 查找容量最大的文件 |
14 | 操作系统类 | 统计目录的文件数量 | shell(Linux) | 统计目录的文件数量 |
15 | 操作系统类 | 查询僵尸进程数 | shell(Linux) | 查询僵尸进程数 |
16 | 操作系统类 | 查询文件打开数最多的进程 | shell(Linux) | 查询文件打开数最多的进程 |
17 | 操作系统类 | MySQL显示错误日志内容 | shell(Linux) | MySQL显示错误日志内容 |
18 | 操作系统类 | Oracle显示错误日志内容 | shell(Linux) | Oracle显示错误日志内容 |
19 | 操作系统类 | MySQL显示参数值 | shell(Linux) | MySQL显示参数值 |
20 | 操作系统类 | 查询网络连接数最多的服务 | python(Linux) | 查询网络连接数最多的服务 |
21 | 操作系统类 | 查找UID或GID为0的系统用户 | shell(Linux) | 查找UID或GID为0的系统用户 |
22 | 操作系统类 | 查询已删除用户的进程 | shell(Linux) | 查询已删除用户的进程 |
23 | 操作系统类 | Oracle显示参数值 | shell(Linux) | Oracle显示参数值 |
24 | 操作系统类 | 查询权限为777的文件 | shell(Linux) | 查询权限为777的文件 |
25 | 操作系统类 | 统计TIME_WAIT连接数量 | python(Linux) | 统计TIME_WAIT连接数量 |
26 | 操作系统类 | 查询无属主或无属组的文件 | shell(Linux) | 查询无属主或无属组的文件 |
27 | 操作系统类 | 查询进程的文件打开数 | shell(Linux) | 查询进程的文件打开数 |
28 | 操作系统类 | 收集sosreport | shell(Linux) | 收集sosreport或 supportconfig |
29 | 操作系统类 | 检查拥有sudo权限账号或组 | shell(Linux) | 检查拥有sudo权限账号或组 |
30 | 操作系统类 | MySQL查询实例连接数和活动连接数 | shell(Linux) | MySQL查询实例连接数和活动连接数 |
31 | 操作系统类 | Oracle查询实例连接数和活动连接数 | shell(Linux) | Oracle查询实例连接数和活动连接数 |
32 | 操作系统类 | Oracle查看正在运行的SQL语句 | shell(Linux) | Oracle查看正在运行的SQL语句 |
33 | 操作系统类 | Oracle查看最近15分钟的等待事件 | shell(Linux) | Oracle查看最近15分钟的等待事件 |
34 | 操作系统类 | Oracle查询会话增长趋势 | shell(Linux) | Oracle查询会话增长趋势 |
35 | 操作系统类 | Oracle查看当前的等待事件 | shell(Linux) | Oracle查看当前的等待事件 |
36 | 操作系统类 | Oracle查看表空间的大小和可用空间 | shell(Linux) | Oracle查看表空间的大小和可用空间 |
37 | 操作系统类 | Oracle查看数据库锁信息 | shell(Linux) | Oracle查看数据库锁信息 |
38 | 操作系统类 | 查看系统防火墙启用情况 | powershell(Windows) | 查看系统防火墙启用情况 |
39 | 操作系统类 | 查看占用内存 Top10进程信息 | powershell(Windows) | 查看占用内存 Top10进程信息 |
40 | 操作系统类 | Oracle查看ASM磁盘组大小和可用空间 | shell(Linux) | Oracle查看ASM磁盘组大小和可用空间 |
41 | 操作系统类 | Oracle查询数据库中具有DBA权限的用户 | shell(Linux) | Oracle查询数据库中具有DBA权限的用户 |
42 | 操作系统类 | MySQL查看表空间的大小和可用空间 | shell(Linux) | MySQL查看表空间的大小和可用空间 |
42 | 操作系统类 | MySQL查询当前运行的SQL语句 | shell(Linux) | MySQL查询当前运行的SQL语句 |
43 | 操作系统类 | 查看所有物理网卡的网线连接状态 | shell(Linux) | 查看所有物理网卡的网线连接状态 |
44 | 操作系统类 | Linux补丁升级 | shell(Linux) | 适用于已部署Yum源的Linux服务器 |
序号 | 工具类型 | 工具名 | 脚本类型 | 工具介绍 |
---|---|---|---|---|
1 | 网络设备类 | 显示CDP查找进程的结果(思科) | telnet | 可以看见本地接口ID,与此接口直连的设备ID,设备类型,若对端接口是路由接口,可以看见对端接口ID |
2 | 网络设备类 | 显示打开的CDP接口信息(思科) | telnet | 可以看见接口状态,连接状态,封装类型,发送cdp报文周期 |
3 | 网络设备类 | 显示CDP表中所列相邻设备的信息(思科) | telnet | 展示运行cdp协议的邻居设备的详细信息:设备ID,厂家,设备能力,ip地址,IOS类型和版本,设备功能 |
4 | 网络设备类 | 展示总包吞吐量(思科) | telnet | |
5 | 网络设备类 | 展示接口统计信息(思科) | telnet | 显示设置在路由器和访问服务器上所有接口的统计信息 |
6 | 网络设备类 | 显示连接所有用户(思科) | telnet | |
7 | 网络设备类 | 显示产品库存清单(思科) | telnet | 显示安装的所有思科产品的产品库存清单和UDI |
8 | 网络设备类 | 显示接口的状态和全局参数(思科) | telnet | |
9 | 网络设备类 | 显示路由选择表的当前状态(思科) | telnet | |
10 | 网络设备类 | 显示IP路由表信息(思科) | telnet | |
11 | 网络设备类 | 显示路由器的进程(思科) | telnet | |
12 | 网络设备类 | 显示设置的协议(思科) | telnet | 显示全局和接口的第三层协议的特定状态。 |
13 | 网络设备类 | 显示内存大小(思科) | telnet | |
14 | 网络设备类 | 展示进程内存使用量(思科) | telnet | 显示每个系统进程或指定进程使用的内存量 |
15 | 网络设备类 | 展示进程CPU使用率(思科) | telnet | 显示所有进程及其CPU利用率 |
16 | 网络设备类 | 显示系统版本信息(思科) | telnet |
【备注】网络设备自动化运维支持的范围如下 | 类别|型号| | -----| ----| | 网络设备自动化支持的型号|A10, Accedian, AdtranOS,AlcatelAos,NokiaSros, ApresiaAeos, Arista, Aruba, HPProcurve, HPProcurve, ExtremeErs, ExtremeVsp, BroadcomIcos, RuckusFastiron, ExtremeNetiron, ExtremeNos,ExtremeNos, VyOS, CheckPointGaia, CalixB6,CentecOS,CienaSaos,CiscoAsa,CiscoFtd,CiscoIos,CiscoNxos,CiscoS300,CiscoTpTcCe,CiscoWlc,CiscoIos,CiscoXr,CloudGenixIon,Coriant,DellForce10,DellForce10,DellDNOS6,DellForce10,DellOS10,DellPowerConnect,DellIsilon,DlinkDS,Endace,Eltex,EltexEsr,Enterasys,ExtremeExos,ExtremeErs,ExtremeExos, ExtremeNetiron,ExtremeNos,ExtremeSlx,ExtremeNos,ExtremeVsp,ExtremeWing,F5Tmsh,F5Tmsh,F5Linux,Flexvnf,Fortinet,Generic,TerminalServer,HPComware,HPProcurve,Huawei,HuaweiSmartAX,HuaweiSmartAX,HuaweiVrpv8,IpInfusionOcNOS,Juniper,Juniper,JuniperScreenOs,Keymile,KeymileNOS,Linux, MikrotikRouterOs,MikrotikSwitchOs,MellanoxMlnxos, MellanoxMlnxos,MrvLx, MrvOptiswitch,NetAppcDot,NetgearProSafe,Netscaler, NokiaSros, OneaccessOneOS,OvsLinux, PaloAltoPanos,Pluribus,QuantaMesh,RaisecomRoap,RuckusFastiron,RuijieOS,SixwindOS,SophosSfos,TPLinkJetStream,UbiquitiEdge, UbiquitiEdgeRouter, UbiquitiEdge, UbiquitiUnifiSwitch,VyOS, WatchguardFireware, ZteZxros, Yamaha,|
10、内置工单流程
共内置5个自动化工单流程,具体介绍见下表
序号 | 服务名称 | 服务流程 |
---|---|---|
1 | AD账号创建 | 【前置条件】AD已经纳管/AD凭据已经录入→【提单】填写新建的信息→【管理员审批】选择域和组→【自动执行】引用自动化流程自动批量创建→【发送邮件】申请人接收通知邮件 |
2 | AD账号密码重置 | 【前置条件】AD已经纳管/AD凭据已经录入→【提单】填写重置信息→【管理员审批】选择域和组→【自动执行】引用自动化流程自动批量重置→【发送邮件】申请人接收通知邮件 |
3 | AD账号禁用 | 【前置条件】AD已经纳管/AD凭据已经录入→【提单】填写禁用的信息→【管理员审批】选择域和组→【自动执行】引用自动化流程自动批量禁用→【发送邮件】申请人接收通知邮件 |
4 | AD账号删除 | 【前置条件】AD已经纳管/AD凭据已经录入→【提单】填写删除的信息→【管理员审批】选择域和组→【自动执行】引用自动化流程自动批量删除→【发送邮件】申请人接收通知邮件 |
5 | 数据库SQL语句执行 | 【前置条件】数据库已经纳管/数据库凭据已经录入→【提单】填写执行对象和SQL语句→【管理员审批】审批并选择凭据→【自动执行】引用自动化流程自动执行 |
6 | VMware虚拟机创建 | 【前置条件】vcenter已经纳管并设置自动发现/凭据已经录入→【提单】填写申请的虚拟机配置→【管理员审批】审批并选择凭据→【自动执行】引用自动化流程自动执行 |
7 | VMware虚拟机快照创建 | 【前置条件】vcenter已经纳管并设置自动发现/凭据已经录入→【提单】填写申请的信息→【管理员审批】审批并选择凭据→【自动执行】引用自动化流程自动执行 |
8 | VMware虚拟机快照回滚 | 【前置条件】vcenter已经纳管并设置自动发现/凭据已经录入→【提单】填写申请的信息→【管理员审批】审批并选择凭据→【自动执行】引用自动化流程自动执行 |
共内置36个工单流程,具体介绍见下表
序号 | 服务类型 | 服务流程 | 流程字段 |
---|---|---|---|
1 | 【AD相关】 | 开通AD帐号 | 使用人、账号名、显示名、手机号、邮箱、部门、使用时间、禁用时间、用途、紧急程度 |
2 | 【AD相关】 | 续用AD帐号 | 使用人、账号名、手机号、邮箱、部门、禁用时间、原因、紧急程度 |
3 | 【AD相关】 | 修改AD帐号信息 | 使用人、账号名、部门、修改内容、原因、紧急程度 |
4 | 【AD相关】 | 重置AD帐号密码 | 使用人、账号名、部门、原因、紧急程度 |
5 | 【AD相关】 | 禁用AD帐号 | 使用人、账号名、部门、原因、紧急程度 |
6 | 【邮箱相关】 | 开通邮箱帐号 | 使用人、账号名、手机号、部门、使用时间、释放时间、邮箱容量、原因、紧急程度 |
7 | 【邮箱相关】 | 续用邮箱帐号 | 使用人、邮箱、部门、释放时间、补充说明、紧急程度 |
8 | 【邮箱相关】 | 扩容邮箱帐号 | 使用人、邮箱、部门、原因、扩容量、紧急程度 |
9 | 【邮箱相关】 | 注销邮箱帐号 | 使用人、邮箱、部门、原因、紧急程度 |
10 | 【服务器相关】 | 申请服务器 | 使用人、部门、使用时间、释放时间、规格、操作系统、指定IP、用途、补充说明、紧急程度 |
11 | 【服务器相关】 | 续用服务器 | 使用人、部门、服务器IP、释放时间、用途、紧急程度 |
12 | 【服务器相关】 | 释放服务器 | 使用人、部门、服务器IP、原因、紧急程度 |
13 | 【服务器相关】 | 扩容服务器 | 使用人、部门、服务器IP、现规格、扩充至、紧急程度 |
14 | 【服务器相关】 | 创建服务器快照 | 使用人、部门、服务器IP、原因、紧急程度 |
15 | 【服务器相关】 | 回滚服务器快照 | 使用人、部门、服务器IP、原因、快照时间、紧急程度 |
16 | 【服务器相关】 | 服务器文件上传 | 使用人、部门、服务器IP、操作系统、原因、紧急程度、附件 |
17 | 【服务器相关】 | 服务器文件下载 | 使用人、部门、服务器IP、操作系统、文件路径、原因、紧急程度 |
18 | 【服务器相关】 | 开通网络策略 | 使用人、部门、服务器IP、开通端口、用途、紧急程度 |
19 | 【笔记本相关】 | 申请笔记本 | 使用人、部门、操作系统、型号、规格、预装软件、使用时间、退还时间、用途、紧急程度 |
20 | 【笔记本相关】 | 续用笔记本 | 使用人、部门、资产编码、型号、退还时间、原因、紧急程度 |
21 | 【笔记本相关】 | 维修笔记本 | 使用人、部门、资产编码、型号、是否为公司电脑、维修方式、故障现象、故障原因、紧急程度 |
22 | 【笔记本相关】 | 更换笔记本 | 使用人、部门、资产编码、型号、现规格型号、期望规格型号、原因、紧急程度 |
23 | 【笔记本相关】 | 退还笔记本 | 使用人、部门、资产编码、型号、原因 |
24 | 【笔记本相关】 | 安装办公软件 | 使用人、部门、资产编码、型号、操作系统、软件名称、软件版本、用途、紧急程度 |
25 | 【办公设备相关】 | 申请办公设备 | 使用人、部门、设备类型、使用时间、退还时间、用途、其他要求、紧急程度 |
26 | 【办公设备相关】 | 续用办公设备 | 使用人、部门、资产编码、设备类型、型号、退还时间、原因、紧急程度 |
27 | 【办公设备相关】 | 维修办公设备 | 使用人、部门、资产编码、设备类型、型号、故障现象、故障原因 |
28 | 【办公设备相关】 | 更换办公设备 | 使用人、部门、资产编码、设备类型、现规格型号、期望规格型号、原因、紧急程度 |
29 | 【办公设备相关】 | 退还办公设备 | 使用人、部门、资产编码、型号、原因 |
30 | 【办公设备相关】 | 打印机加纸 | 设备位置、紧急程度 |
31 | 【办公设备相关】 | 更换墨盒 | 设备位置、紧急程度 |
32 | 【门禁相关】 | 申请门禁账号 | 使用人、工号、部门、使用时间、注销时间、原因、紧急程度 |
33 | 【门禁相关】 | 续用门禁帐号 | 使用人、工号、部门、注销时间、原因、紧急程度 |
34 | 【门禁相关】 | 重置门禁密码 | 使用人、工号、部门、原因、紧急程度 |
35 | 【门禁相关】 | 注销门禁账号 | 使用人、工号、部门、原因、紧急程度 |
36 | 【告警转工单】 | 告警转工单 | 标题、关联业务、影响范围、紧急程度、优先级、描述 |