CentOS 三节点部署

环境准备 (20mins)

准备机器

  1. 建议操作系统 :CentOS 7.9
  2. 建议机器配置
    • 推荐配置:建议 8 核 32G,硬盘 200G 以上
  3. 机器数量:3 台(标准部署,不含日志模块、报表模块、APM 模块)
  4. 选择第一台为中控机进行安装部署操作,使用 root 账号登录。
  5. 在每台机器上创建一个 /data 目录(建议挂载独立的磁盘或者分区)
  6. 已准备服务器信息如下:
IP 主机名 Mac地址 YUM源(在线/离线) 备注
10.10.24.129 control 00:50:56:93:58:a6 在线 crontrol_ip(中控机)
10.10.24.130 appo 00:50:56:93:e8:61 在线 appo_ip(APPO服务器)
10.10.24.131 appt 00:50:56:93:b6:3a 在线 appt_ip(APPT服务器)

准备介质包(上传至中控机)

序号 介质包名 文件名 上传路径 备注
1 平台介质包 weops-release-4.15LTS-centos7.tar.gz /data/ 文件名以实际出包为准
2 证书文件介质包 ssl_certificates.tar.gz /data/ 10.10.24.129-00:50:56:93:58:a6(IP-MAC)
3 WeOps介质包 嘉为科技-weops-blackall-20210714105936.tar.gz /data/ 文件名以实际出包为准

WeOps介质包说明:

序号 介质包 文件名 备注
1 monitorcenter_saas 监控中心SaaS包
2 cw_uac_saas 告警中心SaaS包
3 bk_itsm 运维流程管理SaaS包
4 weops_saas WeOps SaaS包
5 ops-dig 数字化运营中心 SaaS包(大屏)
6 bk_sops 标准运维 SaaS包

准备基础环境(10mins)

  1. 安装常用源以及工具
    # 操作主机:每台服务器
    
    sed -i 's/#UseDNS yes/UseDNS no/g' /etc/ssh/sshd_config
    systemctl restart sshd
    systemctl stop firewalld
    systemctl disable firewalld
    setenforce 0
    sed -i 's/SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config
    mkdir /etc/yum.repos.d/bak
    mv /etc/yum.repos.d/*.repo /etc/yum.repos.d/bak/
    curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.cloud.tencent.com/repo/centos7_base.repo
    curl -o /etc/yum.repos.d/epel.repo http://mirrors.cloud.tencent.com/repo/epel-7.repo
    yum clean all && yum makecache
    yum -y install rsync epel-release wget vim telnet bind-utils net-tools
    cat >> /etc/security/limits.conf << EOF
    root soft nofile 102400
    root hard nofile 102400
    EOF
    
    # 禁用 motd 提示,否则 init topo 会失败
    rm -f /etc/motd
    rm -f /etc/motd.d/*
    rm -f /etc/issue
    rm -f /etc/issue.net
    rm -f /etc/issue.d/cockpit.issue
  2. 配置机器免密
    # 操作主机:中控机
    
    ssh-keygen  # 一直按回车确认
    ssh-copy-id xx.xx.xx.xx # 分别添加各台服务器IP,包括本机

初始化部署环境 (10mins)

# 操作主机:中控机
cd /data/
tar xf weops-release-4.15LTS-centos7.tar.gz
tar xf weops_deployment_LTS_*.tar.gz -C /data/

# 调用脚本时需依次传入[crontrol_ip appo_ip appt_ip],即蓝鲸三台主机的ip,分别以双引号包围
cd /data/weops/install
bash weops_install.sh prepare "10.10.24.129" "10.10.24.130" "10.10.24.131"

# 自定义二级域名(可选)
# 执行前请使用实际的二级域名 (如:bktencent.com) 和安装目录进行替换
cd /data/install
./configure -d {{ BK_DOMAIN }}

# 自定义平台登录密码
cat > /data/install/bin/03-userdef/usermgr.env << EOF
BK_PAAS_ADMIN_PASSWORD=WeOps2024
EOF

# 解压工具包
tar xf /data/patch_for_os-*.tar.gz -C /data/install/

# 添加标准运维包到默认安装目录
cp -f /data/install/yum/bk_sops-3.6.56.x.tar.gz /data/src/official_saas/

# 测试服务器 cpu 性能,结果为 2000 以下的需要注意平台使用会慢一些
yum -y install sysbench
sysbench cpu --cpu-max-prime=20000 --threads=16 run | grep 'events per second'

脚本执行后会生成data/weops/install/.completed.list,每个完成的步骤都会记录,如果需要重新配置,需要删除相关步骤记录。

开始部署平台 (90mins)

注:以下安装命令都在中控机的/data/install/下执行

平台初始化并检查环境 (5mins)

# 操作主机:中控机
# 操作路径:/data/install/

cd /data/install

# 初始化环境
#同步文件到另外两台服务器
./bk_install common

# 校验环境和部署的配置
./health_check/check_bk_controller.sh

平台部署 (75mins)

1.部署平台

注意:平台组件若正常部署完成,可以看到提示:

“如果以上步骤执行没有报错,说明你已经完成 XXXXX 的部署,请按照文档继续执行剩余步骤”

若未看到此提示,则说明部署可能失败,请检查部署步骤执行是否有报错!

# 操作主机:中控机
# 操作路径:/data/install/

cd /data/install

# 部署 paas,安装 PaaS 平台及其依赖服务,该步骤完成后,可以打开 PaaS 平台 (15mins)
./bk_install paas

# 部署 app_mgr,部署 SaaS 运行环境,正式环境及测试环境 (12mins)
./bk_install app_mgr

# 部署 CMDB,安装配置平台及其依赖服务 (5mins)
./bk_install cmdb

# 部署 job,安装作业平台后台模块及其依赖组件 (8mins)
./bk_install job

# 替换 starter
./patch_for_os.sh change_starter

# 部署 bknodeman,安装节点管理后台模块、节点管理 SaaS 及其依赖组件 (10mins)
./bk_install bknodeman

# 部署 bkmonitorv3,安装监控平台后台模块、监控平台 SaaS 及其依赖组件 (25mins)
./bk_install bkmonitorv3
  1. 部署官方自带saas

请按顺序执行 :

# 操作主机:中控机
# 操作路径:/data/install/
cd /data/install

# 权限中心 (2mins)
./bk_install saas-o bk_iam

# 用户管理 (2mins)
./bk_install saas-o bk_user_manage

初始化蓝鲸业务 topo (5mins)

# 操作主机:中控机
# 操作路径:/data/install/

cd /data/install
./bkcli initdata topo

注意:若初始化拓扑报错,请参考附录”初始化拓扑报错”处理后,再进行初始化。

检查相关服务状态 (3mins)

# 操作主机:中控机
# 操作路径:/data/install/

cd /data/install/
echo bkssm bkiam usermgr paas cmdb gse job consul bkmonitorv3 | xargs -n 1 ./bkcli check

检查三台 weops 服务器的 host 信息 (2mins)

# 操作主机:中控机
# 操作路径:/data/install/

cd /data/install
pcmd -m all 'cat /etc/hosts'

# 返回结果需包含以下内容,若存在 host 信息缺失,需手动进行添加 host 信息
10.0.0.2 paas.weops.com cmdb.weops.com job.weops.com jobapi.weops.com
10.0.0.3 nodeman.weops.com

验证访问 paas 平台

DNS 配置

如暂时未将 weops 域名添加至 DNS 服务器解析,可直接添加 hosts 记录访问 weops。

  1. Windows 配置

用文本编辑器(如Notepad++)打开文件:

C:WindowsSystem32driversetchosts

将以下内容复制到上述文件内,并将以下 IP 需更换为本机浏览器可以访问的 IP,然后保存。

# 操作主机:客户端

# 将以下内容复制到上述文件内,注意将以下 IP 和域名需更换为实际三台蓝鲸 IP 和域名,然后保存。
10.0.0.2 paas.weops.com cmdb.weops.com job.weops.com jobapi.weops.com weops.weops.com itsm.weops.com
10.0.0.3 nodeman.weops.com

注意:10.0.0.2 为 nginx 模块所在的机器,10.0.0.3 为 nodeman 模块所在的机器,查询方式如下:

# 操作主机:中控机
# 操作路径:/data/install/

# 查询模块所分布在机器的方式:
grep -E "nginx|nodeman" /data/install/install.config

获取管理员账户及密码

# 操作主机:任意一台机器

# 执行下述命令,获取管理员账号和密码 
grep -E "BK_PAAS_ADMIN_USERNAME|BK_PAAS_ADMIN_PASSWORD" /data/install/bin/04-final/usermgr.env

开始部署 WeOps (42mins)

WeOps 依赖组件安装 (8mins)

使用 weops_install.sh 脚本可自动完成一些配置项和组件安装,具体可查看附录内容。

注意:仅可执行一次

# 操作主机:中控机
# 操作路径:/data/weops

# 安装依赖组件
source /data/install/utils.fc  # 若提示无此文件或文件夹,请重新 ssh 登录
cd /data/weops/install
bash weops_install.sh components

# patch for os
cd /data/install/
./patch_for_os.sh all

WeOps 集合 SaaS 部署 (15mins)

执行脚本 install_saas.sh 安装 对应的 app_code

例如:./install_saas.sh monitorcenter_saas

1) 脚本会对已经安装好 app_code 放入标记文件 .step_canway_saas ,再次执行如果 app_code 已在该文件中,就会跳过安装,如需要重新安装,编辑该文件去掉对应的 app_code 即可。

# 操作主机:中控机

# 解压 SaaS 安装包到指定目录,SaaS 包请以实际为准
cd /data/
tar -xf 嘉为科技-weops-Jerko-20210714105936.tar.gz -C /data/src/official_saas

# 命令执行如下,注意请按以下顺序正确安装 saas
cd /data/weops/install
./install_saas.sh monitorcenter_saas  # 部署统一监控中心 (2mins)
./install_saas.sh cw_uac_saas  # 部署统一告警中心V2.0 (2mins)
./install_saas.sh bk_itsm  # 部署itsm (4mins)
./install_saas.sh bk_sops  # 部署标准运维,若有提示,输入y部署即可 (3mins)
./install_saas.sh ops-digital_saas  # 部署数字化运营中心(按需部署)(3mins)
./install_saas.sh weops_saas  # 部署 weops 4.0 (2mins)

# 部署了大屏和 weops_saas 4.15.3013+ 的客户需更新大屏 sql,没部署大屏的客户不用执行
gunzip -c /data/install/yum/ops-digital_saas.20241017.tgz|mysql --login-path=mysql-default

WeOps 基础配置 (3mins)

WeOps 优化配置

使用 weops_install.sh 脚本可自动完成一些优化配置项(如日志自动清理)

# 操作主机:中控机

# 配置 WeOps 基础设置
source /data/install/utils.fc  # 若提示无此文件或文件夹,请重新 ssh 登录
cd /data/weops/install
bash weops_install.sh settings

WeOps 服务初始化

WeOps服务初始化工具说明请查看附录

# 操作主机:中控机

cd /data/weops/init_weops_service
python main.py --cmdb --monitor --itsm

初始化权限策略和 snmp 模版

注意:若部署未包含监控模块,最后一个动作会报错,可无视

# 操作主机:appo
docker exec -i $(docker ps -aq -f name=weops_saas*) bash -c "export BK_FILE_PATH=/data/app/code/conf/saas_priv.txt;cd /data/app/code;python manage.py init_role --update;python manage.py init_snmp_template;python manage.py build_role_trees;python manage.py update_network_vault_credential;python manage.py reload_casbin_policy --delete"

# 初始化内置模型,在浏览器使用有 admin 权限的用户访问
${domain}/o/weops_saas/resource/objects/migrate

WeOps 主机安装 Agent

  • 操作路径:WeOps -> 管理 -> 节点管理 -> Agent -> 安装Agent -> 远程安装
  • 操作目标:安装 WeOps 平台的服务器的主机Agent

后台初始化配置 (40mins)

监控平台配置

  1. 打开监控平台:
    • 浏览器打开开发者中心(网址:http://{paas.domain.com}/saas/list
    • 打开监控平台:开发者中心->S-mart应用 -> 点击<监控平台> -> 正式地址

全局配置

  1. 操作路径:监控平台 -> 导航栏 -> 点击<设置> 图标 -> 全局设置
  2. 操作方式:在<全局设置>页面 -> 消息通知渠道 -> 仅勾选语音

告警策略

  1. 操作路径:监控平台 -> 配置 -> 告警策略
  2. 操作方式:在<告警策略>页面 -> 点击<启/停> -> 关闭所有默认策略

告警中心配置

  1. 打开告警中心:
    • 浏览器打开开发者中心(网址:http://{paas.domain.com}/saas/list
    • 打开告警中心:开发者中心 -> S-mart应用 -> 点击<WeOps告警中心> -> 正式地址

告警转工单配置

1.操作路径:统一告警中心 -> 功能配置 -> 工单系统

2.操作方式:<工单系统>页面 -> 蓝鲸ITSM -> 点击<更多>按钮(三个竖点图标) -> 流程管理 -> 点击<新建>按钮 -> 选择流程<告警转工单> -> 点击<确定>按钮

日志模块部署

日志模块依赖 docker 和 docker-compose。且消耗资源较多,建议独立部署在一台 8C16G 的服务器上。

日志采集用 kafka:建议在日志服务器或独立服务器部署,kafka 用于收集 filebeat,packetbeat,auditbeat 等beat 的日志数据。(蓝鲸内置的 kafka 版本过低,无法正常使用,必须单独搭建,最低配置可以到 2c4g)

推荐配置:

  • 操作系统 :CentOS 7.9
  • 机器配置 :8 核 32GB,硬盘 500GB 以上且支持扩容(POC 测试可降低至 200GB)

准备工作

准备介质包

序号 介质包名 文件名称 上传路径 备注
1 日志模块部署介质包 weops-release-log.tar.gz /data/ docker-compose、依赖组件镜像包

日志模块依赖组件

序号 组件名称 文件名称 镜像名称 镜像tag 镜像描述
1 mongo mongo.tgz docker-bkrepo.cwoa.net/ce1b09/weops-docker/mongo 4.2.0 mongodb-元数据存储
2 opensearch opensearch.tgz docker-bkrepo.cwoa.net/ce1b09/weops-docker/opensearch v1.1.0 新版日志数据存储
3 datainsight datainsight.tgz docker-bkrepo.cwoa.net/ce1b09/weops-docker/datainsight 20240510 日志服务主体
4 kafka kafka.tgz docker-bkrepo.cwoa.net/ce1b09/weops-docker/kafka 3.6 日志采集组件

同步环境变量

特殊说明:若部署服务器已同步蓝鲸环境变量,则跳过,无需执行

# 操作主机:中控机

# 增加日志模块角色配置,假设日志服务器IP:10.0.1.1,以实际为准
cd /data/install
vim install.config

# 增加行:
10.0.1.1 weopslog

# 同步文件
./bkcli install bkenv
./bkcli sync common
scp ~/.bkrc ~/.bashrc root@10.0.1.1:~/ 

# 同步后,注释增加的行后再次同步
vim install.config

# 注释行:
# 10.0.1.1 weopslog

# 同步文件
./bkcli install bkenv
./bkcli sync common

部署 docker-ce

特殊说明:若部署服务器已安装 docker,则跳过,无需执行

# 操作主机:日志服务器

# 解压日志模块部署包
tar zvf /data/weops-release-log.tar.gz -C /data/

# 配置 Blueking yum源
scp ${crontrol_ip}:/etc/yum.repos.d/Blueking.repo /etc/yum.repos.d/

# 安装 docker-ce,版本:20.10.23
yum install -y docker-ce

# 创建 docker 配置文件daemon.json
mkdir /etc/docker
cp /data/weops-log/docker_conf/daemon.json /etc/docker/daemon.json

# 启动 docker 并设置开机自启
systemctl start docker
systemctl enable docker

# 查看 docker 版本,版本号:20.10.23
docker version

部署 docker-compose

# 操作主机:日志服务器

cp /data/weops-log/docker-compose-linux-x86_64 /usr/local/bin/docker-compose
chmod +x /usr/local/bin/docker-compose

导入镜像

# 操作主机:日志服务器

# 自动导入镜像包
/data/weops-log/install/load_images.sh

部署日志

# 操作主机:日志服务器

# 生成配置文件
/data/weops-log/configs/log_config.sh

# 启动容器
docker-compose -f /data/weops/datainsight/docker-compose.yaml up -d

# 部署了日志的客户需要调整接入点配置,在APPT节点操作

# 当有多个接入点的时候,使用以下命令来获取所有接入点并逐个执行
# keys=$(curl -sSL http://127.0.0.1:8501/v1/kv/weops/access_points?keys| jq -r '.[] | select(. != "weops/access_points/")')

# 以 weops/access_points/default 为例
export CONSUL_HTTP_ADDR=http://127.0.0.1:8501
consul kv get weops/access_points/default > /tmp/ac.json

# 修改 ac.json,添加 logip 和 logport 属性,修改后完整的接入点信息如下,其中 logip 为 datainsight 服务的 ip,logport 指向 datainsight 9000 服务端口
# {
#   "ip":"10.10.26.235",
#   "name":"默认区域采集节点",
#   "zone":"default",
#   "port": 8005,
#   "logip": "10.10.25.155",
#   "logport": 9000
# }

# 修改完成后,重新写入接入点信息
curl -XPUT -d @/tmp/ac.json http://127.0.0.1:8501/v1/kv/weops/access_points/default

日志模块初始化配置

SaaS 环境变量说明

更新 WeOps SaaS 环境变量后需重新部署一次 SaaS

SaaS ID 变量名(默认自带BKAPP前缀) 变量值($开头值均为平台变量,需手动获取) 备注
weops_saas GRAYLOG_URL http://${log_ip}:9000 log_ip暂无环境变量,需视日志部署情况而定,示例:http://192.168.1.10:9000
weops_saas GRAYLOG_AUTH YWRtaW46ZGF0YWluc2lnaHQteA== 默认账号密码 admin:datainsight-x 的base64编码
weops_saas ALARM_SEND_REST_API <REST API 告警源:url> 需要在告警中心开启restful告警源,手动复制curl段中的url
weops_saas ALARM_SEND_SECRET <REST API 告警源:secret> 需要在告警中心开启restful告警源,手动复制curl段中的secret
weops_saas GRAYLOG_API_TOKEN <令牌 sidecar:token> 需要在datainsight页面生成
weops_saas LOG_OUTPUT_HOST ${log_kafka_ip}:9092 日志采集kafka broker,log_kafka_ip为单独部署的日志采集kafka地址,示例:192.168.1.10:9092

日志模块后台页面访问

访问代理配置

  • 假设日志服务器:192.168.1.10
# 操作主机:nginx

# 创建 datainsight.conf 配置文件
cd /usr/local/openresty/nginx/conf/conf.d/
touch datainsight.conf

# 编辑 datainsight.conf 配置文件,配置文件内容如下所示
vim datainsight.conf

# 验证 nginx 配置文件,返回successful为正常
/usr/local/openresty/nginx/sbin/nginx -t

# 若返回正常,则重载 nginx 配置
systemctl restart openresty.service
  • datainsight.conf 配置文件
    server {
      listen 80;
      server_name datainsight.weops.net;
    
      location / {
          proxy_pass http://192.168.1.10:9000;
      }
    }

页面访问

  • host 域名解析配置:<$BK_NGINX_IP> datainsight.weops.net
  • 访问url: http://datainsight.weops.net
  • 用户名:admin
  • 默认密码:datainsight-x

REST API 告警源

  • 告警中心开启RESTful api告警源,获取url和key

    image-20230605150551395

sidecar 令牌 tocken

  • 操作路径:datainsight -> 系统 -> 用户 -> 系统管理员 -> Administrator -> 点击<编辑令牌> -> 输入<令牌名称:sidecar> -> 点击<创建令牌>
  • GRAYLOG_API_TOKEN : 令牌 sidecar 的 token

image-20230707153158047

image-20230707153237195

image-20230707153413308

报表模块部署

报表模块由 trino 和 datart 两个组件服务组成,两者都依赖蓝鲸的 mysql,建议在蓝鲸服务器上部署(或在独立部署的服务器部署,要求已同步蓝鲸的环境变量)

  • trino :负责集成蓝鲸数据源
  • datart:负责提供报表展示

准备工作

准备介质包

序号 介质包名 文件名 上传路径 备注
1 报表模块部署介质包 weops-release-report.tar.gz /data/ 包含:datart_data.tgz、static.tgz、安装脚本、依赖组件镜像包

报表模块依赖组件

序号 组件名称 文件名称 镜像名称 镜像tag 镜像描述
1 standalone-chrome standalone-chrome.tgz selenium/standalone-chrome latest chrome 容器,用于报表导出
2 datart datart.tgz ccr.ccs.tencentyun.com/megalab/datart latest datart 容器
3 trino trino.tgz ccr.ccs.tencentyun.com/megalab/trino 413-amd64 trino 容器

报表模块部署先决条件

  1. 推荐配置:
    • 操作系统 :CentOS 7.9
    • 机器配置 :8 核 32GB,硬盘 200GB 以上且支持扩容
  2. docker-ce安装

    特殊说明:若部署服务器已安装docker,则跳过,无需执行

    # 操作主机:报表服务器
    
    # 配置 Blueking yum源
    scp ${crontrol_ip}:/etc/yum.repos.d/Blueking.repo /etc/yum.repos.d/
    
    # 安装 docker-ce,版本:20.10.23
    yum install -y docker-ce
    
    # 创建 docker 配置文件daemon.json
    mkdir /etc/docker
    cp /data/weops-report/docker_conf/daemon.json /etc/docker/daemon.json
    
    # 启动 docker 并设置开机自启
    systemctl start docker
    systemctl enable docker
    
    # 查看 docker 版本,版本号:20.10.23
    docker version
  3. 同步蓝鲸环境变量

    特殊说明:若部署服务器已同步蓝鲸环境变量,则跳过,无需执行

    # 操作主机:中控机
    
    cd /data/install
    
    # 增加报表角色配置,假设报表服务器IP:10.0.0.1,以实际为准
    vim install.config
    # 增加行:
    10.0.0.1 trino
    
    ./bkcli install bkenv
    ./bkcli sync common
    scp ~/.bkrc ~/.bashrc root@10.0.0.1:~/ 
    
    # 同步后,注释增加的行后再次同步
    vim install.config
    # 注释行:
    # 10.0.0.1 trino
    
    ./bkcli install bkenv
    ./bkcli sync common
  4. 检查docker配置项-iptables

    特殊说明:若部署报表服务器已启用docker的iptables配置,则跳过,无需执行

    # 操作主机:appt (报表服务器)
    
    # 确认docker是否开启iptables,以下配置需为true
    vim /etc/docker/daemon.json
    
    # 配置项:  
    "iptables": true
    
    # 重启docker生效
    systemctl restart docker

导入镜像

# 操作主机:报表服务器

cd /data/
tar xf weops-release-report.tar.gz -C /data/

cd /data/weops-report/images

docker load < standalone-chrome_latest.tgz
docker load < datart_latest.tgz
docker load < trino_422-datainsight.tgz

部署报表

  • 配置 mysql
    • 若若报表模块部署在mysql服务器

    注意:若部署datart的主机和mysql为同一台机,则${datart主机ip}应为容器固定IP,需确认客户环境中是否有使用容器网段172.172.172.0/24,若未使用,可正常部署

    # 操作主机:mysql
    
    # 创建mysql数据库
    mysql --login-path=default-root << EOF
    create database datart
    EOF
    
    # 授权容器网段访问mysql
    mysql --login-path=default-root << EOF
    GRANT ALL PRIVILEGES ON *.* TO 'root'@'172.172.172.2' IDENTIFIED BY "${BK_MYSQL_ADMIN_PASSWORD}" WITH GRANT OPTION;
    FLUSH PRIVILEGES;
    EOF
    
    mysql --login-path=default-root << EOF
    GRANT ALL PRIVILEGES ON *.* TO 'root'@'172.172.172.10' IDENTIFIED BY "${BK_MYSQL_ADMIN_PASSWORD}" WITH GRANT OPTION;
    FLUSH PRIVILEGES;
    EOF
    • 若报表模块部署在其他服务器(非mysql服务器)
    # 操作主机:mysql
    
    # 创建mysql数据库
    mysql --login-path=default-root << EOF
    create database datart
    EOF
    
    # 授权容器网段访问mysql
    mysql --login-path=default-root << EOF
    GRANT ALL PRIVILEGES ON *.* TO 'root'@'${datart主机ip}' IDENTIFIED BY "${BK_MYSQL_ADMIN_PASSWORD}" WITH GRANT OPTION;
    FLUSH PRIVILEGES;
    EOF
  • 部署报表服务
    • 安装 trino 组件
    # 操作主机:报表服务器
    
    # 加载环境变量
    source /data/install/utils.fc
    
    cd /data/weops-report/
    
    # 如日志服务器IP为192.168.5.10,# 若无日志模块,则默认填写中控机的IP
    # 示例执行命令如下:
    # ./trino_install.sh 192.168.5.10
    
    ./trino_install.sh <日志服务器IP or 中控机IP>
    • 安装 datart 组件
    # 操作主机:报表服务器
    
    # 加载环境变量
    source /data/install/utils.fc
    
    cd /data/weops-report/
    
    # 安装 datart 组件
    ./datart_install.sh
  • 初始化datart内置仪表盘

    先决条件:报表部署工具包中复制 datart_data_20240201.tgz 文件至mysql服务器

    路径:/data/weops-report/datart_data_20240201.tgz

    # 操作主机:mysql
    
    gunzip -c datart_data_*.tgz | mysql --login-path=default-root --database datart
  • 初始化内置仪表盘代理
    # 操作主机:报表服务器
    # 特殊说明:需从 datart 容器中复制 static 到 paas 服务器 /data/bkce/open_paas/paas/
    
    source /data/install/utils.fc
    
    docker cp datart:/apps/static/static /tmp/static
    scp -r /tmp/static $BK_PAAS_IP:/data/bkce/open_paas/paas/
    # 操作主机:paas
    
    systemctl restart bk-paas-paas
  • 初始化 datart mysql 数据源
    # 操作主机:mysql
    
    #!/bin/bash
    source /data/install/utils.fc
    
    curl -s 'http://172.172.172.10:8080/api/v1/users/login' -i 
    -H 'Content-Type: application/json' 
    -d '{"username":"admin","password":"WeOps2023"}' 
    --compressed 
    --insecure > /tmp/datart.login
    
    export AUTH=$(grep Authorization /tmp/datart.login)
    
    cat << EOF > /tmp/payload.json
    {
    "config": "{"dbType":"MYSQL","url":"jdbc:mysql://${BK_MYSQL_IP}:3306","user":"root","password":"${BK_MYSQL_ADMIN_PASSWORD}","driverClass":"com.mysql.cj.jdbc.Driver","serverAggregate":false,"enableSpecialSQL":false,"enableSyncSchemas":true,"syncInterval":"60","properties":{}}",
    "createBy": "1e7f1b3aac2247008e5e0e9be07da599",
    "createTime": "2023-05-30 17:33:24",
    "id": "e866c2e14c0b4aaf956110a63f7d5ba6",
    "index": null,
    "isFolder": false,
    "name": "mysql",
    "orgId": "b044363c75a34df8b40e26c1a61e5dde",
    "parentId": null,
    "permission": null,
    "schemaUpdateDate": "2023-06-05 10:42:16",
    "status": 1,
    "type": "JDBC",
    "updateBy": "1e7f1b3aac2247008e5e0e9be07da599",
    "updateTime": "2023-05-30 17:42:01",
    "deleteLoading": false
    }
    EOF
    curl -s 'http://172.172.172.10:8080/api/v1/sources/e866c2e14c0b4aaf956110a63f7d5ba6' 
    -X 'PUT' 
    -H "${AUTH}" 
    -H 'Content-Type: application/json' 
    --data-binary @/tmp/payload.json 
    --compressed 
    --insecure && rm -vf /tmp/payload.json /tmp/datart.login
  • 注册报表服务到 consul
    # 操作主机:中控机
    
    # 注册报表服务到 consul
    consul kv put bkapps/upstreams/prod/datart "["${datart主机ip}:8083"]"
    
    # 重启nginx
    cd /data/install
    ./bkcli restart nginx
  • 访问代理配置
    • 假设报表服务器:192.168.1.10
    # 操作主机:nginx
    
    # 创建 datart.conf 配置文件
    cd /usr/local/openresty/nginx/conf/conf.d/
    touch datart.conf
    
    # 编辑 datart.conf 配置文件,配置文件内容如下所示
    vim datart.conf
    
    # 验证 nginx 配置文件,返回successful为正常
    /usr/local/openresty/nginx/sbin/nginx -t
    
    # 若返回正常,则重载 nginx 配置
    systemctl restart openresty.service
    • datart.conf 配置文件
    server {
        listen 80;
        server_name datart.weops.net;
    
        location / {
            proxy_pass http://192.168.1.10:8083;
        }
    }

APM模块部署

推荐配置:

  • 操作系统 :CentOS 7.9
  • 机器配置 :8 核 32GB,硬盘 200G 以上
  • 部署方式:建议独立部署在一台服务器上

准备工作

准备介质包

序号 介质包名 文件名称 上传路径 备注
1 APM模块部署介质包 weops-release-apm.tar.gz /data/ tempo、alertmanager、agent、prometheus镜像包

APM模块依赖组件

序号 组件名称 文件名称 镜像名称 镜像tag 镜像描述
1 tempo tempo.tgz docker-bkrepo.cwoa.net/ce1b09/weops-docker/tempo 2.3.0 APM依赖存储组件
2 alertmanager alertmanager.tgz docker-bkrepo.cwoa.net/ce1b09/weops-docker/alertmanager 0.26.0 APM告警组件
3 agent agent.tgz docker-bkrepo.cwoa.net/ce1b09/weops-docker/agent lastest APM依赖数据接收
4 prometheus prometheus,tgz docker-bkrepo.cwoa.net/ce1b09/weops-docker/prometheus weops-4.7 APM专用prometheus

同步环境变量

特殊说明:若部署服务器已同步蓝鲸环境变量,则跳过,无需执行

# 操作主机:中控机

cd /data/install

# 增加 APM 模块角色配置,假设 APM 服务器IP:10.0.1.1,以实际为准
vim install.config
# 增加行:
10.0.1.1 weopsapm

./bkcli install bkenv
./bkcli sync common
scp ~/.bkrc ~/.bashrc root@10.0.1.1:~/ 

# 同步后,注释增加的行后再次同步
vim install.config
# 注释行:
# 10.0.1.1 weopsapm

./bkcli install bkenv
./bkcli sync common

部署 docker-ce

特殊说明:若部署服务器已安装docker,则跳过,无需执行

# 操作主机:APM服务器

# 解压 APM 模块部署包
tar zvf /data/weops-release-apm.tar.gz -C /data/

# 配置 Blueking yum源
scp ${crontrol_ip}:/etc/yum.repos.d/Blueking.repo /etc/yum.repos.d/

# 安装 docker-ce,版本:20.10.23
yum install -y docker-ce

# 创建 docker 配置文件daemon.json
mkdir /etc/docker
cp /data/weops-apm/docker_conf/daemon.json /etc/docker/daemon.json

# 启动 docker 并设置开机自启
systemctl start docker
systemctl enable docker

# 查看 docker 版本,版本号:20.10.23
docker version

部署 docker-compose

# 操作主机:APM 服务器

cp /data/weops-log/docker-compose-linux-x86_64 /usr/local/bin/docker-compose
chmod +x /usr/local/bin/docker-compose

导入镜像

# 操作主机:APM 服务器

# 自动导入镜像包
/data/weops-apm/install/load_images.sh

部署 APM

# 操作主机:APM 服务器

# 生成配置文件
/data/weops-apm/configs/apm_config.sh

# 启动容器
docker-compose -f /data/weops/tempo/docker-compose.yaml up -d

APM 模块初始化配置

SaaS 环境变量更新

操作路径:登录开发者中心

附录

离线 yum 源配置方法

  1. 备份 repos 文件
    mkdir /etc/yum.repos.d/bak
    
    # 把原有的repo文件保存到bak下
    mv /etc/yum.repos.d/*.repo /etc/yum.repos.d/bak  
  2. 配置系统 yum 源
    # 1.预先找对接负责人把Centos镜像挂载到服务器或者上传Centos镜像到服务器上进行挂载
    
    # 2.yum源文件目录创建和repo文件备份
    mkdir -p /data/os  # 创建 /data/os 目录
    mount /dev/cdrom /data/os  # 挂载镜像到 /data/os 下
    
    # 3.配置系统yum源配置文件
    vim /etc/yum.repos.d/CentOS-Base.repo    
    
    # 写入文件添加以下内容:
    [Centos7]
    name=Centos7
    baseurl=file:///data/os/
    enabled=1
    gpgcheck=0
  3. 配置离线蓝鲸 epel 源
    # 1.上传离线yum源文件包上传到/data/下
    
    # 2.制作yum源
    tar -zxvf cwyum.tar.gz -C /data/cwyum # 解压离线yum源 
    yum -y install yum-utils createrepo  # 安装制作epel仓库的工具包
    createrepo -v /data/cwyum
    
    # 3.配置蓝鲸epel源配置文件
    vim /etc/yum.repos.d/cwyum.repo  
    
    #写入文件添加以下内容:
    [cwyum]
    name=cwyum
    baseurl=file:///data/cwyum
    enabled=1   
    gpgcheck=0
  4. yum 源初始化
    # yum源初始化
    
    yum clean all        #清理旧的缓存包
    yum makecache        #缓存新的缓存包 

部署工具包说明

文件名称 用途 备注
weops_install.sh 主脚本,参数为prepare, components, settings
cw_autoconfig.sh 部署环境初始化脚本 由主脚本 weops_install.sh 调用执行。执行初始化,若部分步骤失败,则结束时会进行提示。
config.sh cw_autoconfig.sh涉及的变量配置文件 可根据实际情况调整配置,如:平台包名、主机名等
templates 平台架构模板目录,支持3、5、7节点架构 不适用于高可用架构
weops_components.sh WeOps组件安装的脚本框架 各组件的镜像包及安装脚本在部署工具包的components目录中,由weops_components.sh调用执行
install_saas.sh WeOps SaaS 的安装脚本
install_saas.env WeOps SaaS 安装脚本的配置文件
canway_saas_vars.txt WeOps SaaS 的环境变量配置文件
weops_settings_dbbackup.sh 周期性备份数据库子脚本 由主脚本 weops_install.sh 调用执行
weops_settings_logs.sh 周期性清理日志配置子脚本 由主脚本 weops_install.sh 调用执行
weops_settings_custom.sh WeOps 个性化配置子脚本 由主脚本 weops_install.sh 调用执行
bkmonitorv3_settings.sh 监控后台配置调整子脚本 由子脚本 weops_settings_custom.sh 调用执行

日志模块修改默认密码

# 操作主机:日志模块主机

# 日志模块 admin账号的密码是明文的sha256sum值
# 在Linux上可以通过命令获取,例如密码为123456,则:

echo -n 123456 | sha256sum

# 打开graylog.conf修改
vim /data/weops/datainsight/configs/graylog.conf
root_password_sha2 = 新密码的sha256sum

# 重新拉起docker
cd /data/weops/datainsight/

docker-compose down
docker-compose up -d

备注:若修改了默认密码,需要更新WeOps_SaaS环境变量 GRAYLOG_AUTH ,并重新部署SaaS。

WeOps服务初始化工具

本工具提供了一系列脚本来初始化 WeOps 不同模块的服务,包括 CMDB、监控和 ITSM,支持灵活扩展。

使用方法

您可以使用 main.py 脚本初始化 WeOps 服务的不同组件。可用选项如下:

  • --cmdb:启用 CMDB 初始化
  • --monitor:启用监控初始化
  • --itsm:启用 ITSM 初始化

示例

  • 初始化 CMDB:
    cd /data/weops/init_weops_service/
    
    python main.py --cmdb
  • 初始化监控:
    cd /data/weops/init_weops_service/
    
    python main.py --monitor
  • 初始化 ITSM:
    cd /data/weops/init_weops_service/
    
    python main.py --itsm
  • 初始化所有组件:
    cd /data/weops/init_weops_service/
    
    python main.py --cmdb --monitor --itsm

模块说明

模块 描述
config.py 处理服务的配置设置,并为其他模块提供必要的配置数据。
init_cmdb.py 通过创建必要的分类、对象和关联来初始化 CMDB 组件。
init_monitor.py 通过配置插件并确保所有必要的监控配置到位来初始化监控组件。
init_monitor_other.py 处理监控组件的其他初始化任务,例如同步监控对象和初始化仪表板。
init_itsm.py 初始化 ITSM 组件,设置必要的工作流和 IT 服务管理的配置。
modify_login_session.py 处理会话的登录和 CSRF 令牌初始化。它确保会话已认证并准备好向 WeOps 服务发送请求。
utils.py 提供跨不同模块使用的实用功能,包括获取环境变量和安全的 HTTP 请求。
logging_config.py 配置项目的日志设置。日志写入 logs/init_weops_service.log,最多保留 3 个历史日志文件。
plugins 监控插件源文件的存储路径

日志说明

日志配置为输出到控制台和轮转文件。日志存储在 logs 目录中,最多保留 3 个日志文件。

文件结构

init_weops_service/
├── config.py
├── init_cmdb.py
├── init_monitor.py
├── init_monitor_other.py
├── init_itsm.py
├── modify_login_session.py
├── utils.py
├── logging_config.py
├── main.py
├── plugins
├── logs
|   ├── init_weops_service.log
|   ├── debug.log
|   ├── error.log
|   └── uwsgi_utils.log
└── README.md

评论

  1. 李鸿东
    4 天前
    2025-4-22 17:00:47

    1

    • alanzhuo, alanzhuo
      4 天前
      2025-4-22 17:21:55

      试试回复

      • alanzhuo, alanzhuo
        4 天前
        2025-4-22 17:22:21

        试试回复的回复

发送评论 编辑评论


				
上一篇
下一篇