检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
适用于监控各种系统平台、硬件监控、网络设备监控等。
运维中心监控服务 如何查看EAP详细日志? 删除告警任务失败 告警后触发知识编排任务提示alert_type不存在 创建CES指标采集报错 如何卸载虚拟机上安装的filebeat? 异常检测Judge定时任务失败 保存异常检测告警配置时报错
什么是应用管理与运维平台 应用管理与运维平台(ServiceStage)是面向企业的应用管理与运维平台,提供应用发布、部署、监控与运维等一站式解决方案。支持Java、Php、Python、Node.js、Docker、Tomcat技术栈。
运维监控类 删除BCS实例后,如何清理残留日志文件? 实例详情日志重复打印TLS handshake failed 父主题: Hyperledger Fabric增强版
什么是云监控服务? 云监控服务为用户提供一个针对弹性云服务器、带宽等资源的立体化监控平台。使您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。云监控服务架构图如图1所示。
快速部署 本章节主要帮助用户快速部署“基于WGCLOUD搭建运维监控平台”解决方案。 表1 参数填写说明 参数名称 类型 是否必填 参数解释 默认值 vpc_name String 必填 虚拟私有云名称,该模板新建VPC,不允许重名。
云智慧数字化智能运维可观测日志平台系统功能 警管理 仪表盘 日志分析 监控器 管理──数据管理 父主题: 实施步骤
方案架构 该解决方案可以帮助您在华为云弹性云服务器 ECS上基于WGCLOUD搭建运维监控平台。解决方案架构如下图所示: 图1 方案架构图 该解决方案会部署如下资源: 创建一台弹性云服务器 ECS,用于搭建WGCLOUD运维监控平台。
运维监控原则 当应用部署在公有云上,云平台需提供已开通资源的监控能力,包括计算、存储、网络、数据库等云服务资源。资源监控指标反馈资源的运行状态、资源消耗和性能参数等,运维人员可根据不同参数配置相应的阈值告警,当资源异常时通过短信或邮件等方式通知。
运维监控 日志管理 父主题: 系统管理
实时作业监控 实时作业监控提供了对实时处理作业的状态进行监控的能力。 实时处理作业处理实时的连续数据,主要用于实时性要求高的场景。实时作业是由一个或多个节点组成的流水线,每个节点配置独立的、节点级别的调度策略,而且节点启动的任务可以永不下线。
登录WGCLOUD运维监控平台。 访问 步骤10 中的站点URL ,进入WGCLOUD运维监控平台首页,默认账号:admin,密码:111111 图1 登录WGCLOUD运维监控平台 WGCLOUD运维监控平台界面。
快速卸载 解决方案部署成功后,单击该方案堆栈后的“删除”。 图1 一键卸载 在弹出的删除堆栈确定框中,输入Delete,单击“确定”,即可卸载解决方案。 图2 删除堆栈确定 父主题: 实施步骤
资源和成本规划 该解决方案主要部署如下资源,不同产品的花费仅供参考,实际以收费账单为准,具体请参考华为云官网价格: 表1 资源和成本规划(包年包月) 华为云服务 配置示例 每月预估花费 弹性云服务器 ECS 区域:华北-北京四 计费模式:包年包月 规格:X86计算 | ECS |
实时集成作业监控:查看作业详细信息 单击作业名称,可以查看该作业的详细信息。 选择“基本信息”,查看该作业的基本信息。 选择“监控信息”,查看该作业的监控信息。 单击“查看监控指标”,进入云监控服务界面查看该作业的相关监控指标。
准备工作 创建rf_admin_trust委托(可选) 进入华为云官网,打开控制台管理界面,鼠标移动至个人账号处,打开“统一身份认证”菜单。 图1 控制台管理界面 图2 统一身份认证菜单 进入“委托”菜单,搜索“rf_admin_trust”委托。 图3 委托列表 如果委托存在,则不用执行接下来的创建委托的步骤
修订记录 表1 修订记录 发布日期 修订记录 2024-08-30 第一次正式发布。
实施步骤 准备工作 快速部署 开始使用 快速卸载
云端多维度监控实现对业务立体运维,结合自动告警规则达到对故障的快速感知定位处理 父主题: 参考案例
作业监控 批作业监控 实时作业监控 实时集成作业监控 父主题: 运维调度
表1 AOM支持的授权项 授权项 描述 访问级别 资源类型(*为必须) 条件键 aom:metric:delete 授予权限以删除监控配置信息。 write - - aom:icmgr:get 授予权限以获取采集组件版本信息。
AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker、kubernetes等应用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。
附录 名词解释 基本概念、云服务简介、专有名词解释 弹性云服务器 ECS:是一种可随时自助获取、可弹性伸缩的云服务器,可帮助您打造可靠、安全、灵活、高效的应用环境,确保服务持久稳定运行,提升运维效率。 弹性公网IP EIP:提供独立的公网IP资源,包括公网IP地址与公网出口带宽服务
在数据开发主界面的左侧导航栏,选择“运维调度 > 作业监控”。 单击“批作业监控”页签,进入批作业的监控页面。 单击作业名称,进入后单击作业节点。查看作业节点监控的详细信息。 单击“编辑”,将进入该作业的开发页面。 父主题: 作业监控
AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker、kubernetes等应用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。
查询作业监控信息(废弃) 功能介绍 该API用于查询作业监控信息, 支持同时查询多个作业的监控信息。 当前接口已废弃,不推荐使用。 调试 您可以在API Explorer中调试该接口。
实施作业平台安装 安装实施作业平台 安装包获取 由项目经理向公司质量管理部门申请出库。 图1 获取安装包 下载安装包 下载完所需要的安装包后,将安装包复制到服务器的/home目录下。
运维监控限制:CloudPond的运维和监控操作由华为云运维团队统一执行,用户可以通过CES对CloudPond上运行的资源状况进行监控,不能直接访问运维监控平台。