检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。
自动化运维(aom2.0接口) 创建任务 更新任务 对暂停中的任务进行操作 获取工作流执行中的执行详情 终止任务执行 脚本查询 脚本版本查询 作业管理主页模糊查询 根据作业id查询方案(自定义模板)列表 获取方案信息 查询任务列表 获取任务执行历史 执行工作流 父主题: API
标签定义 PromQL 主机CPU使用率 {nodeIP="",hostID=""} aom_node_cpu_usage{nodeIP="192.168.57.93",hostID="ca76b63f-dbf8-4b60-9c71-7b9f13f5ad61"} 主机应用请求吞吐量 {aomApplicationID=""
查看当前应用的组件列表、主机列表、监控视图以及告警。 在“组件列表”页签下,可查看该应用的组件运行状态、资源使用情况等信息。单击组件名称,可查看该组件所有实例的概况;单击实例名称,可查看进程的监控视图与告警信息。 在“主机列表”页签下,可查看该应用的主机运行状态、资源使用情况等信息。
进入华为云官网,单击页面右上角的“注册”。 参考注册华为账号并开通华为云中操作,完成注册。 注册后参考实名认证完成个人或企业账号实名认证。 开通AOM 2.0。 使用AOM 2.0前,需要先开通AOM 2.0。如果您已开通AOM 2.0,可直接跳过如下操作。 登录AOM华为云官网。
通过数十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker、kubernetes等应用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及
参数类型 说明 content 是 string 消息模板内容。 subType 是 string 消息模板发送类型,支持:email,sms,webhook。 topic 否 string 邮件主题。 sendType 否 string 当消息模板发送类型为“webhook”时
conf 输入“i”进入编辑模式,添加如下配置信息: server { listen 8080; # 根据业务情况进行调整。侦听端口 listen [::]:8080; # 根据业务情况进行调整,ipv6侦听端口 server_name localhost; # 根据业务情况进行调整
运维管理概述 自动化运维服务依托华为云UniAgent运维通道的能力,提供批量脚本执行、文件分发、云服务变更等原子操作功能,支持自定义编排原子操作并组装成作业和标准化运维流程。自动化运维将日常运维操作沉淀并发布成服务,实现日常变更的标准化、自动化、无差异化运维,将运维工作从日常重
行2。 进入华为云官网,单击页面右上角的“注册”。 参考注册华为账号并开通华为云中操作,完成注册。 注册后参考个人账号如何完成实名认证或企业账号如何完成实名认证中操作,完成个人或企业账号实名认证。 申请AstroCanvas免费试用。 使用1中的账号,登录华为云官网,在顶部导航栏右侧单击“控制台”,进入华为云控制台。
可观测大屏监控 运维可观测大屏是基于华为云Astro低代码平台开发的面向不同场景、角色的运维监控大屏,基于现网质量、服务韧性、评估优化等N大主题域,通过运维数据建模、可视化等数据分析能力,提供企业级运维沙盘。满足您全场景、自动化、可量化、可观测的一体化监控解决方案,为业务健康和稳定保驾护航。
MySQL)、云数据库(RDS for PostgreSQL)、云数据库(RDS for SQL Server)、应用与数据集成平台(ROMA Connect)、视频直播服务(Live)、消息通知服务(SMN)、安全云脑 SecMaster(SecMaster)、应用管理与运维平台(Service
{} terminationGracePeriodSeconds: 30 --- apiVersion: v1 kind: Service metadata: name: memcached-exporter spec: type: NodePort selector:
{} terminationGracePeriodSeconds: 30 --- apiVersion: v1 kind: Service metadata: name: es-exporter name-space: default # 与Exporter部署的namespace相同
} terminationGracePeriodSeconds: 30 --- apiVersion: v1 kind: Service metadata: name: mongodb-exporter spec: type: NodePort selector:
自动化运维 “√”表示支持,“x”表示暂不支持。 表1 自动化运维 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 创建任务 POST /v1/{project_id}/cms/workflow cms:workflow:create
0控制台,在左侧导航栏中选择“设置”,进入“全局配置”界面。 在左侧导航栏中,选择“UniAgent安装与配置”,选择待安装ICAgent的主机,单击“插件批量操作”。 在弹出的对话框中,操作类型选择“安装”,选择插件为“ICAgent”,插件版本选择“5.12.163”,在“ak”、“sk”中输入1获取的AK/SK。
最小长度:0 最大长度:128 event_names Array of strings 事件名称 migrated Boolean 是否迁移到2.0 topics Array of SmnTopics objects smn信息 表5 metadata 参数 参数类型 描述 customField
对某个资源进行监控。 如下图所示,对于一个单条阈值规则,其监控对象为某个主机,当主机的CPU使用率超过85%时,在告警界面产生阈值告警,可在左侧导航栏中选择“告警> 告警列表”,在告警列表中查看该告警;当主机满足已设的通知策略时,就会发送邮件或短信。 图3 单条阈值规则 更多阈值规则操作
接入Prometheus后,为什么会产生额外费用? CCE容器场景 通常情况下,用户购买CCE集群,部署工作负载之后,默认会采集cluster、Pod、Container、Node等基础指标-容器指标,基础指标的上报不产生费用。 产生计费的可能原因是: Prometheus实例内