检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
search_time_start 否 Long 时间范围查询的开始时间。 最小值:0 最大值:9999999999999 search_time_end 否 Long 时间范围查询的结束时间。 最小值:0 最大值:9999999999999 status 否 String 任务的状态 ["success","fail"
控页面选择需要监控的组件ID。还可对仪表盘执行表1中的操作。 更多操作 表1 仪表盘相关操作 操作 说明 全屏显示 选择待操作的仪表盘,在“仪表盘”页面右上角单击,可全屏显示仪表盘。 退出全屏显示 将光标移至屏幕上方,单击弹出的,或者单击,或者按键盘中的“Esc”可退出全屏模式。
根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。 将AOM资源委托给更专业、高效的其他华为云账号或者云服务,这些账号或者云服务可以根据权限进行代运维。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用AOM服务的其它功能。
如图5所示,单击规则名称前的,可查看该告警规则的详细信息。 在展开的列表中,只要监控对象满足设置的告警条件时,在告警列表界面就会生成一条指标类告警,您可在左侧导航栏中选择“告警管理 > 告警列表”,在告警列表中查看该告警。只要当前示例使用的DCS实例的CPU利用率指标满足已设的通知策略,系统就会以邮件、短信或企业微信等方式发送告警通知给指定人员。
根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。 将AOM资源委托给更专业、高效的其他华为云账号或者云服务,这些账号或者云服务可以根据权限进行代运维。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用AOM服务的其它功能。
标。 需要监控某个成员账号的指标,则单击“成员账号”文本框,在弹出的搜索框中输入账号关键字,下面的账号树中自动显示相关的成员账号,根据需要勾选需要监控的成员账号即可。 需要停止监控某个成员账号的指标,则在“账号接入”界面的“成员账号”文本框中删除对应的成员账号。 接入云服务:从云
使用自动化运维资源。 根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。 将自动化运维资源委托给更专业、高效的其他华为云账号或者云服务,这些账号或者云服务可以根据权限进行代运维。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用自动化运维服务的其它功能。
指标采集间隔(秒) 指标采集的周期,单位为秒(s),默认为60s,可选择10、30和60。 指标采集超时时间(秒) 执行指标采集任务的超时时间,单位为秒(s),默认为60s,可选择10、30和60。 说明: 超时时间必须小于或等于采集周期。 执行用户 执行指标接入规则的用户,即所选主机的用户,默认为root。
插件配置 操作系统 主机的操作系统,支持Linux和Windows。基于创建的自定义插件脚本的操作系统自动选择。 采集插件 默认已创建的自定义插件卡片。 插件版本 选择插件的版本。 说明: 未上线的插件版本,则置灰,无法选择。 采集任务 采集任务名 采集任务的名称。大小写字母、数字
什么是应用运维管理 运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。
使用分组规则,您可以从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。
URL在采集周期内的平均响应时间。 url错误率 URL的错误率。 mysql错误率 MySQL的错误率。 redis错误率 Redis的错误率。 说明: “redis错误率”指标列默认不展示,可单击右上角,通过选中或取消选中“redis错误率”指标项前的单选框,自定义该列的展示与隐藏。
list failed.” 问题描述 在应用资源管理的“首页”界面进行资源检索时,系统提示“AOM.11007006: get policy list failed.” 可能原因 当前用户账号已欠费或者被冻结,导致没有应用资源管理的操作权限。 解决方法 账号欠费:客户欠费后,为防止
UniAgent:UniAgent的全称是统一数据采集Agent,主要是作为云服务运维系统的底座,为AOM提供指令下发,如脚本下发和执行,用于插件集成(ICAgent、CES、telescope等)并维护其状态。UniAgent对外功能主要是为AOM服务提供中间件指标采集和自定义指标采集的能力。 Un
在左侧导航栏选择“Prometheus监控 > 实例列表”,在实例列表中单击已创建的Prometheus实例的实例名称。 在实例详情页面左侧导航栏选择“设置”页签,获取当前实例的服务地址。 单击“内网”或“公网”页签,可以获取对应“内网”或“公网”下的Remote Read Prometheus配置代码。在代码右侧单击可复制该代码到对应文件。
配置CCE集群指标管理 通过新增ServiceMonitor或PodMonitor的方式为应用配置可观测监控 Prometheus 版的采集规则,来监控部署在CCE集群内的应用的业务数据。 前提条件 服务已接入CCE类型Prometheus 监控并接入CCE集群,具体请参见Prometheus实例
APM Agent会周期性采集一些App监控的性能指标数据,用来衡量Android端、iOS端以及Harmony端的总体健康状况。可以采集崩溃、卡顿、错误、启动性能、网络请求、终端设备以及自定义上报等数据,帮助用户全面掌握App应用的运行情况。 登录AOM 2.0控制台。 在左侧导航栏选择“App监控
驱逐次数(即使未强制执行) 主机因连续返回5xx导致的驱逐次数(即使未强制执行)。 ≥0 次 envoy_cluster_ejections_detected_consecutive_gateway_failure 检测到的连续网关故障的驱逐次数 检测到的连续网关故障的驱逐次数(即使未强制执行)。 ≥0
页面,单击已发布成服务的方案所在行操作列的“取消发布”。 图11 取消发布 在弹出的“取消发布”对话框中,确定是否要取消发布执行方案,单击“是”即可取消发布。 更多操作 作业创建完成后,您可以在作业管理列表单击对应的作业名称进入该作业的详情页面,查看作业的基本信息、全局参数和作业步骤,还可执行表7中的操作。
可以选择default类型的Prometheus实例和自定义创建的Prometheus实例,默认选择default类型的Prometheus实例。 支持选择的数据源类型:Prometheus for 云服务、Prometheus for ECS、Prometheus for CCE、Prometheus