检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。
分组条件 根据设置的条件对告警过滤,筛选出符合分组条件的告警,并为符合分组条件的告警设置告警行动规则。 取值范围说明: 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以
store-test的/home/One-off Dump目录下的log-group2_shard_0(custom).log日志文件中。 将存储在OBS中的日志文件下载到本地,以供定位问题使用。 在一次性转储列表中,单击待操作的OBS桶名称,进入OBS服务的“对象”页面。 在“
安全 责任共担 身份认证与访问控制 数据保护技术 审计与日志 服务韧性 监控安全风险 认证证书
您可以进入AOM的容器监控页面,在工作负载的监控视图里查看服务在各个时间的状态值,0代表正常,非0代表异常。 父主题: 常见使用问题
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。
安全 责任共担 身份认证与访问控制 数据保护技术 审计与日志 服务韧性 监控安全风险 认证证书
集成中心作为Prometheus实例的入口,将容器服务、自定义服务发现、组件监控的关联数据和高频操作进行集中化展示。 当前仅Prometheus for CCE 实例支持。 表2 监控指标采集 功能 功能说明 指标管理 通过新增ServiceMonitor或PodMonitor的方式为应用配置Pr
”字段的值。 如果2为空,则取环境变量“PAAS_MONITORING_GROUP”的值。 如果3为空,则取进程的启动命令中“DAOM.APPN”字段的值。 组件名称取值优先级: 取进程的启动命令中“DAOM.PROCN”字段的值,如果为空则取“Dapm_tier”字段的值。 如
配置日志采集路径 配置容器服务日志采集路径 配置虚机日志采集路径 父主题: 资源接入AOM
执行脚本任务失败,提示 :agent not found 问题现象 在ECS执行脚本任务时失败,系统提示“agent not found”。 可能原因 没有正确安装UniAgent。 UniAgent为非“运行中”状态。 解决方法 检查UniAgent的状态,UniAgent状态有运行中、异常、安装中
2(20%),可能有如下情况: 在整个时间间隔内,有20%的SM的Tensor Core以100%的利用率运行。 在整个时间间隔内,有100%的SM的Tensor Core以20%的利用率运行。 在整个时间间隔的1/5时间内,有100%的SM上的Tensor Core以100%利用率运行。 其他组合模式。
方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为30天。 单击列表右上角,在“表格设置”弹框中通过选中或取消选中可选列前的单选框,自定义可选列的展示与隐藏。 单击列表右上的,可以导
”字段的值。 如果2为空,则取环境变量“PAAS_MONITORING_GROUP”的值。 如果3为空,则取进程的启动命令中“DAOM.APPN”字段的值。 组件名称取值优先级: 取进程的启动命令中“DAOM.PROCN”字段的值,如果为空则取“Dapm_tier”字段的值。 如
方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为30天。 单击列表右上角,在“表格设置”弹框中通过选中或取消选中可选列前的单选框,自定义可选列的展示与隐藏。 单击列表右上的,可以导
is empty", "trace_id" : "" } 状态码: 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 { "error_code" : "APM.00000500", "error_msg" : "Internal
在左侧导航栏选择“Prometheus监控 > 实例列表”,在实例列表中单击已创建的Prometheus实例的实例名称。 在实例详情页面左侧导航栏选择“设置”页签,获取当前实例的服务地址。 单击“内网”或“公网”页签,可以获取对应“内网”或“公网”下的Remote Read Prometheus配置代码。在代码右侧单击可复制该代码到对应文件。
免费体验AOM服务 在华为云学院沙箱实验室,您可以免费体验AOM服务,完成电子商城网站应用的一站式运维。体验地址: 使用AOM实现云端应用一站式运维。
创建仪表盘前,请您先了解仪表盘中支持添加的图表类型,以便选择合适的图表,更精准地对资源进行监控。仪表盘中支持添加的图表如下: 指标数据类图表(包括曲线图和数字图) 曲线图:以时间先后顺序显示指标的数据趋势。当需要监控一段时间内一个或多个资源的指标数据趋势时,请使用此类型图表。 使用曲线图可对不同资源的同一指标进
page_num为正整数 最小值:1 最大值:9999999 page_size 否 Integer 每页显示的条数 最小值:1 最大值:100 order_by_column 是 String 需要排序的字段(默认为更新时间),支持字段有name,create_time,update_time。