检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
5表示未高效利用GPU,大于0.8是必要的。 假设一个GPU有N个SM: 一个核函数在整个时间间隔内使用N个线程块运行在所有的SM上,此时该值为1(100%)。 一个核函数在一个时间间隔内运行N/5个线程块,此时该值为0.2。 一个核函数使用N个线程块,在一个时间间隔内,仅运行了1/5个周期的时间,此时该值为0
必填 appName 组件名称,代表一个组件,需要使用英文字符开头。同一个应用下,组件名称不能重复。一个组件可以包含多个环境。不能重复,如果要重复,使用instanceName区分。 必填 env 环境名称,代表一个应用在一个地方的部署。一个应用程序根据配置不同可以部署多个环境,
在“规则名称”列单击统计规则名称,查看统计规则的详细信息。 修改统计规则 单击“操作”列的“编辑”。 删除统计规则 删除一个统计规则:单击“操作”列的“删除”。 删除一个或多个统计规则:选中一个或多个统计规则前的复选框,单击页面上方的“删除”。 说明: 删除统计规则后,您的日志桶、日志文件均不会被删除。
此卡片主要展示基础设施的指标数据。可通过选择集群,呈现某一个集群或者所有集群中的信息。如图选择所有集群,即该基础设施监控卡片呈现所有集群的如下信息: 主机运行状态,CPU、物理内存的使用量。 近30分钟网络流量数据的趋势图,趋势图每1分钟一个点,趋势图每一个点的值表示1分钟内所有集群的接收Bps之
云服务监控 云服务监控展示华为云各服务实例的历史性能数据曲线,最长可查看近1个月内的数据,有助于您了解云服务实例运行状况。 当前支持如下云服务的监控: 弹性负载均衡(ELB)、虚拟私有云(VPC)、关系型数据库(RDS)、分布式缓存服务(DCS)、云硬盘(EVS)、对象存储服务(
则触发场景可以全选。 图2 定义阈值 单击“添加”,完成创建。如下图所示,创建了多个单条阈值规则,一个资源对应一个规则,可使用独立的规则对某个资源进行监控。 如下图所示,对于一个单条阈值规则,其监控对象为某个主机,当主机的CPU使用率超过85%时,在告警界面产生阈值告警,可在左侧导航栏中选择“告警>
图2 拓扑图 事务 现实生活中,事务即一次任务,您使用应用完成一项任务,比如电商应用程序中一次商品查询就是一个事务,一次支付也是一个事务。事务通常表现为一个HTTP请求,表示一个从“请求 > webserver > DB > webserver > 请求”的完整过程。 调用链 调用
删除指标接入规则 删除一个指标接入规则:单击“操作”列的“删除”。 删除一个或多个指标接入规则:选中一个或多个指标接入规则前的复选框,单击列表上的“删除”按钮。 开启/关闭指标接入规则 开启/关闭一个指标接入规则:开启或关闭该指标接入规则的“状态”列的开关。 开启/关闭一个或多个指标接入
修改通知规则 单击“操作”列的。 开启/关闭通知规则 单击“操作”列的“开启”/“关闭”。 删除通知规则 删除一个通知规则:单击“操作”列的。 删除一个或多个通知规则:选中一个或多个通知规则前的复选框,单击页面上方的“删除”。 搜索通知规则 在右上角的搜索框中输入通知规则名称关键字,单击后显示匹配对象。
theus实例所有指标的指标名、指标类型等信息。 根据需要删除自定义指标。 废弃一个指标:选择一个指标,单击操作列的。 批量废弃指标:选中一个或多个指标前的复选框,在弹出框中选择“废弃”,可以废弃一个或多个指标。单次废弃指标最多支持废弃100个指标。 如何恢复已废弃的自定义指标?
其中{region_name}和{version}均可在安装界面获取: region_name:指定承载REST服务端点的服务器域名或IP,不同服务不同区域的名称不同。 Site domain name suffix :站点域名后缀,例如“myhuaweicloud.com”。 version:当前所安装的Uniagent的版本。
单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。 多集群容灾 AOM支持多集群方案,当一个集群异常时,可以继续提供服务。 数据容灾 AOM的配置、指标、告警等数据均是多副本存储,保证了数据可靠性。
单击“操作”列的“修改”。 删除事件类告警规则 删除一个事件类告警规则:单击“操作”列的“删除”。 删除一个或多个事件类告警规则:选中一个或多个事件类告警规则前的复选框,在规则列表上方单击“删除”。 迁移事件类告警规则 选中一个或多个事件类告警规则前的复选框,在规则列表上方单击“一键迁移至2
监控周期内监控对象不满足触发条件时,则恢复告警。默认只监控一个周期,最多可监控5个周期指标数据。 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要启动或者关闭。 默认只监控一个周期,最多可监控5个周期指标数据。 系统处理方式包括:告警、数据不足并发送事件、保持上一个状态、正常。 图1 设置告警条件
其中{region_name}和{version}均可在安装界面获取: region_name:指定承载REST服务端点的服务器域名或IP,不同服务不同区域的名称不同。 Site domain name suffix :站点域名后缀,例如“myhuaweicloud.com”。 version:当前所安装的Uniagent的版本。
可用区(AZ,Availability Zone) 一个AZ是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 华为云的区域默认对应一个项目,这个项目由系统预置
单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。 多集群容灾 AOM支持多集群方案,当一个集群异常时,可以继续提供服务。 数据容灾 AOM的配置、指标、告警等数据均是多副本存储,保证了数据可靠性。
选择指标后,在“操作”列中单击,可为该指标创建告警规则。 复制指标数据 选择指标后,在“操作”列中单击,可复制该指标数据。 删除指标 删除一个指标:在“操作”列中单击。 删除一个或多个指标:选中一个或多个指标前的复选框,单击页面上方的“删除”。 导出监控报告 单击“导出报告”,可将该指标图表以CSV格式导出,以便进行本地存储及进一步分析。
在左侧导航栏单击“指标管理”,进入指标管理页面。 执行如下操作废弃指标: 废弃一个指标:选择一个指标,单击操作列的。 废弃一个或多个指标:选中一个或多个指标前的复选框,在弹出框中选择“删除”,可以废弃一个或多个指标。 新增Prometheus实例指标 当废弃了Prometheus实
化时,您都需要收到通知,则触发场景可以全选。 图2 定义阈值 单击“添加”,完成创建多个单条静态阈值规则,一个资源对应一个规则,可使用独立的规则对某个资源进行监控。 对于一个单条静态阈值规则,若其监控对象为某个主机,当主机的CPU使用率超限时,在告警界面产生阈值告警,可在左侧导航栏中选择“告警