检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
该值表示所有SM的平均值,且该值对每个块的线程数不敏感。 线程束处于Active是指一个线程束被调度且分配资源后的状态,可能是在Computing、也可能是非Computing状态(例如等待内存请求)。 该值小于0.5表示未高效利用GPU,大于0.8是必要的。 假设一个GPU有N个SM:
应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。 AOM有哪些优势 图3 AOM优势1 图4 AOM优势2
“监控 > 组件监控”,在集群下拉列表框中选择主机,找到已被监控的组件。 查看应用状态 在左侧导航栏中选择“监控 > 应用监控”。 单击应用名称查看应用下面相关资源与组件信息。 图1 查看应用状态 在“组件列表”页签查看应用下面组件列表。 图2 查看组件列表 单击“主机列表”可以查看当前应用所关联的主机信息。
9104 targetPort: 9104 验证MySQL Exporter是否部署成功。 在工作负载列表中“无状态负载”页签下,单击3.b创建的无状态工作负载的名称,在实例列表中单击操作列下的“更多 > 日志”,可以查看到Exporter成功启动并暴露对应的访问地址。 图3
在“账号接入”界面可以管理成员账号、接入云服务、选择数据存储,并添加云服务支持的相关指标。 管理成员账号:AOM为企业用户提供多账号关系的管理能力,支持用户将多个华为云账号整合到创建的组织中,并可以集中管理组织下的所有账号。组织下有三种成员类型,分别为组织管理员、委托管理员和普通用户。普通用户无权限在AOM监控多账号指标。
可跨集群选择。 1个数字图最多可添加12个资源,只能展示1个资源,默认展示第一个资源。 1个阈值状态图表最多可添加10个阈值规则。 1个主机状态图表最多可添加10个主机。 1个组件状态图表最多可添加10个组件。 指标 指标数据 基础规格:指标数据在数据库中最多保存7天。 专业规格:指标数据在数据库中最多保存30天。
后,集群指标将无法托管至此实例。 查看Prometheus实例计费状态 Prometheus实例列表中,“计费模式”列呈现Prometheus实例计费模式与创建时间。当前AOM仅支持按需计费。 当处于冻结、受限状态时,无法进行增加、删除、修改Prometheus实例的操作。 欠费
该指标用于统计被限流的请求数。 ≥0 个 envoy_cluster_circuit_breakers_default_cx_open 连接断路器触发状态 0:连接断路器低于其并发限制。 1:连接断路器已达到容量限制不再接纳。 0、1 无 envoy_cluster_circuit_breakers_high_cx_open
可跨集群选择。 1个数字图最多可添加12个资源,只能展示1个资源,默认展示第一个资源。 1个阈值状态图表最多可添加10个阈值规则。 1个主机状态图表最多可添加10个主机。 1个组件状态图表最多可添加10个组件。 指标 指标数据 基础规格:指标数据在数据库中最多保存7天。 专业规格:指标数据在数据库中最多保存30天。
变化等待 合并集合内的告警数据发生变化后,等待多久发送告警通知。此处的变化是指新增告警或告警状态改变。 60秒 重复等待 合并集合内的告警数据重复后,等待多久发送告警通知。此处的重复是指无新增告警和状态变化,仅其他属性(例如标题、内容等)改变。 1小时 单击“立即创建”。 步骤二:创建全量指标告警规则
通过在VPC内的某台虚机上安装uniagent(Exporter)插件提供针对此VPC内ECS应用和组件(如数据库,中间件等)的一体化监控。 适合需要对运行在华为云的虚拟私有云VPC内(通常为弹性云服务器ECS集群)的应用组件进行监控场景,可以通过接入中心添加Prometheus中间件及自定义插件监控。
仪表盘中图表可选资源、阈值规则、组件或主机数量 1个数字图最多可添加12个资源,只能展示1个资源,默认展示第一个资源。 1个阈值状态图表最多可添加10个阈值规则。 1个主机状态图表最多可添加10个主机。 1个组件状态图表最多可添加10个组件。 指标 指标数据存储时长 基础规格:指标数据在数据库中最多保存7天。
见警告提示框的“引用详情”。 下架后服务场景页面将不展示该卡片,并且在工具市场页面系统默认的卡片会同步下架,作业方案卡片对应的执行方案发布状态更新为未发布。 下架服务卡片后 ,服务卡片关联的任务将不能再次执行,待卡片重新上架后,关联的任务将恢复执行功能。 “文件管理”、“脚本管理”属于默认功能,不支持下架。
文件包创建完成后,您可以在文件列表页面对文件执行安装或卸载任务。执行脚本依赖uniAgent的能力,用户需要确保执行脚本的ECS实例已经安装uniAgent且为运行中状态。 在左侧导航栏中选择“文件管理”,在文件管理页面,单击文件列表待执行任务的文件所在行操作列的“安装”或“卸载”。 进入文件包安装或文件包
也可设置为秒级时间。 此处的变化是指新增告警或告警状态改变。 取值范围:5s-30min,推荐设置为60s。 重复等待 合并集合内的告警数据重复后,等待多久发送告警通知。通常设置为小时级别的时间。 此处的重复是指无新增告警和状态变化,仅其他属性(例如标题、内容等)改变。 取值范围
单击任务列表右上角的按钮,可刷新列表信息。 查看任务信息 单击任务ID,可以查看该任务的具体信息,包括主机名、IP名、插件类型、任务类型、执行状态、执行失败的原因、执行事件、执行耗时和查看操作日志。 过滤任务信息 在任务列表的表头,单击各列的,可按特定类型过滤显示任务的信息。 切换任务排序
单击任务列表右上角的按钮,可刷新列表信息。 查看任务信息 单击任务ID,可以查看该任务的具体信息,包括主机名、IP名、插件类型、任务类型、执行状态、执行失败的原因、执行事件、执行耗时和查看操作日志。 过滤任务信息 在任务列表的表头,单击各列的,可按特定类型过滤显示任务的信息。 切换任务排序
单击“一键添加至白名单”将AOM提供的账号ID,添加至终端节点服务的白名单中。 创建终端节点。 单击“一键创建终端节点”。 在终端节点服务的详情页,单击“连接管理”,确认状态为已接受。 配置数据写入地址。请参考具体的参数设置如表1所示。 表1 数据写入地址参数说明 参数 说明 自建普罗Remote Write 地址
触发策略的规则 create_time String 创建时间 update_time String 更新时间 status String 状态 表4 rule字段数据结构说明 参数名称 参数类型 描述 name string 策略名称 conditions 参见表5 匹配条件具体内容。
此卡片主要展示基础设施的指标数据。可通过选择集群,呈现某一个集群或者所有集群中的信息。如图选择所有集群,即该基础设施监控卡片呈现所有集群的如下信息: 主机运行状态,CPU、物理内存的使用量。 近30分钟网络流量数据的趋势图,趋势图每1分钟一个点,趋势图每一个点的值表示1分钟内所有集群的接收Bps之和