检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
5表示未高效利用GPU,大于0.8是必要的。 假设一个GPU有N个SM: 一个核函数在整个时间间隔内使用N个线程块运行在所有的SM上,此时该值为1(100%)。 一个核函数在一个时间间隔内运行N/5个线程块,此时该值为0.2。 一个核函数使用N个线程块,在一个时间间隔内,仅运行了1/5个周期的时间,此时该值为0
Prometheus实例 for 云服务 云服务Prometheus实例类型,适合监控云服务的多种指标。 约束与限制 一个企业项目下仅可以创建一个云服务类型的Prometheus实例。 创建云服务Prometheus实例 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控
同时在AOM界面还可查看相关的日志和告警。 云容器实例服务 云容器实例服务(Cloud Container Instance,简称CCI)提供 Serverless Container(无服务器容器)引擎,让您无需创建和管理服务器集群即可直接运行容器。 通过AOM界面您可监控C
提供监控概览及仪表盘功能。 监控概览 “监控概览”界面提供了资源、应用、应用用户体验的全链路、多层次、一站式运维界面。 仪表盘 通过仪表盘可将不同图表展示到同一个屏幕上,通过不同的仪表形式来展示资源数据,例如,曲线图、数字图等,进而全面、深入地掌握监控数据。 告警 提供告警列表、事件列表、告警规则、告警通知等功能。
件之间请用“,”间隔。例如搜索名称包含“AOM”和“LTS”的应用或资源,可在搜索框输入“aom,lts”。 企业项目 企业项目,一个项目可以包含一个或者多个应用。 登录AOM 2.0控制台。 在左侧导航栏选择“应用洞察(日落) > 应用资源管理”,进入“应用资源管理”界面。 在
匹配方式为“=~”:此时维度值根据设置的一个或多个正则表达式确定,多个正则表达式间通过“|”间隔。例如,维度名称设置为“主机名称”,正则表达式设置为“192.*|172.*”,表示只监控主机名为“192.*”和“172.*”的资源。 匹配方式为“!~”:此时维度值根据设置的一个或多个正则表达式确定,
组件监控 组件即您部署的服务,包括容器和普通进程。例如,云容器引擎(CCE)服务中的工作负载(workload)可以是一个组件,同时直接在虚机上运行的tomcat也可以是一个组件。 组件列表展示了每个组件的类型、CPU占用、内存占用和告警状态等信息,您可直观了解每个组件的运行状态。单击
接入Prometheus后,为什么会产生额外费用? CCE容器场景 通常情况下,用户购买CCE集群,部署工作负载之后,默认会采集cluster、Pod、Container、Node等基础指标-容器指标,基础指标的上报不产生费用。 产生计费的可能原因是: Prometheus实例内置的指标管理功能采集到自定义指标并上报指标到AOM。
栈”。 单击“组件”列中某一个组件名称,进入该组件详情页,默认展示“接口调用”详细信息。 单击“Debugging诊断(Beta)”,切换至Debugging诊断页签。默认展示“线程分析”页面。 图1 Debugging诊断 在实例的下拉菜单中,选择一个实例,可以查看此实例下所有
docker-containe Tue Oct 2 21:12:29 2018 docker-containerd -l unix:///var/run/docker/libcontainerd/docker-containerd.sock --shim docker-containerd-shim
停止计费 对于以按需计费模式使用的AOM 2.0资源,相关指标和日志数据从上报之日起,在AOM 2.0上会自动存储一个月,一个月后系统自动删除数据,删除后相关数据将停止计费。如果用户需要继续使用相关指标和日志数据,建议采用以下方式存储: 日志数据:通过日志转储功能,将日志数据转储到OBS桶中,以便进行长期存储。
docker-containe Tue Oct 2 21:12:29 2018 docker-containerd -l unix:///var/run/docker/libcontainerd/docker-containerd.sock --shim docker-containerd-shim
ICAgent安装类常见问题 ICAgent安装机和目标机器网络不通,报错提示“[warn] ssh connect failed, 1.2.1.2:22”如何解决? 答:安装之前先在安装页面单击连接测试,选择网络能通的安装机。 ICAgent安装成功后,后续的心跳和注册都失败,代理机网络不通,如何解决?
说明 修改阈值规则 单击“操作”列的“编辑”。 删除阈值规则 删除一个阈值规则:单击“操作”列的“删除”。 删除一个或多个阈值规则:选中一个或多个阈值规则前的复选框,在规则列表上方单击“删除”。 迁移阈值规则 选中一个或多个阈值规则前的复选框,在规则列表上方单击“一键迁移至AOM2
{region_id}=cn-north-4 {obs_domain}=obs.cn-north-4.myhuaweicloud.com 下载命令的拼接规则:wget https://aom-uniagent-{region_id}.{obs_domain}/install_uniagentd_self_OS
产品架构 AOM是一个以资源数据为中心并关联日志、指标、资源、告警和事件等数据的立体运维服务。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集
public static void main(String[] args) { // The AK and SK used for authentication are hard-coded or stored in plaintext, which has great
conditions 是 参见表5 conditions最多5个,最少1个 匹配条件内容。一个规则可以有多个条件,多个条件之间的关系是“并且”,内部描述了多个详细匹配条件。一个条件可以描述一个metric的匹配方式。 actions 是 参见表6 actions最多5个,最少1个 指定策略匹配成功后执行的动作。
折线图:属于趋势类分析图表,一般用于表示一组数据在一个有序数据类别(多为连续时间间隔)上的变化情况,用于直观分析数据变化趋势。当需要监控一段时间内一个或多个资源的指标数据趋势时,请使用此类型图表。 使用折线图可对不同资源的同一指标进行对比,如下图所示,在同一个图表中展示了不同主机的CPU使用率。
化时,您都需要收到通知,则触发场景可以全选。 图2 定义阈值 单击“添加”,完成创建多个单条静态阈值规则,一个资源对应一个规则,可使用独立的规则对某个资源进行监控。 对于一个单条静态阈值规则,若其监控对象为某个主机,当主机的CPU使用率超限时,在告警界面产生阈值告警,可在左侧导航栏中选择“告警