检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
操作 说明 仪表盘 另存为 保存仪表盘后,通过页面右侧的“更多”下拉列表框,可另存、重命名或删除仪表盘。 重命名 删除 导出监控报告 单击“导出监控报告”,可将仪表盘中的曲线图以CSV格式导出,以便进行本地存储及进一步分析。 设置全屏模式在线时长 选择待操作的仪表盘,在“仪表盘”页面右上角单击。
取值范围说明: 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以设置为:host、container、process等类型。例如设置为:资源类型+等于+container。 告警
安全 责任共担 身份认证与访问控制 数据保护技术 审计与日志 服务韧性 监控安全风险 认证证书
取值范围说明: 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以设置为:host、container、process等类型。例如设置为:资源类型+等于+container。 告警
# 根据业务情况进行调整。侦听端口 listen [::]:8080; # 根据业务情况进行调整,ipv6侦听端口 server_name localhost; # 根据业务情况进行调整 location = /stub_status { # 具体路径可根据业务情况进行调整
表1 数据写入地址参数说明 参数 说明 自建普罗Remote Write 地址 用户自建普罗的Remote Write地址,请根据实际情况填写。 格式为:{ip:port}/{path}。例如: 192.168.0.1:9090/api/v1/write 鉴权方式 访问用户侧Prometheus的认证方式。
网络指标及其维度 表1 网络指标 指标名称 指标含义 取值范围 单位 下行Bps(aom_node_network_receive_bytes) 该指标用于统计测试对象的入方向网络流速。 ≥0 字节/秒(Byte/s) 下行Pps(aom_node_network_receive_packets)
阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 告警规则分为阈值规则和事件类告警规则两种。通常情况下,通过阈值规则,实时监控环境中主机、组件等资源使用情况。当资源使用告警过多,告警通知过于频繁时,通过事件类告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。
通过前端性能监控,提供页面的性能、JS错误请求、API请求、服务的运营相关指标(PV/UV)情况,实时了解并追踪应用性能情况。 通过用户会话追踪,定位使用过程中影响用户体验的慢请求、慢加载、慢交互等问题,实时了解用户使用情况。 通过页面加载性能分析,提供多维度页面的首屏时间、白屏时间、可交互时间等
、资源使用情况等信息。单击组件名称,可查看该组件所有实例的概况;单击实例名称,可查看进程的监控视图与告警信息。 在“主机列表”页签下,可查看该应用的主机运行状态、资源使用情况等信息。 在“监控视图”页签下,选择对应的Prometheus实例,可查看该应用的资源使用情况。单击页面右上角的,可全屏展示资源信息。
取值范围说明: 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以设置为:host、container、process等类型。例如设置为:资源类型+等于+container。 告警
生异常,迅速处理故障,避免因资源问题造成业务损失。 导出监控数据 云服务监控支持您在所选的区间和周期内最多同时导出10个监控项,导出的监控报告中包含用户名、Region名称、服务名称、实例名称、实例ID、指标名称、指标数据、时间、时间戳,查询和筛选更加方便。 登录AOM 2.0控制台。
监控安全风险 AOM通过多种方式监控安全风险,保障数据安全可靠,具体请参见表1。 表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、组件监控、主机监控、容器监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。
监控安全风险 AOM通过多种方式监控安全风险,保障数据安全可靠,具体请参见表1。 表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、工作负载监控、集群监控、主机监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。
IAM是华为云提供权限管理的基础服务,无需付费即可使用,您只需要为您账号中的资源进行付费。关于IAM的详细介绍,请参见《IAM产品介绍》。 AOM权限 默认情况下,管理员创建的IAM用户没有任何权限,您需要将其加入用户组,并给用户组授予策略或角色,才能使得用户组中的用户获得对应的权限,这一过程称为
面进行查询。 PAAS_PROJECT_ID:租户的项目ID。获取方法详情请参见:获取项目ID。 以上env相关参数的value请根据实际情况替换。 图2 添加env参数 添加完成后,单击“确定”,保存修改结果。 解决方法二 您还可以直接在helm部署pod的yaml文件中添加如下env相关参数,然后重新部署pod。
该值表示一个时间间隔内的所有SM的平均值。 占用率越高不代表GPU使用率越高。只有在GPU内存带宽受限的工作负载(DCGM_FI_PROF_DRAM_ACTIVE)情况下,更高的占用率表示更有效的GPU使用率。 0~1.0 占比(Fraction) DCGM_FI_PROF_PIPE_TENSOR_ACTIVE
单击右上角的,可全屏展示资源信息。 在“相关资源”页签下,展示该节点所在的容器组。 在左侧导航栏选择“洞察 > 工作负载 ”,可查看该集群的所有工作负载状态和资源使用情况。 在工作负载列表上方,可按负载类型和负载名称设置过滤条件,实现工作负载过滤显示。 单击右上角的,通过选中或取消选中各展示项后的单选框,自定义可选列的展示与隐藏。
使用。 2 Debugging诊断仅支持JAVA语言。 性能影响 Debugging诊断功能经性能测试,在一般的应用所有功能效果全部开启的情况下, CPU提升<5%,内存提升<100MB,时延提升<5%左右。 父主题: 通过Debugging诊断代码
”变为“未安装”时,表示卸载成功。 通过界面卸载ICAgent后如果需要再次安装,请等待5分钟后执行安装操作,否则可能出现被再次自动卸载的情况。 登录服务器卸载 以root用户登录需卸载ICAgent的服务器。 执行如下命令卸载ICAgent。 bash /opt/oss/ser