检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何导出监控数据? Agent状态切换或监控面板有断点该如何处理? Excel打开监控数据CSV文件乱码如何处理? 更多 智能客服 您好!我是有问必答知识渊博的的智能问答机器人,有问题欢迎随时求助哦! 社区求助 华为云社区是华为云用户的聚集地。这里有来自容器服务的技术牛人,为您解决技术难题。
微信、钉钉、飞书和Welink通知,还可以通过HTTP、HTTPS将告警信息发送至告警服务器,用户可以在第一时间知悉业务运行状况,便于构建智能化的程序处理告警。 批量创建告警规则 告警模板可以帮助用户为多个云服务快速创建告警规则,极大的提高了维护人员的工作效率。
主动监控新增GPU指标。 2018-02-28 第十九次正式发布。 本次变更如下: 人工智能服务新增监控指标。 新对接云数据迁移服务。 主动监控新增负载指标。 2018-01-30 第十八次正式发布。 本次变更如下: 人工智能服务新增监控指标。 2018-01-26 第十七次正式发布。 本次变更如下:
选择“FunctionGraph函数”,选择对应的函数和函数版本。 选择“FunctionGraph”,选择对应的工作流。 选择“钉钉”,需要在钉钉的群设置中选择“智能群助手”,添加机器人时选择“自定义”,创建完成后即可获得webhook地址。 例如: https://qyapi.weixin.qq.com/
Value:云解析服务实例的名称 Key:domainId Value:用户ID 云解析服务的监控指标说明 CDN与智能边缘 智能边缘小站 SYS.IES Key:site_id Value:边缘小站ID 智能边缘小站的监控指标说明 内容分发网络 SYS.CDN Key:domain_name Value:域名
资源分组支持的云服务 由于智能创建资源分组的能力依赖云服务对接config资源管理服务,可能存在部分云服务在某些region未对接config的情况,具体支持情况可在页面配置资源分组时查看确认。 云服务 英文简称 产品 手动添加 企业项目 标签 实例名称 组合匹配 弹性云服务器 ECS
Value:云解析服务实例的名称 Key:domainId Value:用户ID 云解析服务的监控指标说明 CDN与智能边缘 智能边缘小站 SYS.IES Key:site_id Value:边缘小站ID 智能边缘小站的监控指标说明 内容分发网络 SYS.CDN Key:domain_name Value:域名
oleToAgency", "iam:permissions:grantRoleToAgencyOnDomain", "iam:permissions:grantRoleToAgencyOnProject",
如需使用企业项目匹配能力,请确保您的资源已有归属企业项目。 步骤一:创建资源分组 通过手动添加或智能添加的方式将您的云资源进行分组,手动添加支持选择“云产品”维度及其“子维度”,智能添加支持实例名称匹配、企业项目匹配、标签匹配以及组合匹配。更多创建资源分组参数请参考创建资源分组。
12:10:10]区间内。对应的Unix时间戳是[1580353250, 1580357410]。 detail 是 detail object 事件详情。 详细参数请参见表4。 表4 detail字段数据结构说明 名称 是否必选 参数类型 说明 content 否 String 事件内容,最大长度4096。
若资源层级选择“子维度”,即选择了云产品下的部分维度,详情可单击“查看智能添加支持的资源类型”进行查看。 图4 组合匹配 如果选择多个匹配组合方式,同一个智能组合中的不同规则之间为与的关系。 匹配规则最多可添加50个智能组合。不同智能组合之间为或的关系。 当创建方式选择“手动选择”时,需要选择“资源层级”。如图5所示。
维度名称,枚举类型,类型有: mount_point:挂载点, disk:磁盘, proc:进程, gpu:显卡, raid: RAID控制器, 枚举值: mount_point disk proc gpu raid dim_value 否 String 维度值,32位字符串,如:2e84018fc8b4
Requests 当前请求过多。 500 Internal Server Error 请求未完成,服务异常。 503 Service Unavailable 系统暂时不可用,请求受限。 错误码 请参考返回错误码说明。 父主题: 资源分组管理
在收集必要信息后,复位SOC以尝试恢复 复位SOC可能中断客户业务 NPU: 需要退出AI任务重新执行 RestartAIProcess 提示 当前故障很可能需要客户退出当前的AI任务并尝试重新执行 在收集必要信息后,尝试退出当前AI任务并尝试重新执行 退出当前AI任务以便重新执行 NPU: errorcode告警
在收集必要信息后,复位SOC以尝试恢复 复位SOC可能中断客户业务 NPU: 需要退出AI任务重新执行 RestartAIProcess 提示 当前故障很可能需要客户退出当前的AI任务并尝试重新执行 在收集必要信息后,尝试退出当前AI任务并尝试重新执行 退出当前AI任务以便重新执行 NPU: errorcode告警
Requests 当前请求过多。 500 Internal Server Error 请求未完成,服务异常。 503 Service Unavailable 系统暂时不可用,请求受限。 错误码 请参考返回错误码说明。 父主题: 资源分组管理
xrevrange命令的QPS counts/s redis566_xclaim_avg_usec xclaim命令的平均时延 us redis568_xclaim_p99 xclaim命令的p99时延 us redis570_xclaim_qps xclaim命令的QPS counts/s redis571_xpending_avg_usec
资源分组添加资源方式,取值只能为EPS(同步企业项目),TAG(标签动态匹配),Manual(手动添加),不传代表查询所有资源分组类型,COMB(智能添加-组合匹配) 枚举值: EPS TAG Manual COMB 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token
、1个云硬盘两种资源类型,则资源类型数为2。 归属企业项目 拥有资源分组权限的企业项目名称。 创建方式 创建资源分组的方式,有手动添加和智能添加两种。 资源匹配规则 资源的匹配规则有匹配企业项目、匹配标签、组合匹配或实例名称匹配的形式。 资源层级 资源层级有云产品和子维度两种。
不主动让出CPU,导致CPU占用异常。 在SAP HANA云服务器中,操作系统(Guest OS)中内部idle=mwait,当操作系统内部空闲时,进入mwait状态,相比idle=poll消耗资源较少,但同样不主动让出CPU,导致CPU占用异常。 可通过执行cat /proc/