检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
SM最大可驻留线程束的比例。 该值表示一个时间间隔内的所有SM的平均值。 占用率越高不代表GPU使用率越高。只有在GPU内存带宽受限的工作负载(DCGM_FI_PROF_DRAM_ACTIVE)情况下,更高的占用率表示更有效的GPU使用率。 0~1.0 占比(Fraction)
即由阈值规则触发而产生的告警);当没有指标数据上报时,会产生数据不足事件(数据不足事件即由阈值规则触发而产生的事件)。同时执行自定义的触发策略,当阈值规则的状态(正常、超限阈值、数据不足)发生变化时,会以邮件或短信等方式通知,以便您在第一时间发现异常并进行处理。 通知规则 当AO
flush=True)打印输出。 填写完成后,单击“校验高危命令”。校验高危命令为正则校验,校验不通过可能会导致风险。高危命令的详细说明请参见表1。 执行策略 分批发布 选择是否开启分批发布开关,默认不打开。 每批发布 开启分批发布后需填写每批发布数量。 每批间隔 开启分批发布后需填写每批发布的时间间隔。
节点fork总数 node_intr_total 节点中断总数 node_load1 节点1分钟CPU负载 node_load15 节点15分钟CPU负载 node_load5 节点5分钟CPU负载 node_memory_Buffers_bytes 节点缓冲区的内存 node_memory_Cached_bytes
ReadOnlyAccess”权限(该权限为AOM的只读权限,只能查询AOM服务的数据,不能对AOM服务做设置修改),单击“下一步”。 图1 选择策略 选择授权范围方案,勾选“指定区域项目资源”,根据需要勾选对应区域,单击“确定”。 使用postman等工具获取X-Subject-Log
机的磁盘、文件系统等常用系统设备,监控运行在主机上的业务进程或实例的资源占用与健康状态。 容器监控 容器监控的对象仅为通过CCE部署的工作负载、通过ServiceStage创建应用。 指标浏览 指标浏览展示了各资源的指标数据,您可实时监控指标值及趋势,还可将关注的指标添加到仪表盘
容器实例(Cloud Container Instance),提供Serverless容器服务,用户无需关注集群和服务器,简单三步配置即可快速创建容器负载。云容器实例CCI服务默认自动将指标上报到AOM,其指标数据开箱即用。 自建K8S集群 K8S(Kubernetes)是一个开源的容器编排
采集器使用多种机制保证日志采集的可靠性,尽可能保证数据不丢失,但在如下场景可能导致日志丢失。 日志文件未使用CCE提供的logPolicy轮转策略。 日志文件轮转速度过快,如1秒轮转一次。 系统安全设置或syslog自身原因导致无法转发日志。 容器运行时间过短,例如小于30s。 单节
Boolean 规则是否启用 trigger_policies 是 Array of trigger_policies objects 触发策略 数组长度:0 - 1024 alarm_type 是 String 告警类型。notification:直接告警。denoising:告警降噪。
采集器使用多种机制保证日志采集的可靠性,尽可能保证数据不丢失,但在如下场景可能导致日志丢失。 日志文件未使用CCE提供的logPolicy轮转策略。 日志文件轮转速度过快,如1秒轮转一次。 系统安全设置或syslog自身原因导致无法转发日志。 容器运行时间过短,例如小于30s。 单节
自动化运维使用限制 限制项 说明 任务 单个操作ECS的任务最多支持选择100个实例。 单个操作RDS的任务最多支持选择20个实例。 单个操作CCE负载的任务最多支持选择10个实例。 作业 单用户支持最多可以创建1000个作业。 每个作业最多支持创建20个全局参数、20个作业步骤、50个执行方案。
个字符。 暂停步骤 步骤说明 步骤说明信息,最多可输入1000个字符。 更多操作,具体信息参见表4。 表4 更多操作 参数名称 说明 执行策略 分批发布,选择是否开启分批发布开关,默认不打开。 每批发布,开启分批发布后需填写每批发布数量。 每批间隔,开启分批发布后需填写每批发布的时间间隔。
字母、小写字母或数字开头,长度为1到255个字符。 最小长度:1 最大长度:255 push_policy Integer SMN消息推送策略。取值为0或1 最小值:0 最大值:1 status Integer topic中订阅者的状态。 0:主题已删除或主题下订阅列表为空。 1
字母、小写字母或数字开头,长度为1到255个字符。 最小长度:1 最大长度:255 push_policy Integer SMN消息推送策略。取值为0或1 最小值:0 最大值:1 status Integer topic中订阅者的状态。 0:主题已删除或主题下订阅列表为空。 1
strings 引用参数 最小长度:1 最大长度:256 数组长度:0 - 999 rate_control RateControl object 执行策略 share_type String 默认模板为public,自定义模板为private 最小长度:1 最大长度:16 steps Array
、小写字母或数字开头,长度为1到255个字符。 最小长度:1 最大长度:255 push_policy 是 Integer SMN消息推送策略。取值为0或1 最小值:0 最大值:1 status 否 Integer topic中订阅者的状态。 0:主题已删除或主题下订阅列表为空。
Parameter objects 全局参数。 数组长度:0 - 20 rate_control RateControl object 执行策略。 approve_info ApproveInfo object 审批详情。 is_latest_version Boolean 是否为最新版本的作业
、小写字母或数字开头,长度为1到255个字符。 最小长度:1 最大长度:255 push_policy 是 Integer SMN消息推送策略。取值为0或1 最小值:0 最大值:1 status 否 Integer topic中订阅者的状态。 0:主题已删除或主题下订阅列表为空。
租户从IAM申请到的projectid,一般为32位字符串 最小长度:32 最大长度:32 rate_control RateControl object 执行策略 script_language String 脚本语言,目前支持四种,分别是:SHELL BAT PYTHON POWER_SHELL 最小长度:1
strings 引用参数 最小长度:1 最大长度:256 数组长度:0 - 999 rate_control RateControl object 执行策略 share_type String 默认模板为public,自定义模板为private 最小长度:1 最大长度:16 steps Array