检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
JobManager的堆内存使用量。 字节(Byte) flink_jobmanager_Status_JVM_Memory_Heap_Committed 保证JobManager的JVM可用的堆内存量。 字节(Byte) flink_jobmanager_Status_JVM_Memory_Heap_Max
数据安全可靠。 表1 AOM的数据保护手段和特性 数据保护手段 简要说明 详细介绍 传输加密(HTTPS) AOM支持HTTPS传输协议,保证数据传输的安全性。 构造请求 数据冗余存储 指标、告警、配置等数据以多副本方式存储,保障数据可靠性。 / 数据订阅 AOM支持客户配置数据
供服务。 多集群容灾 AOM支持多集群方案,当一个集群异常时,可以继续提供服务。 数据容灾 AOM的配置、指标、告警等数据均是多副本存储,保证了数据可靠性。 父主题: 安全
供服务。 多集群容灾 AOM支持多集群方案,当一个集群异常时,可以继续提供服务。 数据容灾 AOM的配置、指标、告警等数据均是多副本存储,保证了数据可靠性。 父主题: 安全
),以字母开头。 指标抓取规则 采集进程状态指标 控制采集任务状态。默认开启采集任务。 指标采集间隔(秒) 指标采集的周期,单位为秒(s),默认为60s,可选择10、30和60。 指标采集超时时间(秒) 执行指标采集任务的超时时间,单位为秒(s),默认为60s,可选择10、30和60。超时时间必须小于或等于采集周期。
的云上环境。应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况,提升企业海量运维的自动化能力和效率。将ECS接入AOM后,可以通过AOM实时监控ECS主机状态,并提供告警通知。
千字节/秒(kB/s) GPU显存 ma_container_gpu_mem_total_megabytes 显存容量 该指标用于统计训练任务的显存容量。 >0 兆字节(MB) ma_container_gpu_mem_util 显存使用率 该指标用于统计测量对象已使用的显存占显存容量的百分比。
参数说明 参数 参数说明 容器内日志路径 日志存储挂载到容器内的挂载路径,需要保证服务的日志输出路径与该路径一致,这样日志才能写入到日志存储卷中。 须知: 日志存储卷挂载后,会覆盖掉日志路径下已有的内容。请保证日志路径为一个独立的路径,否则原来的内容不可见。 AOM只采集最近修改过的前20个日志文件,且不采集子目录。
同一伸缩组,相同指标只能创建一条metric_operation相同的告警策略。 同一策略的同名指标(metric_name),各条件(conditions)之间需保证逻辑不冲突。 定时策略的触发时间(launch_time)年份不能大于2099。 周期策略的开始时间(start_time)、结束时间(end_time)年份不能大于2099。
用于执行脚本和文件管理的操作系统账户。 工具市场 服务默认提供的按照场景分类展现各功能的工具卡片,用户可根据需要控制场景从服务市场中上下架和基于安全考虑配置任务的审批流程。 父主题: 基本概念
单击“操作”列的“编辑”。 删除账号 单击“操作”列的“删除”。 搜索账号 默认按照账号名称搜索。在列表上方的搜索框中输入关键字,单击后在下面任务列表显示匹配对象。 隐藏/显示账号列表的列信息 单击,根据需要勾选/取消勾选对应列,可在账号列表中显示/隐藏该列。 刷新账号列表 单击,可以刷新账号列表。
AOM四层指标体系 前提条件 已将ELB日志接入LTS。 已为环境关联ECS资源。 步骤一:建设四层指标体系 接入业务层指标。 登录AOM 2.0控制台。 在左侧导航栏中选择“接入中心”。 在右侧“业务层”面板单击需要接入的指标卡片。 接入ELB 日志指标 系统可自动接入,无需用户手动操作。
Boolean 是否需要同步 nodes Array of Node objects 任务执行时需要的参数列表。 数组长度:1 - 20 parameters Array of Parameter objects 任务执行时需要的参数列表。 数组长度:0 - 20 project_id String
口。 应用资源管理:包括所有应用资源相关接口对应的授权项,例如新增应用接口。 自动化运维:包括所有自动化运维相关接口对应的授权项,例如创建任务接口。 告警 监控 Prometheus监控 日志 Prometheus实例 UniAgent管理 应用资源管理 自动化运维 父主题: 权限策略和授权项
“kube-prometheus-stack”插件后,才能正常使用。 系统预置的原生中间件类型仪表盘需要在UniAgent中创建中间件采集任务后,才能正常使用。 系统预置的云服务类型的dms-rabbitmq仪表盘,在RabbitMQ AMQP-0-9-1版本暂不支持监控部分指标
Boolean 是否需要同步 nodes Array of Node objects 任务执行时需要的参数列表。 数组长度:1 - 20 parameters Array of Parameter objects 任务执行时需要的参数列表。 数组长度:0 - 20 project_id String
节点中断总数 node_load1 节点1分钟CPU负载 go_goroutines 通过runtime.NumGoroutine()调用获取,基于调度器结构sched和全局allglen变量计算得来。由于sched结构体的所有字段可能并发的更改,因此最后会检查计算的值是否小于1,如果小于1,那么返回1。
进行转储。 日志类型选择组件,组件选择als0320a 日志分组名称 待转储日志的逻辑分组,以便以分组为单位对日志进行转储。 说明: 转储任务删除后,日志分组也会同时删除。 log-group1 转储周期 对1天的日志以转储周期为粒度进行分割,将每天划分为24小时/转储周期个时间
华为云的安全责任在于保障其所提供的IaaS、PaaS和SaaS类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服务技术的安全功能和性能本身,也包括运维运营安全,以及更广义的安全合规遵从。 租户:负责
华为云的安全责任在于保障其所提供的IaaS、PaaS和SaaS类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服务技术的安全功能和性能本身,也包括运维运营安全,以及更广义的安全合规遵从。 租户:负责