检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主机,该主机会自动继承主机组关联的接入规则,无需为每台主机重复配置。 采集配置。 在“采集配置”中,参考下表配置相关参数信息。 表1 采集任务参数配置表 操作 参数 说明 基础配置 采集配置名称 配置指标接入规则名称。 规则名称包含大小写字母,数字,特殊字符(_-),以字母开头,最大长度为50。
千字节/秒(kB/s) GPU显存 ma_container_gpu_mem_total_megabytes 显存容量 该指标用于统计训练任务的显存容量。 >0 兆字节(MB) ma_container_gpu_mem_util 显存使用率 该指标用于统计测量对象已使用的显存占显存容量的百分比。
参数说明 参数 参数说明 容器内日志路径 日志存储挂载到容器内的挂载路径,需要保证服务的日志输出路径与该路径一致,这样日志才能写入到日志存储卷中。 须知: 日志存储卷挂载后,会覆盖掉日志路径下已有的内容。请保证日志路径为一个独立的路径,否则原来的内容不可见。 AOM只采集最近修改过的前20个日志文件,且不采集子目录。
用于执行脚本和文件管理的操作系统账户。 工具市场 服务默认提供的按照场景分类展现各功能的工具卡片,用户可根据需要控制场景从服务市场中上下架和基于安全考虑配置任务的审批流程。 父主题: 基本概念
单击“操作”列的“编辑”。 删除账号 单击“操作”列的“删除”。 搜索账号 默认按照账号名称搜索。在列表上方的搜索框中输入关键字,单击后在下面任务列表显示匹配对象。 隐藏/显示账号列表的列信息 单击,根据需要勾选/取消勾选对应列,可在账号列表中显示/隐藏该列。 刷新账号列表 单击,可以刷新账号列表。
同一伸缩组,相同指标只能创建一条metric_operation相同的告警策略。 同一策略的同名指标(metric_name),各条件(conditions)之间需保证逻辑不冲突。 定时策略的触发时间(launch_time)年份不能大于2099。 周期策略的开始时间(start_time)、结束时间(end_time)年份不能大于2099。
AOM四层指标体系 前提条件 已将ELB日志接入LTS。 已为环境关联ECS资源。 步骤一:建设四层指标体系 接入业务层指标。 登录AOM 2.0控制台。 在左侧导航栏中选择“接入中心”。 在右侧“业务层”面板单击需要接入的指标卡片。 接入ELB 日志指标 系统可自动接入,无需用户手动操作。
Boolean 是否需要同步 nodes Array of Node objects 任务执行时需要的参数列表。 数组长度:1 - 20 parameters Array of Parameter objects 任务执行时需要的参数列表。 数组长度:0 - 20 project_id String
口。 应用资源管理:包括所有应用资源相关接口对应的授权项,例如新增应用接口。 自动化运维:包括所有自动化运维相关接口对应的授权项,例如创建任务接口。 告警 监控 Prometheus监控 Prometheus实例 日志 应用资源管理 自动化运维 父主题: 权限策略和授权项
当前通过远程安装方式安装UniAgent时,主机暂不支持Windows操作系统。 登录账号:登录主机的账号。当操作系统为LINUX时,建议使用root账号,可保证有足够的读写权限。 登录端口:访问主机的端口。 认证方式:认证方式为密码。 密码:登录主机的密码。 连接测试结果:连接测试的结果,测试安装机和需安装主机间的网络连通性。
- containerPort: 9121 name: metric-port # 这个名称在配置采集任务的时候需要 securityContext: privileged: false te
Boolean 是否需要同步 nodes Array of Node objects 任务执行时需要的参数列表。 数组长度:1 - 20 parameters Array of Parameter objects 任务执行时需要的参数列表。 数组长度:0 - 20 project_id String
- containerPort: 9121 name: metric-port # 这个名称在配置采集任务的时候需要 securityContext: privileged: false te
划线,且不能以中划线或下划线开头。 日志类型 默认选择ELB日志,且不允许修改。 应用 在下拉列表中选择已创建应用。 所属日志组 在下拉列表中选择已创建日志组。如果没有可用的日志组,可单击“ELB日志接入LTS”创建新的ELB接入日志组。 所属日志流 在下拉列表选择已创建日志流。
节点中断总数 node_load1 节点1分钟CPU负载 go_goroutines 通过runtime.NumGoroutine()调用获取,基于调度器结构sched和全局allglen变量计算得来。由于sched结构体的所有字段可能并发的更改,因此最后会检查计算的值是否小于1,如果小于1,那么返回1。
华为云的安全责任在于保障其所提供的IaaS、PaaS和SaaS类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服务技术的安全功能和性能本身,也包括运维运营安全,以及更广义的安全合规遵从。 租户:负责
进行转储。 日志类型选择组件,组件选择als0320a 日志分组名称 待转储日志的逻辑分组,以便以分组为单位对日志进行转储。 说明: 转储任务删除后,日志分组也会同时删除。 log-group1 转储周期 对1天的日志以转储周期为粒度进行分割,将每天划分为24小时/转储周期个时间
华为云的安全责任在于保障其所提供的IaaS、PaaS和SaaS类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服务技术的安全功能和性能本身,也包括运维运营安全,以及更广义的安全合规遵从。 租户:负责
“虚拟私有云”与已购买的弹性云服务器的“虚拟私有云”需一致。 图1 购买终端节点 参数配置完成,单击“立即购买”,进行规格确认。 规格确认无误,单击“提交”,任务提交成功。 参数信息配置有误,需要修改,单击“上一步”,修改参数,然后单击“提交”。 步骤二(可选):检查VPC内的ECS安全组配置 通过ECS验证到AOM域名的连通性。
- containerPort: 9308 name: metric-port # 这个名称在配置抓取任务的时候需要 securityContext: privileged: false te