检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
装CES Agent,只能依赖用户对故障的监控情况,发现故障后及时联系技术支持处理。 GPU实例故障处理流程 GPU实例故障分类列表 故障信息收集 非硬件故障自恢复处理方法 显卡故障诊断及处理方法
执行以下命令,并确认回显信息中的配置信息正确。 grep core_collector /etc/kdump.conf |grep -v ^"#" core_collector makedumpfile -l --message-level 1 -d 31 执行以下命令,并确认回显信息中的配置信息正确。
单击“确定”,跳转至费用中心的“包年/包月转按需”页面。 图1 包年/包月转按需 根据界面提示,勾选需要转按需的资源。 确认退款信息后,单击“转按需”。 再次根据界面信息确认要转按需的资源后,单击“确定”。 到期转按需(云服务器控制台) 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。
器使用的镜像关联,此时,不可以执行删除FPGA镜像的操作。 message String FPGA镜像的附加信息。 metadata Object FPGA镜像的元数据信息。 log_directory String FPGA镜像的构建日志文件在OBS中的目录路径,格式为“桶名:
数据盘的UUID。 /mnt/nvme0n1:数据盘挂载点,可通过mount | grep "盘符信息"命令进行查询。 ext4:数据盘的文件系统类型,可通过blkid 盘符信息命令进行查询。 nofail:用于设置当文件系统中包含本地盘但实际缺失时,不中断云服务器的启动流程,避免云服务器异常风险。
表2 响应参数 参数 参数类型 描述 server_groups Array of objects 云服务器组信息,参考表3。 表3 server_groups参数信息 参数 参数类型 描述 id String 云服务器组UUID。 name String 云服务器组名称。 members
(可选)在“开通云运维中心并添加权限”页面,阅读服务声明并勾选后,单击“开通并授权”。 若当前账号未开通并授权COC服务,则会显示该页面。 在“发送命令”页面,根据界面提示信息,完成相关参数配置。 发送命令功能依赖UniAgent,如果提示未安装UniAgent或者安装失败,请参考为ECS安装UniAgent进行安装,否则无法发送命令。
参数类型 描述 nic 是 Object 需要解绑虚拟IP的网卡参数列表。更多信息请参见表3。 表3 nic字段数据结构说明 参数 是否必选 参数类型 描述 subnet_id 是 String 云服务器添加网卡的信息。 约束:解绑虚拟IP时,subnet_id为空字符串 ip_address
请求参数 参数 是否必选 参数类型 描述 add_member 是 Object 待添加进云服务器组的云服务器信息。 详情请参见表3。 表3 add_member参数信息 参数 是否必选 参数类型 描述 instance_uuid 是 String 云服务器UUID。 响应消息 无
响应参数如表2所示。 表2 响应参数 参数 参数类型 描述 server_group Object 弹性云服务器组信息,参考表3。 表3 server_group参数信息 参数 参数类型 描述 id String 弹性云服务器组UUID。 name String 弹性云服务器组名称。
首次安装UniAgent时,仅支持手动安装的方式。 请确保安装机与其余待安装机间网络互通,并且可通过SSH远程连接。 如果远程连接失败,请确认安全组规则入方向规则已添加安装机的IP网段,并且该网段允许SSH远程连接Linux弹性云服务器。 如果您的待更新机器在同一VPC下,继续执行后续步骤。
Ubuntu(64bit) 18.04 支持NPU监控的规格:Ai1s, Ai2, Kai1s, Kai2。 前提条件 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。 已配置委托,配置方法参考如何配置委托?。 实例已安装对应驱动。 GPU加速型实例:已安装GPU驱动。 未安装GP
launch_template_config参数信息 参数 是否必选 参数类型 描述 launch_template 是 Object 实例的启动模板,详情请参见表5。 overrides 是 Array of objects 实例的详细信息,详情请参见表6。 表5 launch_template参数信息 参数 是否必选
统过程中,弹性云服务器会显示任务状态为“切换操作系统中”。 切换操作系统完成后的几分钟,系统正在注入密码或密钥信息,在此期间请勿对云服务器执行其他操作,避免密码或密钥信息注入失败导致云服务器无法登录。 待切换操作系统的弹性云服务器需挂载有系统盘。 “包年/包月”方式购买的弹性云服
依赖的授权项 IAM项目 (Project) 企业项目 (Enterprise Project) 实例授权 标签授权 查询云服务器规格详情和扩展信息列表 GET /v1/{project_id}/cloudservers/flavors ecs:cloudServerFlavors:get
描述 remote_console 是 Object 弹性云服务器获取VNC远程登录地址,参考表3。 表3 remote_console参数信息 参数 是否必选 参数类型 描述 type 是 String 远程登录的类型,请将type配置为“novnc”。 protocol 是 String
段: [ protected header; // 被保护的header信息 unprotected header; // 不被保护的header信息 payload; // 被签名的数据,attestation
0 0 如果存在挂载信息,执行以下命令,删除磁盘分区的自动挂载信息。 执行以下命令,编辑/etc/fstab文件。 vi /etc/fstab 根据步骤2.a查询的UUID,查看在/etc/fstab文件中是否存在该磁盘分区的自动挂载信息,如果存在需注释该条信息。避免在更换本地盘后,云服务器开机时进入维护模式。
objects 智能购买组列表,详情请参见表4。 page_info Object 页标记。 表4 auto_launch_groups参数信息 参数 参数类型 描述 id String 智能购买组ID。 name String 智能购买组名称。 type String 请求类型。
and is not responding to commands”,说明是总线脱落,请联系技术支持人员换卡。 如果仍未确认问题,请根据故障信息收集收集GPU故障后联系技术支持处理。 父主题: 显卡故障诊断及处理方法