检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
GPU实例故障自诊断 GPU实例故障,如果已安装GPU监控的CES Agent,当GPU服务器出现异常时则会产生事件通知,可以及时发现问题避免造成用户损失。如果没有安装CES Agent,只能依赖用户对故障的监控情况,发现故障后及时联系技术支持处理。 GPU实例故障处理流程 GPU实例故障分类列表
组,并给用户组授予策略或角色,才能使用户组中的用户获得相应的权限,这一过程称为授权。授权后,用户就可以基于策略对云服务进行操作。 根据授权的精细程度,分为角色和策略。角色以服务为粒度,是IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。策略以API接口为粒度进行权限
导致用户的业务出现安全风险。 原有XEN实例无法在线挂载新卷和网卡。 无法使用XEN实例的备份创建新的XEN实例,使用XEN实例的备份创建KVM实例无法正常启动。 使用哪种虚拟化平台替换XEN? 华为云将采用KVM虚拟化平台替换XEN。相对于XEN,KVM可以提供更多的功能、较高
当前华为云上XEN实例已经停售(停售的规格详情请参见已停售的实例规格),建议还在使用XEN实例的客户迁移至更新的产品系列上,以获取更优的性能,以及更高的可靠性。 迁移准备 如何判断是否在使用XEN实例 可以通过判断当前使用的规格名称,来确定自己是否在使用XEN实例。 当前XEN实例的规格名称包括:C
25,该命令执行失败。 问题原因 为了提升华为云IP地址发邮件的质量,基于安全考虑,TCP 25端口出方向默认被封禁,无法使用TCP 25端口连接外部地址。 如果没有在云上部署邮件服务的需求,该限制不会影响您的服务。 目前仅华北-北京一的TCP 25端口出方向默认被封禁,其他区域TCP 25端口不会封禁。
-r 根据不同的系统在服务器中执行以下命令,查看安装驱动时的内核版本。 CentOS:find /usr/lib/modules -name nvidia.ko Ubuntu:find /lib/modules -name nvidia.ko 如果当前内核版本与安装驱动时的内核版本不
如何处理用户安装了GRID驱动,但未购买、配置License问题 问题描述 用户业务是做图形处理的,且用户已经安装了GRID驱动,但用户的GPU使用率很低或渲染性能达不到预期。 例:运行图像识别任务,任务会突然卡住无法继续运行,GPU的性能表现差;查看/var/log/messages日志发现有如下报错,
启动模板是一种用于快速购买ECS的工具,包含了用于创建ECS的除密码之外的任意配置信息,可以批量购买相同配置的ECS。 更多信息,请参见启动模板管理。 智能购买组是一种新的算力获取方式,通过启动模板的自定义配置,可以批量购买不同可用区、不同实例类型以及不同计费模式的ECS。 更多信息,请参见智能购买组管理。
开启回收站 操作场景 当您主动删除按需计费的ECS或主动退订未到期的包年/包月ECS后,如果希望ECS保留一段时间,可以使用回收站功能,防止因误删除/退订ECS造成的业务损失。 ECS回收站功能默认关闭,如需要使用该功能,请参考本章节开启ECS回收站。 回收站目前在公测阶段,如需使用,请提交工单申请公测。
以下两种场景,需要执行导入密钥对的操作: 通过puttygen.exe工具新建密钥对,需要将密钥对导入系统才能正常使用。 如果本地已有密钥对(例如,使用PuTTYgen工具生成的密钥对),可以在管理控制台导入密钥对公钥,由系统维护您的公钥文件。 如果已有密钥对的公钥文件是通过puttygen
回显结果中出现No表示不存在待隔离页。 如果1的回显结果中volatile Uncorr. ECC下ecc error = 0,执行以下命令,查看所有的卡是否存在待隔离页。 nvidia-smi -q -d PAGE_RETIREMENT 如果3的回显结果中Pending Page Bl
执行parted -l命令,如果start列显示的不是2048s或者1049KB,则表示分区未对齐。 图3 分区未对齐 处理方法 如果出现分区未对齐的情况,则磁盘分区无法自动扩容,需选择手动扩容或者重新分区。 本文介绍手动扩容的方法。 重新分区会导致磁盘数据丢失,请谨慎选择。
账号B:业务账号,作为资源使用者,使用账号A共享的子网2创建ECS。 账号C:业务账号,作为资源使用者,使用账号A共享的子网3创建ECS。 图1 业务规划示意图 本章节介绍通过共享VPC购买ECS的操作指导。有关VPC子网共享的更多信息,请参见《虚拟私有云用户指南》的“共享VPC”相关内容。 约束与限制
在运行多个docker容器的环境下NetworkManager服务占用内存很大,导致内存使用率过高。 本节操作适用于CentOS 7、Ubuntu 16.04操作系统。 该文档涉及重启网络服务,可能会造成业务中断,请谨慎操作。 问题分析 NetworkManager消耗的内存量随着容器启动
查询磁盘列表详情(废弃) 功能介绍 本接口提供查询卷详细信息的功能。 当前API已废弃,请使用"查询所有云硬盘详情(OpenStack原生 v2)"。 URI GET /v2.1/{project_id}/os-volumes/detail 参数说明请参见表1。 表1 参数说明 参数
查询磁盘(废弃) 功能介绍 本接口提供查询指定磁盘信息的功能。 当前API已废弃,请使用"查询单个云硬盘详情(OpenStack原生 v2)"。 URI GET /v2.1/{project_id}/os-volumes/{volume_id} 参数说明请参见表1。 表1 参数说明
cache:主要用来作为文件系统上的文件数据的缓存来用,尤其是针对当进程对文件有read/write操作的时候。Linux默认会将读取的文件内容缓存在内存中,方便后续使用。 Linux默认使用的是lazy模式,即内存如果还够用,则不会主动释放当前的占用的buffer和cache,如果
查询磁盘列表(废弃) 功能介绍 本接口提供查询磁盘概要信息的功能。 当前API已废弃,请使用"查询云硬盘列表(OpenStack原生 v2)"。 URI GET /v2.1/{project_id}/os-volumes 参数说明请参见表1。 表1 参数说明 参数 是否必选 描述
按“Esc”,输入:wq保存并退出。 执行以下命令,添加启动权限。 chmod +x /etc/rc.d/rc.local 否,请执行下一步。 查看实例的Tesla驱动版本是否为510.xx.xx。 是,该驱动版本与镜像可能存在兼容性问题,建议更换驱动版本,操作指导,请参考安装GPU驱动。 否,请执行下一步。
表1 发送命令参数配置 参数 说明 目标实例 选择待发送命令的目标实例。默认已选择一台目标实例。 操作系统 目标实例的操作系统类型,当前支持Linux和Windows。 请根据目标实例的操作系统类型进行选择。 执行用户 命令的执行用户。 Windows系统ECS:默认为system,不支持修改。