检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
gpu_serial,retired_pages.cause,retired_pages.timestamp --format=csv,如果连续5次出现了double bit ecc错误,则联系技术支持换卡处理;否则,重置GPU后检查用户业务是否恢复正常,如果恢复正常则显卡可以继续使用。
云服务器/etc/hosts文件中在重启后自动添加hostname和127.0.0.1的解析,导致自行添加的本地解析出现问题。 根因分析 /etc/cloud/cloud.cfg中对/etc/hosts文件影响的配置如下: manage_etc_hosts: localhost 此配置为自动生成h
登录密码,adminPass字段的使用方法请参见表3。对于镜像已安装Cloud-init的Linux云服务器,如果需要使用密文密码,可以使用user_data字段进行密码注入,具体请参见表3。 对于安装Cloud-init镜像的Linux云服务器,若指定user_data字段,则该adminPass字段无效。
过程出错问题 问题描述 用户使用不带驱动的公共镜像或私有镜像,自行安装NVIDIA驱动软件包、CUDA软件包,在安装过程中脚本执行报错。 判断方式 确认用户使用的镜像文件。 确认用户的NVIDIA软件包来源。 确认用户想要的目标NVIDIA软件包版本以及CUDA软件版本。 处理方法
修改预警阈值。 图3 修改预警阈值 开通后,当可用额度、通用代金券和现金券的总金额低于预警阈值时, 会每天给联系人发送短信和邮件提醒,最多连续提醒3天。 您可到消息中心的“消息接收管理 > 消息接收配置 > 财务消息 > 账户余额预警”中修改预警提醒的联系人信息。 企业主客户可批
修改预警阈值。 图3 修改预警阈值 开通后,当可用额度、通用代金券和现金券的总金额低于预警阈值时, 会每天给联系人发送短信和邮件提醒,最多连续提醒3天。 您可到消息中心的“消息接收管理 > 消息接收配置 > 财务消息 > 账户余额预警”中修改预警提醒的联系人信息。 企业主客户可批
选择需要部署FTP的服务器,单击“下一页(N)”。 选择“ Web服务器(IIS)”,并在弹出的对话框中单击“添加功能”,然后单击“下一页(N)”。 连续单击“下一页(N)”,到“角色服务”页面。 选择“FTP服务器” 以及 “IIS管理控制台”,单击“下一页(N)”。 单击“安装”,开始部署服务角色。
(Hostname) ECS的静态主机名hostname,修改后立即生效。 只能由英文字母、数字及“.”、“-”组成,但“.”和“-”不能连续使用或出现在开头和结尾。 单击“确定”,完成ECS主机名的修改。 登录管理控制台,进入弹性云服务器列表页面。 在ECS列表中,勾选待修改主机名的多台ECS。
问题描述 用户在Windows设备管理器显示适配器中查询显卡属性,发现设备状态中存在错误“由于该设备有问题,Windows已将其停止”。 判断方式 确认用户发生问题时的操作,是否有出现显存OOM。 如果用户使用的是vGPU实例,确认实例安装的驱动与主机的驱动版本是否匹配。 登录实例所在主机。
MI has failed because it couldn't communicate with the NVIDIA diver。 判断方式 执行以下命令,查看当前内核版本。 uname -r 根据不同的系统在服务器中执行以下命令,查看安装驱动时的内核版本。 CentOS:find
选择需要部署FTP的服务器,单击“下一步”。 选择“ Web服务器(IIS)”,并在弹出的对话框中单击“添加功能”,然后单击“下一步”。 连续单击“下一步”,到“角色服务”页面。 选择“FTP服务器” 以及 “IIS管理控制台”,单击“下一步”。 单击“安装”,开始部署服务角色。
执行nvidia-smi命令查询到的显卡的数量较实际规格对应的显卡数量少。 如上图所示,执行nvidia-smi命令查询到7张显卡,实际该机型应有8张显卡。 判断方式 执行以下命令,显卡的数量与实际规格对应的显卡数量一致,且显卡在位状态正常(rev a1),请继续按照处理方法处理;如果查找不到显卡或者显示状态为rev
自动续费 自动续费可以减少手动续费的管理成本,避免因忘记手动续费而导致云服务器被自动删除。自动续费的规则如下所述: 以云服务器的到期日计算第一次自动续费日期和计费周期。 云服务器自动续费周期根据开通自动续费的不同途径,遵循不同的规则。 在云服务器到期前均可开通自动续费,到期前7日
云提供的内网DNS服务器地址。),也可以设置成公网DNS服务器地址,具体以实际业务为准。 确认是否已经是内网访问OBS 具体方法请参见如何判断是否内网访问OBS? OBS桶的全局域名格式为:桶名.obs.my-kualalumpur-1.alphaedge.tmone.com.my
填写产品信息并单击“搜索”,可跳转至驱动的最新版本下载页面。 图3 最新版本驱动 您可以通过“发布重点”获取该驱动版本更新或解决的问题,用于判断是否进行升级。 父主题: 操作系统相关问题
添加云服务器网卡(废弃) 功能介绍 给云服务器添加一张网卡。 添加云服务器网卡应用示例请参考弹性云服务器挂载网卡。 当前API已废弃,请使用批量添加云服务器网卡。 调试 您可以在API Explorer中调试该接口。 URI POST /v2.1/{project_id}/ser
执行以下命令,保存并退出文件。 :wq 修改配置文件“/etc/cloud/cloud.cfg”。 执行以下命令,编辑配置文件“/etc/cloud/cloud.cfg”。 sudo vim /etc/cloud/cloud.cfg 选择如下方法,修改配置文件。 方法一:修改或添加“
步骤四:确认配置 确认订单 在“确认配置”页面,查看云服务器配置详情。 如果您对价格有疑问,可以在页面底部,单击“配置费用”右侧的“了解计费详情”来了解产品价格。 图1 了解计费详情 (可选)单击“生成Open API最佳实践脚本”。 支持Java、Python、Go、.NET、
安装须知 用户自行决定是否安装一键式重置密码插件,使弹性云服务器具备一键式重置密码功能。 安装完成后,请勿自行卸载插件,否则可能导致管理控制台判断失误,从而无法完成密码重置。 重装/切换弹性云服务器操作系统后,一键式重置密码功能失效。如需继续使用该功能,请重新安装一键式重置密码插件。
ERROR:存在待隔离页问题 问题描述 业务调度到某个GPU节点后,发现业务异常,调度到其他节点时正常。 某台虚拟机显存使用率突然降低。 判断方式 执行以下命令,查看显卡是否存在ecc error。 nvidia-smi 如果1的回显结果中volatile Uncorr. ECC下ecc