检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
问题描述 业务调度到某个GPU节点后,发现业务异常,调度到其他节点时正常。 某台虚拟机显存使用率突然降低。 判断方式 执行以下命令,查看显卡是否存在ecc error。 nvidia-smi 如果1的回显结果中volatile Uncorr. ECC下ecc error > 0,
该目录<interface>是与路由相关的接口的名称。 <network/prefix> via <gateway> 其中<network/prefix>是带有前缀的远程网络,<gateway>是下一跳的IP地址。 例如,要添加一条通过192.168.100.10到10.20.30.0/24网络的路由,以便在eth0启用时都处于活动状态:
相关联的安全组ID,UUID格式。 ip_protocol 是 String IP协议:icmp,tcp,或者udp from_port 是 Integer 起始端口,范围1-65535,且不大于to_port 。 当协议类型为icmp时,from_port为icmp协议的type,范围是0-255。
删除安全组(废弃) 功能介绍 删除安全组。 当前API已废弃,请使用“删除安全组”。 URI DELETE /v2.1/{project_id}/os-security-groups/{security_group_id} 参数说明请参见表1。 表1 参数说明 参数 是否必选 描述
RDP连接已断开,出现内部错误,错误代码4 问题描述 Windows操作系统云服务器在登录时会遇到“出现了内部错误”提示,无法正常连接到服务器。这种情况一般都是远程服务太忙导致。 可能原因 Remote Desktop Services服务忙碌导致的登录异常。 远程桌面登录后断开连接,但未注销登录也可能
恢复过程就是由核心模式切换到完整模式的过程,步骤如下: 登录弹性云服务器。 单击右上角的“Send CtrlAltDel”按钮,打开任务管理器。 选择“文件 > 运行新任务”。 系统打开“新建任务”窗口。 图1 新建任务 在“打开”栏,输入“cmd”,然后按回车键。 在弹出的命令行窗口执行以下命令,将系统由核心模式切换到完整模式。
本文以修复ext4文件系统为例,其他文件系统错误会有差异。 登录弹性云服务器。 执行以下命令,卸载已经挂载的分区(此处以xvdb1的挂载点为/mnt/sdc为例)。 umount /mnt/sdc 执行以下命令,修复已损坏的文件系统。 fsck -y /mnt/sdc 修复需要较长时间,在此期间请勿做其他操作。
重装/切换操作系统/变更规格对磁盘数据的影响 操作类型 重装操作系统 切换操作系统 变更规格 功能简介 还原服务器的初始化状态。 重装前后操作系统不发生改变。 将现有的操作系统切换为不同镜像类型的操作系统。 中国大陆外区域(包括中国港澳台及其他国家、地区)不支持Windows镜像和Linux镜像之间的切换。 更多约束限制请参考切换操作系统。
在运行多个docker容器的环境下NetworkManager服务占用内存很大,导致内存使用率过高。 本节操作适用于CentOS 7、Ubuntu 16.04操作系统。 该文档涉及重启网络服务,可能会造成业务中断,请谨慎操作。 问题分析 NetworkManager消耗的内存量随着容器启动
如果API的这个版本支持微版本,则支持最小的微版本。 如果不支持微版本,这将是空字符串。 status string API版本的状态: CURRENT这是使用的API的首选版本; SUPPORTED:这是一个较老的,但仍然支持的API版本; DEPRECATED:一个被废弃的API版本,该版本将被删除
fixed_ip 是 String 私有IP地址。 id 是 String 浮动IP的ID,UUID格式。 instance_id 是 String 被绑定主机的ID,UUID格式。 ip 是 String 浮动IP的IP地址。 pool 是 String 网络资源池名称,分配浮动IP地址。
security_group 是 Object security_group对象,在消息体中指定,请参见表3。 表3 请求参数security_group的对象 参数 是否必选 参数类型 描述 name 否 String 安全组名称,长度0-255。 description 否 String 安全组描述,长度0-255。
要关闭SELinux。 处理方法 执行以下命令,临时关闭SELinux。 setenforce 0 再次执行关闭Selinux操作,确保虚拟机重启后生效。 执行以下命令,重新安装重置密码插件。 sudo sh setup.sh 如果脚本执行成功打印“cloudResetPwdAgent
删除安全组规则(废弃) 功能介绍 删除安全组规则。 当前API已废弃,请使用“删除安全组规则”。 URI DELETE /v2.1/{project_id}/os-security-group-rules/{security_group_rule_id} 参数说明请参见表1。 表1
可能原因 根据日志报错,提示/root这个目录权限问题,排查/root目录,以及目录内的.ssh,.ssh目录内authorized_keys的权限以及属主属组。 处理方法 修改/root目录的权限以及属主属组后,SSH恢复正常。 父主题: SSH连接
25,该命令执行失败。 问题原因 为了提升华为云IP地址发邮件的质量,基于安全考虑,TCP 25端口出方向默认被封禁,无法使用TCP 25端口连接外部地址。 如果没有在云上部署邮件服务的需求,该限制不会影响您的服务。 目前仅华北-北京一的TCP 25端口出方向默认被封禁,其他区域TCP 25端口不会封禁。
availabilityZoneInfo参数信息 参数 参数类型 描述 zoneState Object 可用区的状态,参考表4。 hosts List 该字段的值为null zoneName String 可用区的名称 表4 zoneState参数信息 参数 参数类型 描述 available Boolean
配置多用户登录后,普通用户登录闪屏怎么办? 问题描述 Windows服务器配置多用户登录后,Administrator登录正常,普通用户登录后出现闪屏,或者打开"我的电脑"出现自动关闭,不能正常使用。 处理方法 使Administrator用户登录服务器,查看系统日志及应用日志,查找异常模板,本例发现Mglayout64
包含对端ip网段,cidr格式,参见表7。ip_range或者group参数的值为空。 group 是 Object 包括对端安全组的名称和对端安全组所属租户的租户ID,参见表8,ip_range或者group参数的值为空。 id 是 String 安全组规则ID,UUID格式。 表7
如何处理ECC ERROR:执行nvidia-smi存在SRAM的ECC错误(V100显卡) 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令查看显卡信息。 如果在volatile Uncorr. ECC下发现存在ecc