检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
应操作系统的官方文档。 Linux云服务器查看CPU使用率等性能相关问题时的常用命令如下: ps -aux ps -ef top CPU占用率高问题定位 使用VNC功能登录云服务器。 执行如下命令查看当前系统的运行状态。 top 系统回显样例如下: 查看显示结果。 命令回显第一行:20:56:02
连接到服务器。说明SSH服务是没有问题的,Winscp连接基于的是SFTP协议。 执行以下命令,查看/etc/ssh/sshd_config文件。 vi /etc/ssh/sshd_config 查看关于SFTP的配置描述,说明SFTP关联的配置文件是/usr/libexec/openssh/sftp-server
_list # 设置被动模式下,可使用的端口范围,建议把端口范围设置在一段比较高的范围内,有助于提高访问FTP服务器的安全性。 # 可使用的端口范围的最小值 pasv_min_port=<port number> # 可使用的端口范围的最大值。 pasv_max_port=<port
NS服务器地址之前新增内网DNS服务器地址。 nameserver 内网DNS服务器地址 内网DNS服务器地址需根据ECS所在区域选择内网DNS服务器地址,具体的地址信息请参见华为云提供的内网DNS服务器地址。 新增的DNS服务器地址必须位于所有原有的DNS服务器地址之前。 DN
/configure 命令。 执行命令: make && make install 执行成功。但提示pip错误,原因是我的系统中少了openssl-devel包,可以先忽略。 图8 执行成功 查看Python3版本,使用命令: python3 --version 图9 查看Python3版本
如何处理GPU掉卡,执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff 问题原因 某种健全性检查没有通过,GPU驱动程序不会使用或信任其内容(某些内容未被使用)。 问题影响 可能影响ECC相关非易失数据的记录,从而导致本该隔离的GPU内存页面继续使用。 处理方法 用户停止业务并执行业务迁移。
diagnose_gpu.sh命令,将信息收集到信息文件diagnose_gpu_xxxxx.tar.gz进行自排查或工单联系技术支持。 使用命令获取信息请参考表1。 表1 获取信息方法 信息分类 相关文档 显卡基本信息 如何获取显卡ID 如何查询显卡详细信息 如何查询显卡在位信息 显卡故障信息(Linux)
取方式中的对应的索引项在页面中进行选择。 图16 选择CUDA的版本 选择完成后,页面会自动呈现出Ubuntu 16.04 64bit对应的CUDA 10.1的下载地址,复制下载地址。 图17 复制CUDA下载地址 在云服务器内部执行如下命令进行下载。 wget 复制的链接地址 例如:wget
查看操作系统dump 操作场景 触发操作系统dump后,您可以在云服务器上查看对应的内存dump文件。 本文介绍如何触发和查看操作系统dump的内核转储文件的方法。 触发操作系统dump 查看操作系统dump(Windows) 查看操作系统dump(Linux) 前提条件 已经完成配置操作系统dump。
如果GPU加速型实例已安装GPU驱动,需要先卸载原驱动后再安装新的目标驱动。 当前仅部分GPU加速型实例的规格、部分Windows操作系统版本支持通过脚本自动安装GPU驱动。 Windows Server 2016 数据中心版 Windows Server 2019 数据中心版 如果您的规格、操作系统或驱动版本不支
方法1:执行nvidia-uninstall命令,卸载驱动。 如果提示命令不存在可以执行 查询云服务器安装的驱动版本:whereis n...卸载驱动。 方法2:查询云服务器安装的驱动版本:whereis nvidia 图2 查询安装的驱动版本 根据查询的驱动版本从NVIDIA官网下载驱动包(此处重新下载驱动包是
stream,推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID,表明GPU硬件故障需要下线维修。 79 GPU has fallen off the bus。总线脱落,需要下线维修 详情可以参考NVIDIA的Xid描述文档:https://docs.nvidia.com/
注册表信息,避免变更规格后出现蓝屏。 使用了收费镜像的包年/包月模式的弹性云服务器,无法进行规格降配,即不支持变更到费用更低的规格。 费用说明 变更规格会引起费用的变化,具体费用说明请参见变更资源费用说明。 变更前准备 变更规格后,可能会出现网卡漂移现象,请在变更规格前做如下操作:
Firewall)是一个iptables的接口,可以简化配置防火墙的过程。Ubuntu默认安装了UFW,执行以下命令查看防火墙的状态。 sudo ufw status 如果你没有也不想开启防火墙,则可以直接跳过此步骤,如果你想要开启防火墙可以通过以下命令实现。 sudo ufw enable
分别登录ecs-01和ecs-02,获取2台弹性云服务器的私有IP地址。 登录管理控制台。 单击“”,选择“计算 > 弹性云服务器”。 在弹性云服务器列表页,通过“私有IP地址”栏,查看弹性云服务器的私有IP地址。 【示例】假设查询的私有IP地址如下: ecs-01:192.168.0.1 ecs-02:192
执行以下命令,查看内核版本,检查内核版本是否一致。 rpm -qa | grep gcc #查看gcc版本 rpm -qa | grep kernel-devel #查看kernel-devel版本 如果内核版本不一致,请重装驱动。 如果内核版本一致,则执行下一步。 查看dmesg日志,检查是否存在NVRM报错。
该文档适用于在SSH连接Linux云服务器或者访问该服务器上的应用时偶现连接断开。 约束与限制 修改系统内核参数可能产生内核不稳定,请评估风险后进行操作。 为了确保系统稳定运行,修改内核参数后建议在合理的时间重启系统。 根因分析 执行以下命令,查看系统内核是否开启了TIME_WAIT快速回收和重利用策略
使用root账户修改目录权限,并重新查看审计日志。 chmod -R 777 /test/ ausearch -f /test/ 执行以下命令查看审计报告。 aureport 图4 查看审计报告 执行以下命令查看授权失败的详细信息。 aureport -au 图5 查看授权失败信息 执行以下命令查看所有账户与修改相关的事件。
DNS服务器用于解析弹性文件服务中文件系统的域名。DNS服务器东北区IP地址为100.125.6.250,其它区域详情请参见华为云内网DNS地址。 操作场景 默认情况下,用于解析文件系统域名的DNS服务器的IP地址会在创建ECS时自动配置到ECS上,不需要人工配置。除非默认的DNS服务器的IP地址被修改,导致
执行nvidia-smi命令查询到的显卡的数量较实际规格对应的显卡数量少。 如上图所示,执行nvidia-smi命令查询到7张显卡,实际该机型应有8张显卡。 判断方式 执行以下命令,显卡的数量与实际规格对应的显卡数量一致,且显卡在位状态正常(rev a1),请继续按照处理方法处理;如果查找不到显卡或者显示状态为rev