华为云用户手册

  • 主机监控 裸金属服务器不支持云服务基础监控,需要安装 CES 主机监控Agent获得操作系统行监控、进程监控和硬件指标监控。安装后可以使用CES主机监控来采集丰富的操作系统层面监控指标,也可以使用主机监控进行服务器资源使用情况监控和排查故障时的监控数据查询,满足裸金属服务器的监控运维需求。 裸金属服务器使用CES主机监控后可以支持CES Agent基础监控指标和硬件监控指标,详细列表请参见主机监控指标。
  • 操作场景 创建裸金属服务器时,您可以通过共享VPC功能,使用其他账号共享的VPC和子网,以实现网络资源的共享和统一管理,提升资源管控效率、降低运维成本。 例如,为了规范管理网络资源,某企业使用账号A作为IT管理账号,用于管理基础公共资源,包括VPC、子网等。同时,账号A将多个子网共享给其他账号共同使用。 账号A:IT管理账号,作为资源所有者,创建VPC及子网,并将多个子网分别共享给其他账号使用。 账号B:业务账号,作为资源使用者,使用账号A共享的子网2创建BMS。 账号C:业务账号,作为资源使用者,使用账号A共享的子网3创建BMS。 图1 业务规划示意图 本章节介绍通过共享VPC创建BMS的操作指导。有关VPC子网共享的更多信息,请参见《虚拟私有云用户指南》的“共享VPC”相关内容。
  • 私有镜像概述 私有镜像包含操作系统、预装的公共应用以及用户的私有应用,仅用户个人可见。您可以通过以下方式创建私有镜像: 通过裸金属服务器创建私有镜像 通过外部镜像文件创建私有镜像 当您成功创建私有镜像后,镜像的状态为“正常”。此时,您可以使用该镜像新建裸金属服务器实例,也可以将其共享给其他用户,还可以复制到您账号下的其他区域。下图总结了私有镜像常见的使用方式: 图1 私有镜像使用方式 父主题: 镜像
  • 创建方式导航 本文介绍创建裸金属服务器的几种方式。 按照向导指引创建裸金属服务器是常见的方式,您可以灵活选择配置项,确保满足业务的需求。详细操作请参见创建裸金属服务器。 如果您想快速获取一台裸金属服务器,可以创建快速发放型裸金属服务器。详细操作请参见创建快速发放型裸金属服务器。 如果您的业务对安全合规性有较高要求,可以选择将裸金属服务器创建在专属云中。详细操作请参见创建专属裸金属服务器。 如果您有习惯使用的操作系统、应用程序等配置,可以先创建私有镜像,然后在创建裸金属服务器时选择该私有镜像,提高配置效率。详细操作请参见通过私有镜像创建裸金属服务器。 父主题: 创建服务器
  • 扩容磁盘 当磁盘空间不足时,可以为其扩容,系统盘和数据盘均支持扩容,系统盘的大小上限为1TB。扩容方法请参考《云硬盘用户指南》中的“云硬盘扩容概述”章节。 快速发放的Windows裸金属服务器系统盘暂不支持扩容,如果需要扩容,请联系技术支持。 扩容成功后,还需要对扩容部分的磁盘分配分区: 对磁盘扩容后的处理请参见《云硬盘用户指南》中“ 扩容云硬盘分区和文件系统(Windows)”或“扩容云硬盘分区和文件系统(Linux)”章节。 父主题: 磁盘
  • 前提条件 裸金属服务器状态必须为“运行中”。 如果Windows裸金属服务器采用密钥方式鉴权,需要先获取裸金属服务器的密码,获取方式请参见获取Windows裸金属服务器的密码。 裸金属服务器已经绑定弹性公网IP,绑定方式请参见绑定弹性公网IP至服务器。 已配置安全组入方向的访问规则,配置方式请参见添加安全组规则。 使用的登录工具与待登录的裸金属服务器之间网络连通。例如,默认的3389端口没有被防火墙屏蔽。
  • 使用建议 为BMS实例添加安全组规则时遵循最小授权原则。例如: 选择开放具体的端口,而不是端口范围,如80端口。 谨慎授权0.0.0.0/0(全网段)源地址。 不建议使用一个安全组管理所有应用,不同的分层一定有不同的隔离诉求。 不建议为每台BMS实例单独设置一个安全组,您可以将具有相同安全保护需求的实例加入同一个安全组。 建议您设置简洁的安全组规则。例如,如果您给一台BMS实例分配了多个安全组,该实例可能会同时遵循数百条安全组规则,任何一个规则变更都可能引起网络不通的故障。
  • 前提条件 裸金属服务器状态必须为“运行中”。 裸金属服务器已经绑定弹性公网IP,绑定方式请参见绑定弹性公网IP至服务器。 已配置安全组入方向的访问规则,配置方式请参见添加安全组规则。 使用的登录工具(如PuTTY)与待登录的裸金属服务器之间网络连通。例如,默认的22端口没有被防火墙屏蔽。 密钥登录方式创建的Linux裸金属服务器,如需使用用户名和密码方式登录,请先使用远程登录方式登录裸金属服务器,开启SSH密码登录权限,具体操作请参见如何设置SSH服务配置项。
  • 基本功能 网络管理 AI参数面网络通过先进的RDMA语义和物理RoCE协议,来提供节点间低时延和大带宽高速通信。在AI训练推理多租户多任务场景下,可以通过参数面子网和端口为裸金属服务器内每张NPU卡分配独立的IP地址,用于参数面网络通信,属于同一个参数面子网内的裸金属服务器的NPU卡之间即可互相通信,不同子网的NPU卡之间网络不通。 图2 不同子网NPU卡间的网络 智能调度 AI大模型训练会将训练任务切分到多个计算节点进行分布式并行训练,会在节点之间引入复杂的通信行为,导致训练效率下降,智能调度通过考虑分布式训练通信的复杂性和集群带宽多级收敛的特性,根据大模型训练任务特征,并行度及可用资源拓扑信息,提供基于拓扑感知的亲和性部署和路径规划能力,降低模型训练过程中传输时间,提升大模型训练性能。 智能调度通过RESTful API接口可提供的能力包括: 拓扑搜索:根据用户提供的大模型超参、并行度及可用资源列表,提供给用户基于拓扑感知的任务资源最优选择建议。 拓扑感知调度:用户资源选择后,根据大模型超参、并行度、集合通信算法及AI编程框架等信息,优化资源部署及链路路由规划,提供资源调度优化建议。 图3 restful API调用示意 网络大脑 网络大脑通过感知设备和网络链路的状态实现故障快速发现,结合流量诊断及流量画像功能,基于AI算法和故障模式库,可快速诊断故障根因并决策故障恢复手段,减少故障爆炸半径,消除突发扰邻,提升系统的可靠性,实现IO吞吐效率大幅提升。 网络大脑提供的能力包括: 监控功能 监控功能以站点视图方式呈现整个AI集群运行视图及告警视图。其功能特性主要是构建集群级的拓扑,通过监控平台提供的监控告警数据,提供拓扑展示、异常检测、异常染色、异常详情、告警染色、告警关联、告警详情展示功能。 故障预警 通过向下对接监控平台,获取交换机设备、端口相关的日志、KPI监控信息,对设备、端口及光模块的故障进行快速告警,同时,基于异常检测算法、故障模式库及故障分类识别算法进行故障诊断,诊断的根因会在根因推荐页面进行展示。支持多维故障决策功能,对不同的故障模式进行根因排序,给出对作业的影响,对于要分析的告警,支持通过配置黑名单的方式进行故障防呆和过滤,待故障点消失后,可以通过告警展示来进行故障恢复通知。 流量诊断 提供从监控系统采集流量信息功能,具体包括端口级的流量等信息采集能力,支持基于流量特性的故障模式进行异常检测,基于全链路诊断算法,提供参数面网络全链路的故障综合分析能力。 流量画像 通过对接轻量化网络流采集工具,可以实现无入侵、可常驻的训练过程观测,从采集的网络流量数据中识别训练作业业务特征和网络流量特征,包括流量亲和性分析、流量线性度劣化分析等,通过在根因推荐页面提供AI流量画像功能,来进行源端口配置检测、交换机Hash异常检测、多任务冲突检测、网络拥塞分析等,基于流量、PFC、丢包等指标追踪劣化点,实现线性度劣化快速定位定界,帮助客户决策线性度恢复的手段。 故障预测 通过对设备、链路、光模块的监控数据进行智能分析,自动识别潜在亚健康问题,保障任务长时间运行,出现故障时能够降低故障概率。针对亚健康细分场景,可以进行自动诊断和隔离亚健康设备、链路和光模块。基于对接的监控平台提供的日志、KPI监控信息,结合AI算法计算光模块和链路发生故障的概率,通过生成告警进行故障预测。
  • 本地使用Linux操作系统 如果本地使用Linux操作系统的计算机,您可以按照以下方式登录Linux裸金属服务器。下面步骤以私钥文件是“KeyPair-ee55.pem”为例进行介绍。 在您的Linux计算机的命令行中执行如下命令,变更权限。 chmod 400 /path/KeyPair-ee55 上述命令的path为密钥文件的存放路径。 执行如下命令登录裸金属服务器。 ssh -i /path/KeyPair-ee55 root@裸金属服务器的弹性公网IP地址 path为密钥文件的存放路径。 root为裸金属服务器镜像的用户名。
  • 步骤3:高级配置 设置“裸金属服务器名称”。 名称可自定义,但需符合命名规则:只能由中文字符、英文字母、数字及“_”、“-”、“.”组成。 一次创建多台裸金属服务器,系统会自动按序增加后缀。例如:输入bms,服务器名称为bms-0001、bms-0002、……。再次创建多台服务器时,命名从上次最大值连续增加,例如:输入bms,已有服务器bms-0010,新创服务器名称为bms-0011、bms-0012、……,命名达到9999时,从0001开始。 设置“登录凭证”。 “密钥对”方式创建的裸金属服务器安全性更高,建议选择“密钥对”方式。如果您习惯使用“密码”方式,请增强密码的复杂度,如表2所示,保证密码符合要求,防止被恶意攻击。 密钥对 指使用密钥对作为登录裸金属服务器的鉴权方式。您可以选择使用已有的密钥,或者单击“新建密钥对”创建新的密钥。 如果选择使用已有的密钥,请确保您已在本地获取该文件,否则,将影响您正常登录裸金属服务器。 密码 指使用设置初始密码方式作为裸金属服务器的鉴权方式,此时,您可以通过用户名密码方式登录裸金属服务器。 Linux操作系统时为root用户的初始密码,Windows操作系统时为Administrator用户的初始密码。密码复杂度需满足表2要求。 表2 密码规则 参数 规则 样例 密码 密码长度范围为8到26位。 密码至少包含以下4种字符中的3种: 大写字母 小写字母 数字 特殊字符,包括!@$%^-_=+[]{}:,./? 密码不能包含用户名或用户名的逆序。 Windows系统的裸金属服务器,不能包含用户名中超过两个连续字符的部分。 Test12$@ 选择“企业项目”。 该参数针对企业用户使用,只有开通了企业项目的客户,或者权限为企业主账号的客户才可见。如需使用该功能,请联系您的客户经理申请开通。 企业项目是一种云资源管理方式,企业项目管理服务提供统一的云资源按项目管理,以及项目内的资源管理、成员管理,默认项目为default。 请从下拉列表中选择所在的企业项目。更多关于企业项目的信息,请参见《企业管理用户指南》。 (可选)开启“自动备份”。 启用自动备份功能后,系统会根据您设置的备份策略,自动备份裸金属服务器。 自动备份功能仅适用于快速发放裸金属服务器,您需要在6中选择支持快速发放的规格才能设置自动备份。 勾选“启用自动备份”。 设置“备份策略”。 在下拉列表中选择备份策略,或单击“管理备份策略”,在云服务器备份页面进行设置。如果您未创建任何备份策略,但是勾选了“启用自动备份”,系统将提供默认的备份策略。 图1 默认备份策略 更多关于裸金属服务器备份的信息,请参见《云备份产品介绍》。 (可选)高级选项。 如需使用“高级选项”中的功能,请单击“现在配置”。否则,请单击“暂不配置”。 用户数据注入:主要用于创建裸金属服务器时向裸金属服务器注入用户数据。配置用户数据注入后,裸金属服务器首次启动时会自行注入数据信息。 只有选择“密钥对”登录方式才显示此配置项。用户数据注入的详细操作请参见实例自定义数据注入。 标签 可选配置,对裸金属服务器的标识。使用标签可以方便识别和管理您拥有的裸金属服务器资源。您最多可以给裸金属服务器添加9个标签。 如果您的组织已经设定裸金属服务器的相关标签策略,则需按照标签策略规则为云服务器添加标签。标签如果不符合标签策略的规则,则可能会导致云服务器创建失败,请联系组织管理员了解标签策略详情。 关于标签的详细操作,请参见添加标签。 委托 委托是由租户管理员在 统一身份认证 服务(Identity and Access Management, IAM )上创建的,可以为裸金属服务器提供访问云服务的临时凭证。 如果您在IAM上创建了委托,可以通过单击下拉列表选择委托名称,获取相应权限。如果还没有委托,单击“新建委托”进行创建。目前,使用委托的场景为主机监控。 单击“下一步:确认配置”。
  • 后续操作 裸金属服务器创建成功后,您可以查看裸金属服务器的名称/ID、磁盘、私有IP地址等信息,请参阅查看详细信息章节。 登录裸金属服务器后,您可以根据需要安装软件或者部署业务。裸金属服务器使用的操作系统不同,登录方式也不同。具体操作请参考登录Linux服务器或远程桌面连接(MSTSC方式)。 如果您随裸金属服务器实例创建了数据盘,只有分区格式化后您才能正常使用数据盘,具体操作请参考初始化数据盘场景及磁盘分区形式介绍。 为避免镜像密码过期造成不便,请参考如何设置裸金属服务器镜像密码的有效期?修改密码有效期。 使用公共镜像创建的裸金属服务器默认已安装一键重置密码插件,可以通过该插件一键重置密码。如果您的裸金属服务器未安装密码重置插件,或者您想确认是否已安装,请参阅安装一键式重置密码插件。 部分类型的裸金属服务器在创建成功后,首先需要安装驱动。具体操作请参考安装驱动和工具包。 目前,Windows Server 2012裸金属服务器拥有相同的SID(英文全称:Security Identifiers,表示安全标识符,是标识用户、组和计算机账户的唯一号码),对于集群部署场景,需要参考Windows Server 2012裸金属服务器如何修改SID值?修改SID值,以保证唯一性。
  • 步骤2:网络配置 第一次使用云服务时,系统将自动为您创建一个默认的虚拟私有云,包括安全组、网卡。其中,默认虚拟私有云支持的地址范围为192.168.1.0/24,子网网关为192.168.1.1,并为子网开启DHCP功能。 如果不是第一次使用云服务,请按如下操作进行网络设置: 设置“网络”,即配置主网卡和扩展网卡。 先选择一个虚拟私有云(Virtual Private Cloud,简称VPC),然后选择该VPC下的一个子网,通过“自动分配IP地址”或者“手动分配IP地址”为主网卡设置私有IP地址。 您可以根据业务需求为裸金属服务器添加扩展网卡,单击“扩展网卡”后的图标,按照主网卡的配置方式为扩展网卡选择子网、设置私有IP地址。 主网卡用于系统的默认路由,不允许删除。 如果您选择自动分配IP地址,请不要在裸金属服务器发放完成后修改私有IP地址,避免和其他裸金属服务器IP冲突。 (可选)设置“高速网卡”。 高速网卡是裸金属服务器之间的高速互联网络接口,为裸金属服务器提供更高的带宽。 同一台裸金属服务器的多张高速网卡不能选择同一个高速网络。 一些区域的高速网络已升级为性能更强的增强高速网络,此处需要配置增强高速网卡。 设置“增强高速网卡”。 一台裸金属服务器最多有两块增强高速网卡,并且依赖于扩展网卡总带宽。例如,扩展网卡总带宽为2*10GE,如果第一块增强高速网卡的带宽为2*10GE,那么您不能再添加第二块增强高速网卡。 扩展网卡总带宽可以在规格的“扩展配置”项查看。 若扩展配置中包含“2*10GE”(例如physical.h2.large,扩展配置为“1*100G IB + 2*10GE”),表示该规格裸金属服务器为单网卡,无扩展网卡,扩展网卡的带宽总量为0。 若扩展配置中包含“2 x 2*10GE”(例如physical.s3.large,扩展配置为“2 x 2*10GE”),表示该规格裸金属服务器为双网卡,有一张扩展网卡,扩展网卡的带宽总量为2*10GE。 设置“安全组”。 安全组类似防火墙功能,是一个逻辑上的分组,用于设置网络访问控制。用户可以在安全组中定义各种访问规则,当裸金属服务器加入该安全组后,即受到这些访问规则的保护。 创建裸金属服务器时,仅支持选择一个安全组。但是裸金属服务器创建成功后,可以为裸金属服务器关联多个安全组,配置方法请参见更改安全组。 安全组规则的配置会影响裸金属服务器的正常访问与使用,配置方法请参见添加安全组规则。常用端口与协议的用途如下,请按需开启: 80端口:浏览网页的默认端口,主要用于HTTP服务。 443端口:网页浏览端口,主要用于HTTPS服务。 ICMP协议:用于ping服务器之间的通信情况。 22端口:用于Linux服务器的SSH方式登录。 3389端口:用于Windows服务器的远程桌面登录。 裸金属服务器初始化需要确保安全组出方向规则至少满足如下要求: 协议:TCP 端口范围:80 远端地址:169.254.0.0/16 如果您使用的是默认安全组出方向规则,则已经包括了如上要求,可以正常初始化。 设置“弹性公网IP”。 弹性公网IP是指将公网IP地址和路由网络中关联的裸金属服务器绑定,以实现虚拟私有云内的裸金属服务器通过固定的公网IP地址对外提供访问服务。 您可以根据实际情况选择以下三种方式: 现在购买:自动为每台裸金属服务器分配独享带宽的弹性公网IP,带宽值由您设定。 使用已有:为裸金属服务器分配已有的弹性公网IP。 暂不购买:不使用弹性公网IP的裸金属服务器不能与互联网互通,仅可作为私有网络中部署业务或者集群的裸金属服务器使用。 选择已有弹性公网IP后,不能批量创建裸金属服务器。 (可选)设置弹性公网IP的“规格”、“带宽类型”、“计费方式”和“带宽”。 当步骤5中弹性公网IP选择“现在购买”时,需配置这些参数,参数说明如表1所示。 表1 参数说明 参数 解释 规格 全动态BGP:可根据设定的寻路协议第一时间自动优化网络结构,以保持客户使用的网络持续稳定、高效。 静态BGP:网络结构发生变化时,运营商无法实时自动调整网络设置以保障用户体验。 带宽类型 独享带宽:一个带宽只能被一个弹性公网IP使用。 共享带宽:一个带宽中可以加入多个弹性公网IP,多个弹性公网IP共用一个带宽。 说明: 一个共享带宽支持添加的弹性公网IP个数有限,如果配额不足,可以选择切换使用其他共享带宽,或者申请扩大共享带宽的EIP配额。 包年/包月方式购买的EIP,不支持使用共享带宽。 包年/包月方式购买的共享带宽,到期后系统自动删除,并给该共享带宽中添加的EIP创建按流量计费的独占带宽。 计费方式 按带宽计费:指定带宽上限,按使用时间计费,与使用的流量无关。适用于流量较大或较稳定的场景。 按流量计费:按照实际使用的流量来计费。适用于流量小或流量波动较大场景。 带宽 带宽大小,单位Mbit/s。 单击“下一步:高级配置”。
  • 后续处理 如果挂载的云硬盘是新创建的,则云硬盘挂载至裸金属服务器后,需要登录裸金属服务器初始化云硬盘(即格式化云硬盘),之后云硬盘才可以正常使用。初始化数据盘的具体操作请参见初始化数据盘。 如果待挂载磁盘的裸金属服务器规格名称以“hba”为后缀,并且6中选择专属企业存储,挂载成功后,需要登录裸金属服务器运行hot_add命令,扫描新挂载的磁盘。 图2 扫描新映射的LUN 裸金属服务器重启后,云硬盘盘符可能发生变化,请参考如何查看云硬盘盘符?获取云硬盘设备和盘符的对应关系。
  • 约束与限制 待挂载的磁盘与裸金属服务器属于同一可用区。 裸金属服务器的状态为“运行中”或“关机”。 云硬盘的磁盘模式必须为“S CS I”。 如果是非共享盘,待挂载的云硬盘为“可用”状态。 如果是共享盘,待挂载的云硬盘为“正在使用”或“可用”状态。 由于某些机型的服务器没有配备SDI卡,或者其他服务器本身的原因,有些规格或镜像的裸金属服务器不支持挂载云硬盘。 为防止资源滥用,平台限定了各服务资源的配额,对用户的资源数量和容量做了限制。详情请参见查看配额。
  • 案例二:仅允许特定IP地址远程登录裸金属服务器 场景举例 为了防止裸金属服务器被网络攻击,用户可以修改远程登录端口号,并设置安全组规则只允许特定的IP地址远程登录到裸金属服务器。 安全组配置方法 以仅允许特定IP地址(例如,192.168.20.2)通过SSH协议访问Linux操作系统的裸金属服务器的22端口为例,安全组规则如下所示。 协议 方向 端口范围 源地址 SSH(22) 入方向 22 IPv4地址、IPv4 CIDR或者另一个安全组的ID。 例如:192.168.20.2
  • 案例一:不同安全组内的裸金属服务器内网互通 场景举例 在同一个VPC内,用户需要将某个安全组内一台裸金属服务器上的资源拷贝到另一个安全组内的裸金属服务器上时,可以将两台裸金属服务器设置为内网互通后再拷贝资源。 安全组配置方法 由于同一个VPC内,在同一个安全组内的裸金属服务器默认互通,无需配置。但是,在不同安全组内的裸金属服务器默认无法通信,此时需要添加安全组规则,使得不同安全组内的裸金属服务器内网互通。 在两台裸金属服务器所在安全组中分别添加一条入方向安全组规则,放通来自另一个安全组内的实例的访问,实现内网互通,安全组规则如下所示。 协议 方向 端口范围/ICMP协议类型 源地址 设置内网互通时使用的协议类型(支持TCP/UDP/ICMP/All) 入方向 设置端口范围或者ICMP协议类型 IPv4地址、IPv4 CIDR或者另一个安全组的ID
  • 操作步骤 您可以按照创建裸金属服务器中的操作指导创建裸金属服务器。 在配置参数时,需要注意以下几点: 区域:必须选择私有镜像所在的区域。 规格:不同裸金属服务器规格所支持的操作系统有所差异,请参考“裸金属服务器类型与支持的操作系统版本”并根据私有镜像的操作系统来选择规格。 镜像:选择“私有镜像”或“共享镜像”,并在下拉列表中选择需要的镜像。 磁盘:如果所选规格支持快速发放,那么系统盘在设置时,建议将容量调大2GB以上。
  • Linux服务器登录方式概述 根据裸金属服务器的网络设置,以及您本地设备的操作系统,您可以选择合适的方法登录Linux服务器。 表1 Linux服务器登录方式说明 能访问公网 本地设备操作系统 登录方法 是/否 Windows或者Linux 远程登录方式 是 Windows 使用PuTTY等远程连接工具: 登录凭证为SSH密钥对:SSH密钥方式登录 登录凭证为密码:SSH密码方式登录 是 Linux 使用命令: 登录凭证为SSH密钥对:SSH密钥方式登录 登录凭证为密码:SSH密码方式登录 父主题: 登录Linux服务器
  • 删除网卡 其他OS的配置方法请参考: SUSE Linux Enterprise Server 11系列 RedHat系列,CentOS系列,Oracle Linux系列,Euler系列 Ubuntu系列 Windows Server系列 获取待删除增强高速网卡的bond网卡地址。 以“root”用户,使用密钥或密码登录裸金属服务器。 找到bond网络设备,然后执行以下命令关闭并删除网络设备。 wicked ifdown bond1 执行以下命令,删除网络配置文件“/etc/sysconfig/network-scripts/ifcfg-eth2”、“/etc/sysconfig/network-scripts/ifcfg-eth3”和“/etc/sysconfig/network-scripts/ifcfg-bond1”。 rm -f /etc/sysconfig/network-scripts/ifcfg-eth2 rm -f /etc/sysconfig/network-scripts/ifcfg-eth3 rm /etc/sysconfig/network/ifcfg-bond1
  • CentOS 7.4安装操作 登录裸金属服务器,执行以下命令,切换至root权限。 su root (可选)如果不存在依赖包gcc、gcc-c++、make和kernel-devel,请执行以下命令进行安装。 yum install gcc yum install gcc-c++ yum install make yum install kernel-devel-`uname -r` (可选)将Nouveau驱动列入黑名单。 如果已经安装并加载了Nouveau的显卡驱动,请执行以下操作将Nouveau驱动列入黑名单以避免冲突。 编辑“/etc/modprobe.d/blacklist.conf”,在文件后面添加blacklist nouveau。 运行以下命令备份与重建initramfs: mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak dracut -v /boot/initramfs-$(uname -r).img $(uname -r) 重启:reboot。 (可选)如果X服务正在运行,请执行systemctl set-default multi-user.target命令并重启裸金属服务器以进入多用户模式。 (可选)安装NVIDIA GPU驱动。 如果选择了特定版本的NVIDIA GPU驱动,而不是捆绑在CUDA工具包中的版本,则需要执行此步骤。 下载NVIDIA GPU驱动安装包NVIDIA-Linux-x86_64-xxx.yy.run(下载链接:https://www.nvidia.com/Download/index.aspx?lang=en),并将该安装包上传至裸金属服务器的“/tmp”目录下。 图1 搜索NVIDIA驱动包(CentOS 7.4) 执行以下命令,安装NVIDIA GPU驱动。 sh ./NVIDIA-Linux-x86_64-xxx.yy.run 执行以下命令,删除安装包。 rm -f NVIDIA-Linux-x86_64-xxx.yy.run 安装CUDA工具包。 下载CUDA Toolkit安装包cuda_a.b.cc_xxx.yy_linux.run(下载链接:https://developer.nvidia.com/cuda-downloads),并将该安装包上传至裸金属服务器的“/tmp”目录下。 执行以下命令,修改安装包的权限。 chmod +x cuda_a.b.cc_xxx.yy_linux.run 执行以下命令,安装CUDA工具包。 ./cuda_a.b.cc_xxx.yy_linux.run --toolkit --samples --silent --override --tmpdir=/tmp/ 执行以下命令,删除安装包。 rm -f cuda_a.b.cc_xxx.yy_linux.run 执行如下三条命令,验证是否安装成功。 cd /usr/local/cuda/samples/1_Utilities/deviceQueryDrv/ make ./deviceQueryDrv 回显信息中包含“Result = PASS”,表示CUDA工具包和NVIDIA GPU驱动安装成功。
  • Ubuntu 16.04安装操作 登录裸金属服务器,执行以下命令,切换至root权限。 sudo root (可选)如果不存在依赖包gcc、g++和make,请执行以下命令进行安装。 apt-get install gcc apt-get install g++ apt-get install make (可选)将Nouveau驱动列入黑名单。 如果已经安装并加载了Nouveau的显卡驱动,请执行以下操作将Nouveau驱动列入黑名单以避免冲突。 编辑“/etc/modprobe.d/blacklist.conf”,在文件后面加入以下内容: blacklist nouveauoptions nouveau modeset=0 执行以下命令备份与重建initramfs: mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak sudo update-initramfs -u 重启:sudo reboot (可选)如果X服务正在运行,请执行systemctl set-default multi-user.target命令并重启裸金属服务器以进入多用户模式。 (可选)安装NVIDIA GPU驱动。 如果选择了特定版本的NVIDIA GPU驱动,而不是捆绑在CUDA工具包中的版本,则需要执行此步骤。 下载NVIDIA GPU驱动安装包NVIDIA-Linux-x86_64-xxx.yy.run(下载链接:https://www.nvidia.com/Download/index.aspx?lang=en),并将该安装包上传至裸金属服务器的“/tmp”目录下。 图2 搜索NVIDIA驱动包(Ubuntu 16.04) 执行以下命令,安装NVIDIA GPU驱动。 sh ./NVIDIA-Linux-x86_64-xxx.yy.run 执行以下命令,删除安装包。 rm -f NVIDIA-Linux-x86_64-xxx.yy.run 安装CUDA工具包。 下载CUDA Toolkit安装包cuda_a.b.cc_xxx.yy_linux.run(下载链接:https://developer.nvidia.com/cuda-downloads),并将该安装包上传至裸金属服务器的“/tmp”目录下。 执行以下命令,修改安装包的权限。 chmod +x cuda_a.b.cc_xxx.yy_linux.run 执行以下命令,安装CUDA工具包。 ./cuda_a.b.cc_xxx.yy_linux.run --toolkit --samples --silent --override --tmpdir=/tmp/ 执行以下命令,删除安装包。 rm -f cuda_a.b.cc_xxx.yy_linux.run 执行如下三条命令,验证是否安装成功。 cd /usr/local/cuda/samples/1_Utilities/deviceQueryDrv/ make ./deviceQueryDrv 回显信息中包含“Result = PASS”,表示CUDA工具包和NVIDIA GPU驱动安装成功。
  • 创建并管理裸金属服务网络 安全组 一般按以下步骤使用安全组: 创建安全组。 添加安全组规则。 在创建裸金属服务器时将实例加入安全组。 删除安全组规则。 删除安全组。 弹性公网IP 一般按以下步骤使用弹性公网IP: 绑定弹性公网IP至服务器。 从服务器解绑弹性公网IP。 虚拟私有云 您可以为网卡绑定额外的IP地址(称为虚拟IP,或者浮动IP),从而实现更灵活的网络功能。还可以开启网卡的“源/目的检查”,这有助于防止伪装报文攻击,提升安全性。 为裸金属服务器绑定虚拟IP地址 设置网卡的源/目的检查 高速网络 关于高速网络有如下操作: 管理高速网络 自定义VLAN网络 关于自定义VLAN网络有如下操作: 自定义VLAN网络概述 自定义VLAN网络需要在操作系统中配置,不同操作系统类型配置方法也不同,参考配置自定义VLAN网络(SUSE Linux Enterprise Server 12系列)~配置自定义VLAN网络(Windows Server系列)。
  • 前提条件 已绑定弹性公网IP。 已下载对应操作系统所需驱动的安装包。 表1 NVIDIA GPU驱动和CUDA工具包下载 操作系统 需要下载的驱动 下载地址 Ubuntu 16.04、CentOS 7.4 NVIDIA GPU驱动安装包“NVIDIA-Linux-x86_64-375.66.run” https://www.nvidia.com/download/driverResults.aspx/118955/en-us CUDA工具包安装包“cuda_8.0.61_375.26_linux.run” https://developer.nvidia.com/cuda-80-ga2-download-archive
  • 创建并管理磁盘 一般操作 当磁盘作为数据盘使用时,按如下步骤使用磁盘: 创建磁盘,可分为: 通过云硬盘服务创建磁盘。 通过专属分布式存储服务创建磁盘。 通过专属企业存储服务创建磁盘。 想了解三种方式的差异,请参阅磁盘类型概述。 挂载数据盘。 初始化数据盘。 卸载数据盘。 删除磁盘。 变更配置 如果已有的系统盘或数据盘的容量无法满足需求,您可以扩容磁盘。磁盘扩容完成后,需要将扩容部分的容量划分至原有分区中,或者对扩容部分的磁盘分配新的分区。
  • 使用实例 下载工具,修改工具文件权限: 查看当前硬盘与Raid配置,执行命令:./configure_raid_x86 -a show 执行结果说明: basic raid区域显示当前已有的Raid。示例中为槽位号为1:0与1:1的硬盘组成的Raid,vd的id为0,dg的id为0,级别为Raid1。 boot_drive显示启动分区,一般为系统盘,不支持自定义配置。示例中为id为0的vd。 jbod_list、ubad_list为当前设置为jbod或unconfigured good两种状态的硬盘。 all pds can be configured raid为当前可供自定义组Raid的硬盘,其中已排除了系统盘。 以组Raid10为例,执行命令:./configure_raid_x86 -a create -l 10 -d 1:2,1:3,1:4,1:5,其中成员硬盘的信息用半角英文逗号分隔: 执行命令:./configure_raid_x86 -a show,确认已配置成功,此处新建了id为1的vd,级别为Raid10: 可选,删除已存在的Raid,执行命令./configure_raid_x86 -a delete -v 1,其中1为待删除的vd的id。删除后成功后执行命令./configure_raid_x86 -a show再次查看,以确认删除正常:
  • 创建并管理裸金属服务器 一般操作 通常按以下步骤使用裸金属服务器: 参考创建裸金属服务器创建裸金属服务器实例。 若裸金属服务器配额不足,您可以申请扩大配额。 登录裸金属服务器实例。使用的操作系统不同,登录方式也不同。 Linux实例:远程登录方式、SSH密钥方式登录或者SSH密码方式登录。 Windows实例:远程桌面连接(MSTSC方式)。 关机裸金属服务器。 释放裸金属服务器。 计费管理 您可以使用不同的方式续费包年/包月裸金属服务器: 手动续费。 自动续费。
  • 自定义组RAID工具 下载地址:https://support.huawei.com/carrier/navi?coltype=software#col=software&from=product&detailId=PBI1-259881031&path=PBI1-253383977/PBI1-23710112/PBI1-23710137/PBI1-22346033 下载完成后,将工具传入需要组RAID的裸金属服务器上,使用以下命令为工具赋权。其中physical.io2.xlarge,physical.d2.large机型使用configure_raid_x86,其余使用configure_raid_arm。 # chmod +x ./configure_raid_x86 # chmod +x ./configure_raid_arm 以configure_raid_x86脚本为例,常见命令及参数描述如下: # ./configure_raid_x86 -h 查看帮助 # ./configure_raid_x86 --a show 查看raid配置 其中basic raid为raid驱动器中所有vd信息, bootdrive为系统盘vd信息,系统盘raid为不可随意删除,pds为所有磁盘信息。 # ./configure_raid_x86 --a create --l LEVEL --d DISKS 配置raid 参数说明: --l:必选参数,raid级别。 --d:可选参数,创建raid的pds,若不选择则默认选择全部除系统盘以外pd。 选择的磁盘若已有raid/单盘jbod配置,脚本会拆除原有raid配置并组新raid且无法配置系统盘raid。 # ./configure_raid_x86 --a delete --v VD 删除raid --v: 可选参数,待删除的vd,若不选择则默认选择全部除系统盘以外vd。 无法删除系统盘raid。
  • 支持列表 支持配置RAID的实例规格及相关配置信息如表1所示。 表1 支持配置RAID的实例规格及配置 实例规格 支持Raid BV513.0.1.0 (physical.d2.large) RAID 0/1/5/6/10/50/60 BV563 (physical.io2.xlarge) RAID 0/1/5/6/10/50/60 BV612 (physical.ki1.4xlarge.cbg.ondemand) RAID 0/1/10 支持配置RAID的操作系统如下: EulerOS 2.3及以上版本 Ubuntu 20.04 及以上版本 Debian 10 及以上版本 CentOS 7.6 及以上版本
  • 常见报错说明 在使用组RAID工具过程中,常见的报错提示及解决方法如表2所示。 表2 常见报错说明 console信息 问题原因 Flavor not supported!!! 不支持此flavor,请勿使用 Necessary document not found!! 解压后文件未找到,检查文件 Raid controller not found!! 裸机不含有raid驱动器,请勿使用 unknown raid level 未识别的raid级别 Run command failed 运行出错,联系支撑人员
共99354条