检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
执行以下命令,给密钥文件配置权限。 $ sudo chmod 600 id_rsa 执行以下命令,查询主机名。 # hostname 执行以下命令,添加本主机私网IP地址和主机名。 # vi /etc/hosts 示例: 192.168.0.1 ecs-ff-0001 执行以下命令,ssh方式登录
ssh-key-gen # 拷贝公钥到指定主机的~/.ssh/authorized_key文件中 ssh-copy-id root@目标主机IP 例如:ssh-copy-id root@192.168.0.166 配置ssh第一次登录免输入yes 在~/.ssh/config文件中加入如下内容:
在部署/创建集群过程中,如果出现某个节点未加入集群或节点不存在,那么集群将无法正常部署/创建。 处理方法 可删除集群重新创建,选择其中创建成功的计算节点手动绑定EIP,然后和其他计算节点重新创建集群。 删除状态异常的节点,从而使集群状态恢复正常。 父主题: 常见问题
包括主网卡和扩展网卡。 您可以添加多张扩展网卡,并指定网卡(包括主网卡)的IP地址。 - 弹性公网IP 弹性公网IP是指将公网IP地址和路由网络中关联的弹性云服务器绑定,以实现虚拟私有云内的弹性云服务器通过固定的公网IP地址对外提供访问服务。 必须绑定弹性公网IP,您可以根据实际情况进行选择:
在下拉列表中选择可用的子网。 弹性公网IP 弹性公网IP是指将公网IP地址和路由网络中关联的弹性云服务器绑定,以实现虚拟私有云内的弹性云服务器通过固定的公网IP地址对外提供访问服务。 您可以根据实际情况选择以下三种方式: 现在购买:自动为每台弹性云服务器分配独享带宽的弹性公网IP,带宽值可以由您设定。
集群创建/扩容时,节点不能添加数据盘,如需使用,用户需手动挂载。 当前不支持集群恢复操作,创建失败或扩容失败的节点无法自动恢复。 集群创建/扩容时,公共镜像当前只支持CentOS 7系列。 集群/节点执行删除操作时,请自行判断是否删除节点所绑定的弹性公网IP和挂载的数据盘。未删除的弹性公网IP和数据盘会持续产生扣费。
Access)是一种直接内存访问技术,它将数据直接从一台计算机的内存传输到另一台计算机,无需尤其是面对高性能计算HPC、大数据分析和浪涌型IO高并发、低时延应用,现有TCP/IP软硬件架构和应用高CPU消耗的技术特征根本不能满足应用的需求。 RDMA优势 零复制:零复制网络技术使网卡可以直接与应用内存相互传输数据,
$:表示在普通用户下,执行相关操作。 #:表示在管理员用户下,执行相关操作。 普通用户切换至管理员用户,请使用命令sudo su。 前提条件 已成功创建BMS,并绑定了弹性IP进行登录。 操作步骤 使用“PuTTY”,采用密钥对方式登录集群中任意一台BMS。 执行以下命令,防止系统超时退出。 # TMOUT=0 将BMS对应的密钥文件(
执行以下命令,验证参加测试的弹性云服务器之间是否可以免密码互相登录。 $ ssh 用户名@SERVER_IP 执行以下命令,关闭弹性云服务器的防火墙。 # iptables -F # service firewalld stop 执行以下命令,用“IP:Number”的形式作为MPI集群运行程序时的hostlist参数,在集群上通过Spectrum
集群创建完成后,如需查看集群中节点的详细信息,可进入一站式HPC服务提供的“节点管理”页,查看例如当前集群中节点,包括节点名称和ID、节点类型、状态、规格、IP、共享存储挂载状态、可用区以及付费类型等信息。 操作步骤 前提条件:用户集群的节点列表不为空。 登录HPC-S²控制台。 单击左侧的“节点管理”。
挂载SFS Turbo 将SFS Turbo挂载到/opt/Siemens目录 mkdir /opt/Siemens # 在/etc/fstab中添加开启自动挂载 echo "192.168.0.15:/ /opt/Siemens nfs vers=3,timeo=600,nolock 0
镜像中制作的私有镜像。 虚拟私有云:集群中的所有弹性云服务器需在同一VPC、同一子网内。 弹性IP:选择暂不购买。 一个集群绑定一个EIP即可。因此,可以在创建应用集群后,再绑定EIP。 购买数量:待创建集群中弹性云服务器的数量。 单击“立即购买”。 在确认规格页面,您可以查看详情并提交申请。
全组规则的配置会影响弹性云服务器的正常访问与使用。 为确保集群能正常创建/部署,需保证安全组规则22端口开放,具体配置方法请参见:为安全组添加安全组规则。 一站式HPC服务使用弹性文件服务SFS作为文件共享存储,更多关于弹性文件系统的信息,请参见《弹性文件服务用户指南》。 操作步骤
reached”。 处理方法 检查“/etc/ssh/sshd_config”配置文件,确保配置文件中“AuthorizedKeysFile”添加了“/usr/local/.hpccluster/role/.ssh/authorized_keys”配置项。 检查“/usr/local/
指定的物理核数。 ip1,ip2:运行STAR-CCM+指定的主机信息。 core_num1,core_num2:指定每个主机运行的物理核数。 hiroce gids:查下设备名和index。 UCX_NET_DEVICES: hiroce gids查到的有ip值一行的ib_dev的值:
0.1/bin:$PATH” >> /root/.bashrc 验证MPI运行在RoCE网络上 执行以下命令,安装iproute2。 yum -y install iproute* 执行以下命令,查看RoCE上是否有流量。 rdma res show 若MPI运行中,回显结果中qp
要保持所有节点一致,并且后面starccm使用platform方式启动时候需要使用该配置名称。 enp177s0为网卡名称,可以使用ip a或者ipconfig查看到。 验证Udapl(使用dtest测试RoCE网络) 使用 dtest 进行验证: server端(192.168
简介 图解HPC解决方案 HPC简介 HPC和公有云 IPoIB功能简介 配额调整
请求样例 POST /v2/cloudimages/action { "name": "ims_test", "description": "云服务器制作镜像", "instance_id": "877a2cda-ba63-4e1e-b95f-e67e48b6129a"
或者不存在需要怎么办? 集群云服务器节点创建完成,但在部署过程中失败了能否修复? 集群创建任务提交失败,提示“Insufficient EIP quota”怎么办? 集群创建提交失败,提示集群配额不足怎么办? 集群的管理节点为运行状态,但是集群异常提示“master node cannot