内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • HCS裸金属日志查看和常用命令

    id 或者虚拟机名称查找日志/var/log/apicom/taskmgr/bms/taskmgr_ecm_api.log/var/log/apicom/taskmgr/bms/taskmgr_ecm_executor.log3)  组合api两个节点是双主,根据裸金属服务器实例的名

    作者: 李耳King
    1187
    0
  • GPU裸金属服务器训练速度突然下降以及执行nvidia-smi卡顿的解决方案

    1. 问题描述 笔者最近发现在高性能8卡GPU的裸金属上的训练任务突然变慢,以前1个epoch约2小时执行完成,最近1个epoch需要2天才能执行完成。 并且执行nvidia-smi也明显变很卡顿。 2. 问题分析 根据现象描述很可能出现了nvidia-smi D+进程。 首先了解什么是D+进程:

    作者: modelarts-dev-server
    发表时间: 2023-06-02 20:26:16
    33
    0
  • 注册 Ironic 裸金属节点并部署裸金属实例

    目录 文章目录 目录 前文列表 注册(Enrollment)裸机 创建裸金属实例的 Flavor 部署裸金属实例 日志分析 问题:Failed to create neutron ports for any PXE enabled

    作者: 云物互联
    发表时间: 2021-08-05 16:35:55
    607
    0
  • 华为云GPU裸金属服务器-单EIP实现多节点的SSH登录和外网访问方案

    通过添加DNAT规则,则可以通过映射方式为VPC内的弹性裸金属提供SSH访问服务,一个弹性裸金属的一个端口对应一条DNAT规则,一个端口只能映射到一个EIP,不能映射到多个EIP。 添加DNAT规则: 需要为每一台弹性裸金属添加DNAT规则,用来实现SSH网络访问。 公网端口号建

    作者: modelarts-dev-server
    发表时间: 2023-06-03 14:53:47
    81
    0
  • 【昇腾】NPU Snt9B裸金属服务器重启后SSH链接失败,VNC登录后显示Login incorrect

    1. 环境描述 服务器信息: 华为云NPU Snt9B裸金属服务器 操作系统:Euler2.10 Arm 64bit 系统环境相关版本: NPU驱动版本为23.0.rc2、固件版本为6.4.12.1.241 2. 问题现象 vnc登录时出现 根据笔者和BMS的定位经验, 这是出现了"急救模式"

    作者: modelarts-dev-server
    发表时间: 2023-10-26 19:40:58
    20
    0
  • 【华为云stack产品】【裸金属服务器网关节点功能】该节点的主要功能和作用

    【功能模块】裸金属服务器网关节点【操作步骤&问题现象】在裸金属服务最佳实践中需要配置两台裸金属服务器网关节点,请问这两台服务器的主要功能和作用都有哪些?【截图信息】【日志信息】(可选,上传日志内容或者附件)

    作者: cloudw
    1761
    1
  • Windows Server服务器操作系统介绍

    R2 Windows Server 2008 R2是一款服务器操作系统。同2008年1月发布的Windows Server 2008相比,Windows Server 2008 R2继续提升了虚拟化、系统管理弹一个强项。并强化PowerShell对各个服务器角色的管理指令。Windows Server

    作者: DevFeng
    1113
    2
  • 服务器

    服务器 服务器类型 服务器根据静态和动态加载数据,分为 web 服务器和应用服务器两种。 web 服务器 提供代理服务,负责接收 HTTP 请求并返回 HTTP 响应。 web 服务器可以访问本地磁盘上所有的资源文件,但不能对 HTTP 请求/响应进行动态加载!  web 服务器接收的

    作者: 武师叔
    发表时间: 2022-08-30 00:46:50
    152
    0
  • 全新网络方案,给你低成本、高性能的裸金属体验

    方案。 三、裸金属服务器增强网络解决方案 华为云Stack新推出一个既不依赖智能网卡,也不需要额外引入专有裸金属网关,同时又可以给裸金属服务器提供类云服务器网络能力的高性能、高可靠、低成本的方案——增强裸金属网络方案。 该方案通过复用裸金属的TOR,做

    作者: 大架光临
    发表时间: 2022-10-20 11:38:18
    2532
    1
  • 服务器上安装 CentOS 7 操作系统

    文章目录 目录安装操作系统 安装操作系统 很久没碰服务器了,感到很生疏。 拿到服务器首先给它配上 RAID,参考文章:《DELL R720 服务器 RAID阵列卡配置介绍》。 然后使用 U 盘安装操作系统,参考文章《Dell R720服务器设置光盘引导流程安装 CenOS7》,主要是要搞清楚

    作者: 云物互联
    发表时间: 2021-08-05 16:44:42
    1210
    0
  • 华为云学生服务器

    # 华为云学生服务器初次使用不得不说,这次牛客网举办的活动真的是超级良心的呀~ §(\* ̄▽ ̄\*)§之前犹豫选哪家的 ECS,这次不犹豫啦~ 直接在华为云上购买咯~ 貌似最近只有北京的地域,不确定之后其他地区会不会开放。1C2G 的配置对于普通的学生来说已经足够小项目的运营啦~

    作者: rainbows
    发表时间: 2019-11-23 17:02:35
    15039
    0
  • DWS管控面之配置裸金属规格

    【问题现象】     标准交付场景下,BMS规格都已预置在管理侧数据库中,无需再录入数据库。如果某局点交付后有新增的非标BMS机器,除了在Service OM的“裸金属服务”页面录入规格后,还需要在Service OM的“数据仓库服务”页面进行BMS规格的配置。【常见版本】全版本 【定位思路】

    作者: 德莱文
    109
    0
  • 通过裸金属服务部署Oracle RAC专题材料

    ”通过裸金属服务部署Oracle RAC“专题里面的材料哪位大神有?URL:https://bbs.huaweicloud.com/topic/detail_100042 目前这个链接打不开了,这个谁知道迁移到那个URL下面了?

    作者: yd_282349122
    88
    3
  • [AIGC最佳实践] NPU Snt9B裸金属服务器训练并推理Baichuan2-7B模型

    4096。本文主要介绍如何在单机8卡Snt9B裸金属服务器中对该模型进行微调训练。 2. 环境准备 当前Snt9B裸金属服务器的最新规格如下表所示。 firmware 6.4.12.1.241 software 23.0.rc2.2 若当前Snt9B裸金属服务器预装的版本不是最新的发布

    作者: modelarts-dev-server
    发表时间: 2023-10-28 17:53:06
    756
    0
  • 【昇腾】NPU Snt9B裸金属服务器多机分布式训练时报错connection timeout解决方案

    使用两台在同一vpc网络下的Snt9B裸金属服务器通过torch.distributed.launch进行多机分布式训练时,出现如下报错,显示连接超时: 2. 解决方案 在使用torch.distributed.launch进行多机分布式训练时,需要指定一个主节点,并且保证每个节点都在相同的vpc网络内(即节点间ping

    作者: modelarts-dev-server
    发表时间: 2023-12-09 11:03:08
    582
    0
  • [AIGC最佳实践]GPU Ant8裸金属服务器使用Megatron-Deepspeed训练GPT2并推理

    https://bbs.huaweicloud.com/blogs/399188 (2) 裸金属规格选择: GPU Ant8, 包含8张GPU卡以及8张RoCE网卡. 关于Ant8裸金属服务器的购买, 可以在华为云官网提工单至ModelArts云服务, 完成资源的申请。 3. 安装模型

    作者: modelarts-dev-server
    发表时间: 2023-07-02 18:46:44
    1326
    0
  • 【昇腾】NPU Snt9B裸金属服务器执行hccl_tool命令验证卡之间通信出现Command execute failed

    1. 环境描述 服务器信息: 华为云NPU Snt9B裸金属服务器 操作系统:Euler2.10 Arm 64bit 系统环境相关版本: NPU驱动版本为23.0.rc2、固件版本为6.4.12.1.241 2. 问题现象 3. 解决办法 (1)执行命令:cat /etc/hccn

    作者: modelarts-dev-server
    发表时间: 2023-10-26 19:38:47
    14
    0
  • 【昇腾】NPU Snt9B裸金属服务器使用nohup命令后台训练时中途偶现失败解决方案

    1. 问题描述 使用华为云Snt9B裸金属服务器,通过nohup命令基于pytorch框架进行大模型训练时,训练中途偶现如下报错导致训练中断: {'loss': 0.0759, 'learning_rate': 0.0005298913043478261, 'epoch': 3.15}

    作者: modelarts-dev-server
    发表时间: 2023-11-21 16:11:38
    129
    0
  • 弹性文件服务(SFS)、NAS(Network Attached Storage:网络附属存储)

    Turbo文件系统。 × √ 全部 文件系统类型 弹性文件服务提供了SFS容量和SFS Turbo两种类型的文件系统,其中SFS Turbo又分为SFS Turbo标准、SFS Turbo标准-增强版、SFS Turbo性能和SFS Turbo性能-增强版。 以

    作者: 小麦苗DB宝
    发表时间: 2022-04-06 09:41:17
    2071
    0
  • linux操作系统基础之常用服务器构建-FTP

    #chown_uploads=YES # 设置想要改变的上传文件的属主,如果需要,则输入一个系统用户名 # 可以把上传的文件都改成root属主。whoever:任何人 #chown_username=whoever # 设定系统维护记录FTP服务器上传和下载情况的日志文件 # /var/log/vsftpd

    作者: 鱼酱
    发表时间: 2022-01-06 15:57:04
    812
    0