搜索_华为云

已找到以下 2651 条记录

AI智能搜索

产品选择

AI开发平台ModelArts

所有产品

弹性云服务器 ECS

Flexus云服务

裸金属服务器 BMS

云手机服务器 CPH

专属主机 DeH

弹性伸缩 AS

镜像服务 IMS

函数工作流 FunctionGraph

云耀云服务器（旧版）

VR云渲游平台 CVR

Huawei Cloud EulerOS

云化数据中心 CloudDC

对象存储服务 OBS

云硬盘 EVS

云备份 CBR

高性能弹性文件服务 SFS Turbo

弹性文件服务 SFS

存储容灾服务 SDRS

云硬盘备份 VBS

云服务器备份 CSBS

数据快递服务 DES

云存储网关 CSG

专属分布式存储服务 DSS

数据工坊 DWR

地图数据 MapDS

键值存储服务 KVS

虚拟私有云 VPC

弹性公网IP EIP

弹性负载均衡 ELB

NAT网关 NAT

云专线 DC

虚拟专用网络 VPN

云连接 CC

VPC终端节点 VPCEP

企业路由器 ER

企业交换机 ESW

全球加速 GA

企业连接 EC

云原生应用网络 ANC

云容器引擎 CCE

云容器实例 CCI

容器镜像服务 SWR

云原生服务中心 OSC

应用服务网格 ASM

华为云UCS

内容分发网络 CDN

智能边缘云 IEC

智能边缘平台 IEF

CloudPond云服务

云数据库 RDS

数据复制服务 DRS

文档数据库服务 DDS

分布式数据库中间件 DDM

云数据库 GaussDB

云数据库 GeminiDB

数据管理服务 DAS

数据库和应用迁移 UGO

云数据库 TaurusDB

安全技术与应用

Web应用防火墙 WAF

企业主机安全 HSS

云防火墙 CFW

安全云脑 SecMaster

DDoS防护 AAD

数据加密服务 DEW

数据库安全服务 DBSS

云堡垒机 CBH

数据安全中心 DSC

云证书管理服务 CCM

威胁检测服务 MTD

态势感知 SA

认证测试中心 CTC

边缘安全 EdgeSec

AI开发平台ModelArts

华为HiLens

图引擎服务 GES

图像识别 Image

文字识别 OCR

自然语言处理 NLP

内容审核 Moderation

图像搜索 ImageSearch

医疗智能体 EIHealth

企业级AI应用开发专业套件 ModelArts Pro

人脸识别服务 FRS

对话机器人服务 CBS

语音交互服务 SIS

人证核身服务 IVS

视频智能分析服务 VIAS

城市智能体

自动驾驶云服务 Octopus

盘古大模型 PanguLargeModels

MapReduce服务 MRS

MRS on CCE

数据湖探索 DLI

表格存储服务 CloudTable

可信智能计算服务 TICS

推荐系统 RES

云搜索服务 CSS

数据可视化 DLV

数据接入服务 DIS

数据仓库服务 GaussDB(DWS)

数据治理中心 DataArts Studio

湖仓构建 LakeFormation

智能数据洞察 DataArts Insight

设备接入 IoTDA

全球SIM联接 GSL

IoT数据分析 IoTA

路网数字化服务 DRIS

IoT边缘 IoTEdge

设备发放 IoTDP

微服务引擎 CSE

分布式消息服务Kafka版

分布式消息服务RabbitMQ版

分布式消息服务RocketMQ版

API网关 APIG

分布式缓存服务 DCS

多活高可用服务 MAS

事件网格 EG

域名注册服务 Domains

云解析服务 DNS

企业门户 EWP

ICP备案

商标注册

华为云WeLink

华为云会议 Meeting

隐私保护通话 PrivateNumber

语音通话 VoiceCall

消息&短信 MSGSMS

云管理网络

SD-WAN 云服务

边缘数据中心管理 EDCM

云桌面 Workspace

应用与数据集成平台 ROMA Connect

ROMA资产中心 ROMA Exchange

API全生命周期管理 ROMA API

政企自服务管理 ESM

应用平台 AppStage

开天企业工作台 MSSE

开天集成工作台 MSSI

API中心 API Hub

云消息服务 KooMessage

交换数据空间 EDS

云地图服务 KooMap

云手机服务 KooPhone

组织成员账号 OrgID

云空间服务 KooDrive

实时音视频 SparkRTC

视频直播 Live

视频点播 VOD

媒体处理 MPC

视频接入服务 VIS

数字内容生产线 MetaStudio

统一身份认证服务 IAM

消息通知服务 SMN

云监控服务 CES

应用运维管理 AOM

应用性能管理 APM

云日志服务 LTS

云审计服务 CTS

标签管理服务 TMS

配置审计 Config

应用身份管理服务 OneAccess

资源访问管理 RAM

组织 Organizations

资源编排服务 RFS

优化顾问 OA

IAM 身份中心

云运维中心 COC

资源治理中心 RGC

主机迁移服务 SMS

对象存储迁移服务 OMS

云数据迁移 CDM

迁移中心 MGC

区块链服务 BCS

数字资产链 DAC

华为云区块链引擎服务 HBS

专属计算集群 DCC

高性能计算 HPC

SAP

混合云灾备

开天工业工作台 MIW

Haydn解决方案工厂

数字化诊断治理专家服务

SDK开发指南

API签名指南

DevStar

华为云命令行工具服务 KooCLI

Huawei Cloud Toolkit

CodeArts API

成本优化最佳实践

专属云商业逻辑

云架构中心

云采用框架

云商店

合作伙伴中心

华为云开发者学堂

华为云慧通差旅

账号中心

费用中心

成本中心

资源中心

企业管理

工单管理

客户运营能力

国际站常见问题

支持计划

专业服务

合作伙伴支持计划

我的凭证

华为云公共事业服务云平台

管理控制台

消息中心

产品价格详情

系统权限

客户关联华为云合作伙伴须知

公共问题

宽限期保留期

奖励推广计划

活动

云服务信任体系能力说明

工业数字模型驱动引擎

硬件开发工具链平台云服务

工业数据转换引擎云服务

软件开发生产线 CodeArts

需求管理 CodeArts Req

流水线 CodeArts Pipeline

代码检查 CodeArts Check

编译构建 CodeArts Build

部署 CodeArts Deploy

测试计划 CodeArts TestPlan

制品仓库 CodeArts Artifact

移动应用测试 MobileAPPTest

CodeArts IDE Online

开源镜像站 Mirrors

性能测试 CodeArts PerfTest

应用管理与运维平台 ServiceStage

云应用引擎 CAE

开源治理服务 CodeArts Governance

华为云Astro轻应用

CodeArts IDE

Astro工作流 AstroFlow

代码托管 CodeArts Repo

漏洞管理服务 CodeArts Inspector

联接 CodeArtsLink

软件建模 CodeArts Modeling

Astro企业应用 AstroPro

CodeArts盘古助手

华为云Astro大屏应用

没有找到结果，请重新输入

产品选择

AI开发平台ModelArts

在搜索结果页开启AI智能搜索

开启

产品选择

取消所有产品

弹性云服务器 ECS

Flexus云服务

裸金属服务器 BMS

云手机服务器 CPH

专属主机 DeH

弹性伸缩 AS

镜像服务 IMS

函数工作流 FunctionGraph

云耀云服务器（旧版）

VR云渲游平台 CVR

Huawei Cloud EulerOS

云化数据中心 CloudDC

对象存储服务 OBS

云硬盘 EVS

云备份 CBR

高性能弹性文件服务 SFS Turbo

弹性文件服务 SFS

存储容灾服务 SDRS

云硬盘备份 VBS

云服务器备份 CSBS

数据快递服务 DES

云存储网关 CSG

专属分布式存储服务 DSS

数据工坊 DWR

地图数据 MapDS

键值存储服务 KVS

虚拟私有云 VPC

弹性公网IP EIP

弹性负载均衡 ELB

NAT网关 NAT

云专线 DC

虚拟专用网络 VPN

云连接 CC

VPC终端节点 VPCEP

企业路由器 ER

企业交换机 ESW

全球加速 GA

企业连接 EC

云原生应用网络 ANC

云容器引擎 CCE

云容器实例 CCI

容器镜像服务 SWR

云原生服务中心 OSC

应用服务网格 ASM

华为云UCS

内容分发网络 CDN

智能边缘云 IEC

智能边缘平台 IEF

CloudPond云服务

云数据库 RDS

数据复制服务 DRS

文档数据库服务 DDS

分布式数据库中间件 DDM

云数据库 GaussDB

云数据库 GeminiDB

数据管理服务 DAS

数据库和应用迁移 UGO

云数据库 TaurusDB

安全技术与应用

Web应用防火墙 WAF

企业主机安全 HSS

云防火墙 CFW

安全云脑 SecMaster

DDoS防护 AAD

数据加密服务 DEW

数据库安全服务 DBSS

云堡垒机 CBH

数据安全中心 DSC

云证书管理服务 CCM

威胁检测服务 MTD

态势感知 SA

认证测试中心 CTC

边缘安全 EdgeSec

AI开发平台ModelArts

华为HiLens

图引擎服务 GES

图像识别 Image

文字识别 OCR

自然语言处理 NLP

内容审核 Moderation

图像搜索 ImageSearch

医疗智能体 EIHealth

企业级AI应用开发专业套件 ModelArts Pro

人脸识别服务 FRS

对话机器人服务 CBS

语音交互服务 SIS

人证核身服务 IVS

视频智能分析服务 VIAS

城市智能体

自动驾驶云服务 Octopus

盘古大模型 PanguLargeModels

MapReduce服务 MRS

MRS on CCE

数据湖探索 DLI

表格存储服务 CloudTable

可信智能计算服务 TICS

推荐系统 RES

云搜索服务 CSS

数据可视化 DLV

数据接入服务 DIS

数据仓库服务 GaussDB(DWS)

数据治理中心 DataArts Studio

湖仓构建 LakeFormation

智能数据洞察 DataArts Insight

设备接入 IoTDA

全球SIM联接 GSL

IoT数据分析 IoTA

路网数字化服务 DRIS

IoT边缘 IoTEdge

设备发放 IoTDP

微服务引擎 CSE

分布式消息服务Kafka版

分布式消息服务RabbitMQ版

分布式消息服务RocketMQ版

API网关 APIG

分布式缓存服务 DCS

多活高可用服务 MAS

事件网格 EG

域名注册服务 Domains

云解析服务 DNS

企业门户 EWP

ICP备案

商标注册

华为云WeLink

华为云会议 Meeting

隐私保护通话 PrivateNumber

语音通话 VoiceCall

消息&短信 MSGSMS

云管理网络

SD-WAN 云服务

边缘数据中心管理 EDCM

云桌面 Workspace

应用与数据集成平台 ROMA Connect

ROMA资产中心 ROMA Exchange

API全生命周期管理 ROMA API

政企自服务管理 ESM

应用平台 AppStage

开天企业工作台 MSSE

开天集成工作台 MSSI

API中心 API Hub

云消息服务 KooMessage

交换数据空间 EDS

云地图服务 KooMap

云手机服务 KooPhone

组织成员账号 OrgID

云空间服务 KooDrive

实时音视频 SparkRTC

视频直播 Live

视频点播 VOD

媒体处理 MPC

视频接入服务 VIS

数字内容生产线 MetaStudio

统一身份认证服务 IAM

消息通知服务 SMN

云监控服务 CES

应用运维管理 AOM

应用性能管理 APM

云日志服务 LTS

云审计服务 CTS

标签管理服务 TMS

配置审计 Config

应用身份管理服务 OneAccess

资源访问管理 RAM

组织 Organizations

资源编排服务 RFS

优化顾问 OA

IAM 身份中心

云运维中心 COC

资源治理中心 RGC

主机迁移服务 SMS

对象存储迁移服务 OMS

云数据迁移 CDM

迁移中心 MGC

区块链服务 BCS

数字资产链 DAC

华为云区块链引擎服务 HBS

专属计算集群 DCC

高性能计算 HPC

SAP

混合云灾备

开天工业工作台 MIW

Haydn解决方案工厂

数字化诊断治理专家服务

SDK开发指南

API签名指南

DevStar

华为云命令行工具服务 KooCLI

Huawei Cloud Toolkit

CodeArts API

成本优化最佳实践

专属云商业逻辑

云架构中心

云采用框架

云商店

合作伙伴中心

华为云开发者学堂

华为云慧通差旅

账号中心

费用中心

成本中心

资源中心

企业管理

工单管理

客户运营能力

国际站常见问题

支持计划

专业服务

合作伙伴支持计划

我的凭证

华为云公共事业服务云平台

管理控制台

消息中心

产品价格详情

系统权限

客户关联华为云合作伙伴须知

公共问题

宽限期保留期

奖励推广计划

活动

云服务信任体系能力说明

工业数字模型驱动引擎

硬件开发工具链平台云服务

工业数据转换引擎云服务

软件开发生产线 CodeArts

需求管理 CodeArts Req

流水线 CodeArts Pipeline

代码检查 CodeArts Check

编译构建 CodeArts Build

部署 CodeArts Deploy

测试计划 CodeArts TestPlan

制品仓库 CodeArts Artifact

移动应用测试 MobileAPPTest

CodeArts IDE Online

开源镜像站 Mirrors

性能测试 CodeArts PerfTest

应用管理与运维平台 ServiceStage

云应用引擎 CAE

开源治理服务 CodeArts Governance

华为云Astro轻应用

CodeArts IDE

Astro工作流 AstroFlow

代码托管 CodeArts Repo

漏洞管理服务 CodeArts Inspector

联接 CodeArtsLink

软件建模 CodeArts Modeling

Astro企业应用 AstroPro

CodeArts盘古助手

华为云Astro大屏应用

没有找到结果，请重新输入

停止回答

已停止生成

正在生成

展开

收起

了解详细信息

内容由大模型输出，仅供参考，请遵守《官网AI智能搜索服务声明》

您的反馈将帮助我们优化体验

理解有误

未理解指令

未理解上下文

回答不佳

内容错误

答非所问

回答不完整

逻辑混乱

格式错误

回答速度慢

没有帮助

/200

确定取消

网卡名称错误 - AI开发平台ModelArts

网卡名称错误当训练开始时提示网卡名称错误。或者通信超时。可以使用ifconfig命令检查网卡名称配置是否正确。比如，ifconfig看到当前机器IP对应的网卡名称为enp67s0f5，则可以设置环境变量指定该值。图1 网卡名称错误 export GLOO_SOCKET_IFNAME=enp67s0f5

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
网卡名称错误 - AI开发平台ModelArts

网卡名称错误当训练开始时提示网卡名称错误。或者通信超时。可以使用ifconfig命令检查网卡名称配置是否正确。比如，ifconfig看到当前机器IP对应的网卡名称为enp67s0f5，则可以设置环境变量指定该值。图1 网卡名称错误 export GLOO_SOCKET_IFNAME=enp67s0f5

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
各个模型训练前文件替换 - AI开发平台ModelArts

各个模型训练前文件替换在训练开始前，因模型权重文件可能与训练框架不匹配或有优化，因此需要针对模型的tokenizer文件进行修改或替换，不同模型的tokenizer文件修改内容如下。 falcon-11B模型在训练开始前，针对falcon-11B模型中的tokenizer文件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练脚本说明
执行训练任务（历史版本） - AI开发平台ModelArts

执行训练任务（历史版本）步骤一上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件和数据集到容器中，可以忽略此步骤。如果未上传训练权重文件和数据集到容器中，具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练任务
从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

本案例介绍如何从0到1制作Ascend容器镜像，并使用该镜像在ModelArts平台上进行训练。镜像中使用的AI引擎是MindSpore，训练使用的资源是专属资源池的Ascend芯片。场景描述目标：构建安装如下软件的容器镜像，并在ModelArts平台上使用Ascend规格资源运行训练作业。 ubuntu-18

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

因此，ModelArts提供了VPC直连的高速访问通道功能以满足用户的需求。使用VPC直连的高速访问通道，用户的业务请求不需要经过推理平台，而是直接经VPC对等连接发送到实例处理，访问速度更快。由于请求不经过推理平台，所以会丢失以下功能：认证鉴权流量按配置分发负载均衡告警、监控和统计图1 VPC直连的高速访问通道示意图

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
训练作业的自定义镜像制作流程 - AI开发平台ModelArts

训练作业的自定义镜像制作流程场景一：预置镜像满足ModelArts训练平台约束，但不满足代码依赖的要求，需要额外安装软件包。具体案例参考使用预置镜像制作自定义镜像用于训练模型。场景二：已有本地镜像满足代码依赖的要求，但是不满足ModelArts训练平台约束，需要适配。具体案例参考已有镜像迁移至ModelArts用于训练模型。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

在ECS上构建自定义镜像并在Notebook中使用使用场景和构建流程说明用户可以使用ModelArts提供的基础镜像或第三方的镜像来编写Dockerfile，在ECS服务器上构建出完全适合自己的镜像。然后将镜像进行注册，用以创建新的开发环境，满足自己的业务需求。本案例将基于

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
通过Token认证的方式访问在线服务 - AI开发平台ModelArts

调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。前提条件已经获取用户Token、预测文件的本地路径、在线服务的调用地址和在线服务的输入参数信息。用户

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
上传远端文件至JupyterLab - AI开发平台ModelArts

上传远端文件至JupyterLab 在Notebook的JupyterLab中，支持通过远端文件地址下载文件。要求：远端文件的URL粘贴在浏览器的输入框中时，可以直接下载该文件。通过JupyterLab打开一个运行中的Notebook。单击JupyterLab窗口上方导航栏的ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发 > 上传文件至JupyterLab
附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

附录：工作负载Pod异常问题和解决方法 Pod状态为Pending 当Pod状态长时间为“Pending”，事件中出现“实例调度失败”的信息时，可根据具体事件信息确定具体问题原因。图1 pod状态pending 通过以下命令打印Pod日志信息。 kubectl describe

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
ECS获取和上传基础镜像 - AI开发平台ModelArts

ECS获取和上传基础镜像 Step1 创建ECS 下文中介绍如何在ECS中构建一个训练镜像，请参考ECS文档购买一个Linux弹性云服务器。完成网络配置、高级配置等步骤，可根据默认选择，或进行自定义。创建完成后，单击“远程登录”，后续安装Docker等操作均在该ECS上进行。注

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作 > 准备镜像
执行训练任务【新】 - AI开发平台ModelArts

执行训练任务【新】新的训练方式将统一管理训练日志、训练结果和训练配置，使用yaml配置文件方便用户根据自己实际需求进行修改。推荐用户使用该方式进行训练。权重文件支持以下组合方式，用户根据自己实际要求选择：训练stage 不加载权重增量训练：加载权重，不加载优化器（默认开启）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
执行训练任务【旧】 - AI开发平台ModelArts

执行训练任务【旧】前提条件已上传训练代码、训练权重文件和数据集到SFS Turbo中。 Step1 修改训练超参配置以llama2-13b SFT全参微调为例，执行脚本 0_pl_sft_13b.sh 。修改模型训练脚本中的配置，参数详解可查看训练参数说明，其中【GBS、

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
训练tokenizer文件说明 - AI开发平台ModelArts

训练tokenizer文件说明在训练开始前，需要针对模型的tokenizer文件进行修改，不同模型的tokenizer文件修改内容如下，您可对tokenizer文件进行编辑。 LLama2模型在当前的软件版本中，由于transformers的版本过高（transformers==4

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明
训练tokenizer文件说明 - AI开发平台ModelArts

训练tokenizer文件说明在训练开始前，需要针对模型的tokenizer文件进行修改，不同模型的tokenizer文件修改内容如下，您可对tokenizer文件进行编辑。 LLama2模型在当前的软件版本中，由于transformers的版本过高（transformers==4

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明参考
ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

ascendfactory-cli方式启动（推荐）相对于之前demo.sh方式启动（历史版本）的启动方式，本章节新增了通过benchmark工具启动训练的方式。此方式训练完成后json日志或打屏日志直接打印性能结果，免于计算，方便用户验证发布模型的质量。并且新的训练方式将统一管

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 执行训练任务
训练tokenizer文件说明 - AI开发平台ModelArts

训练tokenizer文件说明在训练开始前，需要针对模型的tokenizer文件进行修改，不同模型的tokenizer文件修改内容如下，您可对tokenizer文件进行编辑。 LLama2模型在当前的软件版本中，由于transformers的版本过高（transformers==4

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明参考
网卡名称错误 - AI开发平台ModelArts

网卡名称错误当训练开始时提示网卡名称错误。或者通信超时。可以使用ifconfig命令检查网卡名称配置是否正确。比如，ifconfig看到当前机器IP对应的网卡名称为enp67s0f5，则可以设置环境变量指定该值。图1 网卡名称错误 export GLOO_SOCKET_IFNAME=enp67s0f5

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置本代码包中集成了不同模型（包括llama2、llama3、Qwen、Qwen1.5 ......）的训练脚本，并可通过统一的训练脚本一键式运行。训练脚本可判断是否完成预处理后的数据和权重转换的模型。如果未完成，则执行脚本，自动完成数据预处理和权重转换的过程。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明

总条数： 2651

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

网卡名称错误 - AI开发平台ModelArts

网卡名称错误 - AI开发平台ModelArts

各个模型训练前文件替换 - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

训练作业的自定义镜像制作流程 - AI开发平台ModelArts

在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

通过Token认证的方式访问在线服务 - AI开发平台ModelArts

上传远端文件至JupyterLab - AI开发平台ModelArts

附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

ECS获取和上传基础镜像 - AI开发平台ModelArts

执行训练任务【新】 - AI开发平台ModelArts

执行训练任务【旧】 - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

网卡名称错误 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线