搜索_华为云

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 NPU卡数、加速框架、梯度配置取值表模型 Template 模型参数量训练策略类型序列长度cutoff_len 梯度累积值

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
保存ckpt时超时报错 - AI开发平台ModelArts

保存ckpt时超时报错在多节点集群训练完成后，只有部分节点会保存权重，而其他节点会一直在等待通信。当等待时间超过36分钟时，会发生超时的错误。图1 报错提示解决方法 1. 需要保证磁盘IO带宽正常，可以在36分钟内将文件保存到磁盘。单个节点内，最大只有60G（实际应该在40

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 常见错误原因和解决方法
LLM/AIGC/数字人基于Server适配NPU的训练推理指导 - AI开发平台ModelArts

链接，即可跳转至相应文档查看详细指导。 LLM大语言模型主流开源大模型基于Server适配PyTorch NPU推理指导主流开源大模型基于Server适配ModelLink PyTorch NPU训练指导主流开源大模型基于Server适配LlamaFactory PyTorch

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

gemma-2b 1 64 1 128 37 gemma-7b 1 8 1 32 38 falcon-11b 1 8 1 64 父主题：主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

64 65 qwen-vl-chat 1 64 1 64 66 MiniCPM-v2 2 16 1 16 “-”表示不支持。父主题：主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

gemma-2b 1 64 1 128 37 gemma-7b 1 8 1 32 38 falcon-11b 1 8 1 64 父主题：主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
在JupyterLab使用Git克隆代码仓 - AI开发平台ModelArts

Access Token 查看代码库信息在Name下方列表中，选中您希望使用的文件夹，双击打开，然后单击左侧git插件图标进入此文件夹对应的代码库。图5 打开文件夹后打开git插件即可看到当前代码库的信息，如仓库名称、分支、历史提交记录等。图6 查看代码库信息 Git插件一般默认克

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
ModelArts版本配套关系表 - AI开发平台ModelArts

ModelArts版本配套关系表当前华为云中国站和国际站所有Region均已上线ModelArts 6.7.0版本。 ModelArts 6.7.0版本中针对Ascend Snt9B资源的周边依赖组件配套版本关系如下表所示。表1 ModelArts 6.7.0版本配套关系表强依赖组件

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
AI Gallery功能介绍 - AI开发平台ModelArts

AI Gallery功能介绍面向开发者提供了AI Gallery大模型开源社区，通过大模型为用户提供服务，普及大模型行业。AI Gallery提供了大量基于昇腾云底座适配的三方开源大模型，同步提供了可以快速体验模型的能力、极致的开发体验，助力开发者快速了解并学习大模型。构建零

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
日志提示“No module name 'unidecode'” - AI开发平台ModelArts

日志提示“No module name 'unidecode'” 问题现象从mindspore开源gitee中master分支下载的tacotron2模型，修改配置文件后上传ModelArts准备训练，日志报错提示：No module name 'unidecode'。原因分析

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
如何在Notebook中上传下载OBS文件？ - AI开发平台ModelArts

使用OBS客户端上传文件的操作指导：上传文件方法一：在Notebook中通过Moxing上传下载OBS文件 MoXing是ModelArts自研的分布式训练加速框架，构建于开源的深度学习引擎TensorFlow、PyTorch等之上，使用MoXing API可让模型代码的编写更加简单、高效。 MoXing提供了一

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 文件上传下载
使用Prometheus查看Lite Cluster监控指标 - AI开发平台ModelArts

使用Prometheus查看Lite Cluster监控指标 Prometheus是一款开源监控工具，ModelArts支持Exporter功能，方便用户使用Prometheus等第三方监控系统获取ModelArts采集到的指标数据。本章节主要介绍如何通过Prometheus查看Lite

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
在模型广场查看模型 - AI开发平台ModelArts

在模型广场查看模型在模型广场页面，ModelArts Studio大模型即服务平台提供了丰富的开源大模型，在模型详情页可以查看模型的详细介绍，根据这些信息选择合适的模型进行训练、推理，接入到企业解决方案中。访问模型广场登录ModelArts管理控制台。在左侧导航栏中，选择“ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
LLM大语言模型训练推理 - AI开发平台ModelArts

Studio基于Qwen2-7B模型实现新闻自动分类主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911）主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）主流开源大模型基于Lite Cluster适配PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践
使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

础指标，也支持用户自定义一些指标项上报到AOM查看。此外，还支持在ModelArts Lite Cluster上安装Prometheus开源监控工具，方便用户使用Prometheus工具在Lite Cluster集群内直接采集监控指标数据，具体参见使用Prometheus查看Lite

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
昇腾能力应用地图 - AI开发平台ModelArts

ModelLink LLaMAFactory 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导主流开源大模型基于Standard+OBS适配PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践
什么是ModelArts - AI开发平台ModelArts

以根据需要灵活选择使用，而不需要关心底层的技术。同时，ModelArts支持Tensorflow、PyTorch、MindSpore等主流开源的AI开发框架，也支持开发者使用自研的算法框架，匹配您的使用习惯。产品形态 ModelArts提供多种产品形态，如下表所示。表1 ModelArts产品形态介绍

 帮助中心 > AI开发平台ModelArts > 产品介绍
在MaaS中创建模型 - AI开发平台ModelArts

在MaaS中创建模型在ModelArts Studio大模型即服务平台使用基础模型创建个人专属模型。场景描述 MaaS提供了基于昇腾云算力适配的开源大模型，您可以使用这些基础模型，结合推荐的模型权重文件或自定义的模型权重文件，创建个人专属的模型。创建成功的模型可以在ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
训练迁移快速入门案例 - AI开发平台ModelArts

基于PyTorch上的第三方开发库非常多，例如transformers、accelerate、deepspeed以及Megatron-LM等，这些三方库昇腾也做了类似PyTorch Adapter的适配插件库。您可以在Gitee的昇腾官方仓库按需使用插件库。部分三方库例如最新版本deeps

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
pipeline应用准备 - AI开发平台ModelArts

当前迁移路径是从ONNX模型转换到MindIR模型，再用MindSpore Lite做推理，所以迁移前需要用户先准备好自己的ONNX pipeline。下文以官方开源的图生图的Stable Diffusion v1.5的onnx pipeline代码为例进行说明。进入容器环境，创建自己的工作目录。由

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导

总条数： 998

上一页
1
...
42
43
44
...
50
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

保存ckpt时超时报错 - AI开发平台ModelArts

LLM/AIGC/数字人基于Server适配NPU的训练推理指导 - AI开发平台ModelArts

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

在JupyterLab使用Git克隆代码仓 - AI开发平台ModelArts

ModelArts版本配套关系表 - AI开发平台ModelArts

AI Gallery功能介绍 - AI开发平台ModelArts

日志提示“No module name 'unidecode'” - AI开发平台ModelArts

如何在Notebook中上传下载OBS文件？ - AI开发平台ModelArts

使用Prometheus查看Lite Cluster监控指标 - AI开发平台ModelArts

在模型广场查看模型 - AI开发平台ModelArts

LLM大语言模型训练推理 - AI开发平台ModelArts

使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

昇腾能力应用地图 - AI开发平台ModelArts

什么是ModelArts - AI开发平台ModelArts

在MaaS中创建模型 - AI开发平台ModelArts

训练迁移快速入门案例 - AI开发平台ModelArts

pipeline应用准备 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线