搜索_华为云

Lite Cluster资源配置流程 - AI开发平台ModelArts

Cluster资源池支持镜像预热功能，镜像预热可实现将镜像提前在资源池节点上拉取好，在推理及大规模分布式训练时有效缩短镜像拉取时间。快速配置Lite Cluster资源案例下文提供一个快速配置的案例，配置完成后您可登录到节点查看加速卡信息并完成一个训练任务。在运行此案例前，您需要购买资源，购买资源的步骤请参考Lite

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
使用预置镜像制作自定义镜像用于训练模型 - AI开发平台ModelArts

ow，PyTorch，MindSpore等常用深度学习任务的基础镜像，镜像里已经安装好运行任务所需软件。当基础镜像里的软件无法满足您的程序运行需求时，您可以基于这些基础镜像制作一个新的镜像并进行训练。您可以参考如下步骤基于训练基础镜像来构建新镜像。安装Docker。如果docker

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
Wav2Lip训练基于DevServer适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

driver 23.0.6 PyTorch pytorch_2.1.0 获取软件和镜像表2 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6.3.907-xxx.zip软件包中的AscendCloud-AIGC-6.3.907-xxx.zip 说明：

帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
LLaVA-NeXT基于DevServer适配Pytorch NPU训练微调指导（6.3.910） - AI开发平台ModelArts

3.910版本，请参考获取配套版本的软件包和镜像，请严格遵照版本配套关系使用本文档。确保容器可以访问公网。资源规格要求推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B。获取软件和镜像表1 获取软件和镜像分类名称获取路径插件代码包

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
LLaVA模型基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

rc2 PyTorch pytorch_2.1.0 驱动 23.0.5 获取软件和镜像表2 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6.3.906-xxx.zip软件包中的AscendCloud-AIGC-6.3.906-xxx.zip 说明：

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
训练输出路径被其他作业使用 - AI开发平台ModelArts

根据报错信息判断，在创建训练作业时，同一个“训练输出路径”在被其他作业使用。处理方法一个“训练输出路径”只能被一个处于“运行中”、“排队中”或“初始化”状态的作业使用。当出现此报错时，建议检查并重新填写训练作业的“训练输出路径”，以避免创建作业失败。父主题：云上迁移适配故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

本教程中用到的模型软件包如下表所示，请提前准备好。获取模型软件包本方案支持的模型对应的软件和依赖包获取地址如表1所示。表1 模型对应的软件包和依赖包获取地址代码包名称代码说明下载地址 AscendCloud-6.3.910-xxx.zip 说明：软件包名称中的xxx表示时间戳。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.910） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

本教程中用到的模型软件包如下表所示，请提前准备好。获取模型软件包本方案支持的模型对应的软件和依赖包获取地址如表1所示。表1 模型对应的软件包和依赖包获取地址代码包名称代码说明下载地址 AscendCloud-6.3.911-xxx.zip 说明：软件包名称中的xxx表示时间戳。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.911） > 准备工作
镜像保存时报错“The container size (xG) is greater than the threshold (25G)”如何解决？ - AI开发平台ModelArts

threshold (25G)”如何解决？问题现象镜像保存时报错“The container size (30G) is greater than the threshold (25G)”，镜像创建失败。原因分析镜像保存本质是通过在资源集群节点上的agent中进行了docker

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
LLaVA模型基于DevServer适配PyTorch NPU预训练指导（6.3.906） - AI开发平台ModelArts

rc2 PyTorch pytorch_2.1.0 驱动 23.0.5 获取软件和镜像表2 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6.3.906-xxx.zip软件包中的AscendCloud-AIGC-6.3.906-xxx.zip 说明：

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

本教程中用到的模型软件包如下表所示，请提前准备好。获取模型软件包本方案支持的模型对应的软件和依赖包获取地址如表1所示。表1 模型对应的软件包和依赖包获取地址代码包名称代码说明下载地址 AscendCloud-6.3.909-xxx.zip 说明：软件包名称中的xxx表示时间戳。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 准备工作
SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

资源规格要求推理部署推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B和300IDUO。获取软件和镜像表1 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6.3.909软件包中的AscendCloud-AIGC-6.3.909-xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
安全边界 - AI开发平台ModelArts
安全边界 - AI开发平台ModelArts

负责管理云基础架构，提供安全的硬件和软件基础设施，并确保云基础架构的可用性。而云服务客户则需要负责保护自己的数据和应用程序，以及遵守相关的合规性要求。具体而言，云服务提供商应该提供以下服务和功能：建立和维护安全的基础设施，包括网络、服务器和存储设备等。提供安全的底层基础平台，保证底层环境的运行时安全。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

Cluster资源池上使用Snt9B完成推理任务场景描述本案例介绍如何在Snt9B环境中利用Deployment机制部署在线推理服务。首先创建一个Pod以承载服务，随后登录至该Pod容器内部署在线服务，并最终通过新建一个终端作为客户端来访问并测试该在线服务的功能。图1 任务示意图操作步骤

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
报错“Bad owner or permissions on C:\Users\Administrator/.ssh/config”或“Connection permission denied (publickey)”如何解决？ - AI开发平台ModelArts

C:\Users\Administrator/.ssh/config”或“Connection permission denied (publickey)”如何解决？问题现象报错“Bad owner or permissions on C:\Users\Administrator/.ssh/config”或“Connection

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

本教程中用到的模型软件包如下表所示，请提前准备好。获取模型软件包本方案支持的模型对应的软件和依赖包获取地址如表1所示。表1 模型对应的软件包和依赖包获取地址代码包名称代码说明下载地址 AscendCloud-6.3.906-xxx.zip 说明：软件包名称中的xxx表示时间戳。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
认证鉴权 - AI开发平台ModelArts
认证鉴权 - AI开发平台ModelArts

AK/SK认证：通过AK（Access Key ID）/SK（Secret Access Key）加密调用请求。 Token认证 Token的有效期为24小时，需要使用同一个Token鉴权时，可以缓存起来，避免频繁调用。 Token在计算机系统中代表令牌（临时）的意思，拥有Token就代表拥有某种权限。Toke

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
创建Notebook并执行性能诊断任务 - AI开发平台ModelArts

如果您的NPU性能数据存放在OBS上，Source选择OBS，Path输入OBS地址，格式如obs://bucket1/profiling_dir1，单击Submit按钮。界面参考下图。图4 分析OBS上的性能数据如果您的NPU性能数据存放在Notebook上，Source选择Loca

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
Qwen-VL基于DevServer适配Pytorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

# 在每个实例节点上运行此命令可以看到NPU卡状态 npu-smi info -l | grep Total # 在每个实例节点上运行此命令可以看到总卡数如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
在线服务和批量服务有什么区别？ - AI开发平台ModelArts

在线服务和批量服务有什么区别？在线服务将模型部署为一个Web服务，您可以通过管理控制台或者API接口访问在线服务。批量服务批量服务可对批量数据进行推理，完成数据处理后自动停止。批量服务一次性推理批量数据，处理完服务结束。在线服务提供API接口，供用户调用推理。父主题：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 功能咨询

总条数： 1427

上一页
1
...
9
10
11
...
72
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Lite Cluster资源配置流程 - AI开发平台ModelArts

使用预置镜像制作自定义镜像用于训练模型 - AI开发平台ModelArts

Wav2Lip训练基于DevServer适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

LLaVA-NeXT基于DevServer适配Pytorch NPU训练微调指导（6.3.910） - AI开发平台ModelArts

LLaVA模型基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

训练输出路径被其他作业使用 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

镜像保存时报错“The container size (xG) is greater than the threshold (25G)”如何解决？ - AI开发平台ModelArts

LLaVA模型基于DevServer适配PyTorch NPU预训练指导（6.3.906） - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

安全边界 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

报错“Bad owner or permissions on C:\Users\Administrator/.ssh/config”或“Connection permission denied (publickey)”如何解决？ - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

认证鉴权 - AI开发平台ModelArts

创建Notebook并执行性能诊断任务 - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

在线服务和批量服务有什么区别？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线