搜索_华为云

ECS获取和上传基础镜像 - AI开发平台ModelArts

ECS获取和上传基础镜像 Step1 创建ECS 下文中介绍如何在ECS中构建一个训练镜像，请参考ECS文档购买一个Linux弹性云服务器。完成网络配置、高级配置等步骤，可根据默认选择，或进行自定义。创建完成后，单击“远程登录”，后续安装Docker等操作均在该ECS上进行。注

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作 > 准备镜像
SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

在ECS中输入上一步的登录指令后，使用下列示例命令： docker tag {image_url} swr.myhuaweicloud.com/<组织名称>/<镜像名称>:<tag> docker push swr.myhuaweicloud.com/<组织名称>/<镜像名称>:<tag> 参数说明： <组织名称>：步骤4中创建的组织名称。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
精度问题概述 - AI开发平台ModelArts

本指南提供了算子问题定位工具集详细的使用场景和使用步骤，方便用户自行或在支持下排查可能的数值计算精度问题。当用户将大语言模型或者其他类型深度神经网络的训练从GPU迁移到昇腾AI处理器时，可能出现以下不同现象的模型精度问题。一般包括： Loss曲线与CPU/GPU差异不符合预期。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
使用CodeLab免费体验Notebook - AI开发平台ModelArts

以直接通过Run in ModelArts，一键打开运行和学习，并且可将样例修改后分享到AI Gallery中直接另存用于个人开发。同时，您开发的代码，也可通过CodeLab快速分享到AI Gallery中给他人使用学习。使用限制 CodeLab默认打开，使用的是CPU计算资

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
修改Workflow工作流 - AI开发平台ModelArts

Array of WorkflowStorage objects 工作流存储信息。 labels 否 Array of strings 工作流标签。 smn_switch 否 String SMN消息订阅开关。 steps 否 Array of WorkflowStep objects

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
管理训练容器环境变量 - AI开发平台ModelArts

约束限制为了避免新设置的环境变量与系统环境变量冲突，而引起作业运行异常或失败，请在定义自定义环境变量时，不要使用“MA_”开头的名称。如何修改环境变量用户可以在创建训练作业页面增加新的环境变量，也可以设置新的取值覆盖当前训练容器中预置的环境变量值。为保证数据安全，请勿输入敏感信息，例如明文密码。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
ModelArts计费模式概述 - AI开发平台ModelArts

适用资源池专属资源池公共资源池、专属资源池适用功能模块 Standard自动学习、Workflow、Notebook、模型训练、模型部署 Lite Cluster Lite Server Standard自动学习、Workflow、Notebook、模型训练、模型部署变更计费模式不支持

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

cn-southwest-2.myhuaweicloud.com/<组织名称>/<镜像名称>:<tag>。<组织名称>为Step2 创建镜像组织中创建的组织名称，<镜像名称>:<tag>为自定义镜像名称。打印如下信息，表示构建镜像成功。图5 成功构建镜像 Step6 在ECS中Docker登录

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 准备工作
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

cn-southwest-2.myhuaweicloud.com/<组织名称>/<镜像名称>:<tag>。<组织名称>为Step2 创建镜像组织中创建的组织名称，<镜像名称>:<tag>为自定义镜像名称。打印如下信息，表示构建镜像成功。图5 成功构建镜像 Step6 在ECS中Docker登录

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 准备工作
分布式训练功能介绍 - AI开发平台ModelArts

）：针对Resnet18在cifar10数据集上的分类任务，给出了分布式训练改造(DDP)的完整代码示例，供用户学习参考。基于开发环境使用SDK调测训练作业：介绍如何在ModelArts的开发环境中，使用SDK调测单机和多机分布式训练作业。父主题：分布式模型训练

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

cn-southwest-2.myhuaweicloud.com/<组织名称>/<镜像名称>:<tag> . 参数说明： <组织名称>：Step3中创建的组织名称。 <镜像名称>:<tag>：定义镜像名称。示例：llama_ascend_pytorch_2_1:0.5.3 示例： docker

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

AI框架版本升级，使用了新版本算子。例如：每半年对模型进行一次变更，变更的内容包含模型结构，并升级AI框架。 - 尺寸要求超分前产生的图片尺寸要求： 512*512 720*720 1080 *1080 1920*1920 （shape过大可能导致性能下降） - 父主题： GPU推理业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
部署推理服务 - AI开发平台ModelArts

--enable-prefix-caching：如果prompt的公共前缀较长或者多轮对话场景下推荐使用prefix-caching特性。在推理服务启动脚本中添加此参数表示使用，不添加表示不使用。如果模型长度>8192，不支持开启prefix-caching特性，否则会导致推理服务不可用。 --quantiza

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
查询资源规格列表 - AI开发平台ModelArts

参数是否必选参数类型描述 continue 否 String 分页查询时上一页位置。 labelSelector 否 String 标签筛选。 limit 否 Integer 分页数目。请求参数无响应参数状态码：200 表3 响应Body参数参数参数类型描述 apiVersion

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
配置Lite Server存储 - AI开发平台ModelArts

使用场景如高性能计算、媒体处理、文件共享和内容管理和Web服务等。说明：高性能计算：主要是高带宽的需求，用于共享文件存储，比如基因测序、图片渲染这些。如大数据分析、静态网站托管、在线视频点播、基因测序和智能视频监控等。如高性能计算、企业核心集群应用、企业应用系统和开发测试等。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
执行训练任务（历史版本） - AI开发平台ModelArts

context-parallel-size 。（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
推理性能测试 - AI开发平台ModelArts

--served-model-name：选择性添加，在接口中使用的模型名；如果没有配置，则默认为tokenizer。脚本运行完成后，测试结果保存在benchmark_parallel.csv中，示例如下图所示。图1 静态benchmark测试结果（示意图）动态benchmark 本章节介绍如何进行动态benchmark验证。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908）
Open-Sora 1.0基于DevServer适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

Open-Sora 1.0基于DevServer适配PyTorch NPU训练指导（6.3.905）本文档主要介绍如何在ModelArts Lite DevServer上，使用PyTorch_npu+华为自研Ascend Snt9B硬件，完成Open-Sora训练和推理。资源规格要求

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

上传镜像至容器镜像服务镜像仓库。使用docker tag命令给上传镜像打标签。 #region和domain信息请替换为实际值，组织名称deep-learning也请替换为自定义的值。 sudo docker tag mindspore:2.1.1-cann6.3.RC2 swr

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
Standard镜像相关 - AI开发平台ModelArts

Standard镜像相关不在同一个主账号下，如何使用他人的自定义镜像创建Notebook？如何登录并上传镜像到SWR？在Dockerfile中如何给镜像设置环境变量？如何通过docker镜像启动容器？如何在ModelArts的Notebook中配置Conda源？ Mod

帮助中心 > AI开发平台ModelArts > 常见问题

总条数： 1240

上一页
1
...
31
32
33
...
62
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ECS获取和上传基础镜像 - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

精度问题概述 - AI开发平台ModelArts

使用CodeLab免费体验Notebook - AI开发平台ModelArts

修改Workflow工作流 - AI开发平台ModelArts

管理训练容器环境变量 - AI开发平台ModelArts

ModelArts计费模式概述 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

分布式训练功能介绍 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

查询资源规格列表 - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

Open-Sora 1.0基于DevServer适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

Standard镜像相关 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线