搜索_华为云

训练场景和方案介绍 - AI开发平台ModelArts

训练场景和方案介绍 Stable Diffusion（简称SD）是一种基于扩散过程的图像生成模型，应用于文生图场景，能够帮助用户生成图像。方案概览本方案介绍了在ModelArts Lite DevServer上使用昇腾计算资源Ascend Snt9B开展SDXL和SD1.5模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
Open-Sora-Plan1.0基于DevServer适配PyTorch NPU训练推理指导（6.3.907） - AI开发平台ModelArts

在文件ffmpeg_common.h的23行，添加如下内容 #include <libavcodec/bsf.h> 图1 文件ffmpeg_common.h修改前图2 文件ffmpeg_common.h修改后第二处修改： vim src/video/video_reader.cc

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
与其他云服务的关系 - AI开发平台ModelArts

与其他云服务的关系图1 ModelArts与其他服务的关系示意图与统一身份认证服务的关系 ModelArts使用统一身份认证服务（Identity and Access Management，简称IAM）实现认证功能。IAM的更多信息请参见《统一身份认证服务产品文档》。与对象存储服务的关系

 帮助中心 > AI开发平台ModelArts > 产品介绍
ModelArts与其他服务的关系 - AI开发平台ModelArts

ModelArts与其他服务的关系图1 ModelArts与其他服务的关系示意图与统一身份认证服务的关系 ModelArts使用统一身份认证服务（Identity and Access Management，简称IAM）实现认证功能。IAM的更多信息请参见《统一身份认证服务用户指南》。

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ - AI开发平台ModelArts

服务器A：服务端从mlx4_0网卡接收数据 ib_write_bw -a -d mlx5_0 服务器B：客户端向服务端mlx4_0网卡发送数据。 ib_write_bw -a -F 服务器A的IP -d mlx5_0 --report_gbits 图1 服务器A执行结果图2 服务器B执行结果

 帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
开启训练故障自动重启功能 - AI开发平台ModelArts

致训练作业异常时，系统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图1 开启故障重启断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不限

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

描述模型的简要描述。填写元模型来源及其相关参数。当“元模型来源”选择“从训练中选择”时，其相关的参数配置请参见表2。图1 从训练中选择元模型表2 元模型来源参数说明参数说明 “元模型来源” 选择“从训练中选择”。在“选择训练作业”右侧下拉框中选择当前账号下已完成运行的训练作业。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
训练场景和方案介绍 - AI开发平台ModelArts

训练场景和方案介绍 Stable Diffusion（简称SD）是一种基于扩散过程的图像生成模型，应用于文生图场景，能够帮助用户生成图像。方案概览本方案介绍了在ModelArts Lite DevServer上使用昇腾计算资源Ascend Snt9B开展SDXL和SD1.5模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

登录ModelArts管理控制台，进入“模型管理”页面中，单击“创建模型”，进入模型创建页面，设置相关参数如下：元模型来源：选择“从对象存储服务（OBS）中选择”。选择元模型：从OBS中选择一个模型包。 AI引擎：选择“Custom”。引擎包：从容器镜像中选择一个镜像。容器调用接口：端口和协议可根据镜像实际使用情况自行填写。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
自定义引擎创建模型规范 - AI开发平台ModelArts

元模型来源：选择“从对象存储服务（OBS）中选择”。选择元模型：从OBS中选择一个模型包。 AI引擎：选择“Custom”。引擎包：从容器镜像中选择一个镜像。其他参数保持默认值。单击“立即创建”，跳转到模型列表页，查看模型状态，当状态变为“正常”，模型创建成功。图1 创建模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
订阅免费模型 - AI开发平台ModelArts

使用。图1 推送免费模型如果订阅的是HiLens技能，在弹出的“选择云服务区域”页面选择HiLens所在的云服务区域，单击“确定”跳转至HiLens控制台的“产品订购 > 订单管理 > AI Gallery”页面。该HiLens技能自动同步至HiLens。方式二：从“我的Gallery”进入管理控制台

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
如何在Notebook中上传下载OBS文件？ - AI开发平台ModelArts

#下载一个OBS文件夹sub_dir_0，从OBS下载至Notebook mox.file.copy_parallel('obs://bucket_name/sub_dir_0', '/home/ma-user/work/sub_dir_0') #下载一个OBS文件obs_file.txt，从OBS下载至Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 文件上传下载
Standard开发环境 - AI开发平台ModelArts

并且提供了非常多的可选规格，用户可以独占一个容器环境，不受其他人的干扰。只需简单配置，用户即可通过本地IDE连接到该环境进行运行和调试。图1 本地IDE远程访问Notebook开发环境 Notebook可以视作是本地PC的延伸，均视作本地开发环境，其读取数据、训练、保存文件等操作与常规的本地训练一致。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

Diffusion，请在上表的基础上，再提供以下信息：表2 AIGC场景业务迁移评估表收集项说明实际情况（请填写）使用场景例如：业务是文生图，图生图等。业务是否需要频繁更新模型，或者需要动态加载Lora。 - stable-diffusion套件使用diffusers （https://github

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
Llama 3.2-Vision基于DevServer适配Pytorch NPU训练微调指导（6.3.911） - AI开发平台ModelArts

以单机结果为例，训练成功如下图所示。图1 sft全参微调训练成功图2 lora微调训练成功附：loss曲线 loss结果 sft全参微调NPU训练结果loss收敛且趋势与GPU训练loss一致图3 sft全参微调单机loss曲线对比结果图4 sft全参微调双机loss曲线对比结果

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
发布免费算法 - AI开发平台ModelArts

产的标题、封面图、描述等，让资产更吸引人。修改封面图和二级标题在发布的资产详情页面，单击右侧的“编辑”，选择上传新的封面图，为资产编辑独特的主副标题。编辑完成之后单击“保存”。封面图和二级标题内容自动同步，您可以直接在资产详情页查看修改结果。图1 修改封面图和二级标题编辑标签

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
日志提示“cuda runtime error (10) : invalid device ordinal at xxx” - AI开发平台ModelArts

RuntimeError: cuda runtime error (10) : invalid device ordinal at xxx 图1 错误日志原因分析可以从以下角度排查：请检查CUDA_VISIBLE_DEVICES设置的值是否与作业规格匹配。例如您选择4卡规格的作业，实际可用

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

Gallery页面的资产详情页，单击复制完整的资产名称，如图1所示，获取到的信息即为“repo_id”。例如，复制出的信息为“ur5468675/test_cli_model1”，则该资产的“repo_id”为“ur5468675/test_cli_model1”。图1 复制完整资产名称如果资产详情

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
准备Notebook - AI开发平台ModelArts

由于训练启动命令也会执行sh scripts/install.sh安装依赖包，因此Notebook保存镜像为可选操作。图3 安装依赖包图4 保存镜像图5 填写保存镜像相关参数父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
订阅免费算法 - AI开发平台ModelArts

如创建训练作业等。方式一：从算法详情页进入管理控制台在算法详情页单击“前往控制台”。在弹出的“选择云服务区域”页面选择ModelArts所在的云服务区域，单击“确定”跳转至ModelArts控制台的“算法管理 > 我的订阅”页面。方式二：从“我的Gallery”进入管理控制台

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用

总条数： 482

上一页
1
...
16
17
18
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练场景和方案介绍 - AI开发平台ModelArts

Open-Sora-Plan1.0基于DevServer适配PyTorch NPU训练推理指导（6.3.907） - AI开发平台ModelArts

与其他云服务的关系 - AI开发平台ModelArts

ModelArts与其他服务的关系 - AI开发平台ModelArts

GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ - AI开发平台ModelArts

开启训练故障自动重启功能 - AI开发平台ModelArts

从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

训练场景和方案介绍 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

自定义引擎创建模型规范 - AI开发平台ModelArts

订阅免费模型 - AI开发平台ModelArts

如何在Notebook中上传下载OBS文件？ - AI开发平台ModelArts

Standard开发环境 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

Llama 3.2-Vision基于DevServer适配Pytorch NPU训练微调指导（6.3.911） - AI开发平台ModelArts

发布免费算法 - AI开发平台ModelArts

日志提示“cuda runtime error (10) : invalid device ordinal at xxx” - AI开发平台ModelArts

使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

订阅免费算法 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线