搜索_华为云

线下容器镜像构建及调试 - AI开发平台ModelArts

docker run -ti -d -v /mnt/sfs_turbo:/sfs my_deeplearning_image:v1 上述命令表示把宿主机的"/mnt/sfs_turbo"目录挂载到容器的"/sfs"目录，在宿主机和容器对应目录的所有改动都是实时同步的。分析错误时：

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
创建并管理工作空间 - AI开发平台ModelArts

“工作空间”进入工作空间列表。在工作空间列表，单击操作列的“配额管理”进入工作空间详情页。在配额信息页面可以查看工作空间设置的配额值、已用的配额、最后修改时间等配额信息。单击配额信息右侧的“修改配额”可以修改配额值。配置值的配置说明请参见表2。表2 配额信息配额名称配额值说明

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
免费资产和商用资产 - AI开发平台ModelArts

当前支持免费分享和订阅的资产类型有：Notebook代码样例、数据集、算法、模型、镜像。商用资产由华为云云商店提供卖家发布和买家购买相关功能，AI Gallery仅提供列表展示。购买商业售卖的AI资产，本质上是购买算法、模型等AI资产的使用配额，在配额定义的约束下，有限地使用算法、模型等。卖家发布AI类资产操

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版）
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

在“订单信息确认”页面，确认服务信息和费用，单击“确定”跳转至在线推理服务列表页面。当“状态”变为“运行中”表示在线推理服务部署成功，可以进行服务预测。推理服务预测待在线推理服务状态变为“运行中”时，便可进行推理预测。在在线推理服务列表页面，选择服务“状态”为“运行中”的服务。单击操作列的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
训练启动脚本说明和参数配置 - AI开发平台ModelArts

obs_data_dir) 模型推荐的参数与NPU卡数设置不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 不同模型推荐的参数与NPU卡数设置序号支持模型支持模型参数量训练策略类型文本序列长度（SEQ_LEN）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
SD3.5基于Lite Server适配PyTorch NPU的推理指导（6.3.912） - AI开发平台ModelArts

推荐使用“西南-贵阳一”Region上的Server资源和Ascend Snt9B单机。表1 环境要求名称版本 driver 23.0.6 PyTorch pytorch_2.1.0 获取软件和镜像表2 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6.3

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
训练网络迁移总结 - AI开发平台ModelArts

性能会有比较好的参考。算子级的调优某些情况下如果是明显的瓶颈或者性能攻坚阶段，考虑到门槛较高，可以联系华为工程师获得帮助。精度问题根因和表现种类很多，会导致问题定位较为复杂，一般还是需要GPU上充分稳定的网络（包含混合精度）再到NPU上排查精度问题。常见的精度调测手段，包含使用

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
查询支持的镜像列表 - AI开发平台ModelArts

/v1/{project_id}/images 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 limit 否 Integer 每一页的数量，默认值200。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
msprobe精度比对 - AI开发平台ModelArts

首先通过在PyTorch训练脚本中插入dump接口，跟踪计算图中算子的前向传播与反向传播时的输入与输出，然后再使用子命令compare进行比对生成比对表格。当前比对结果支持计算Cosine（余弦相似度）、MaxAbsErr（最大绝对误差）和MaxRelativeErr（最大相对误差）、One

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

Show this message and exit. 表3 参数说明参数名参数类型是否必选参数说明 YAML_FILE String 否表示训练作业的配置文件，如果不传则表示配置文件为空。 --code-dir String 是训练源代码的OBS路径。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
从0制作自定义镜像用于创建训练作业（Tensorflow+GPU） - AI开发平台ModelArts

要创建的文件夹列表如表1所示，示例中的桶名称“test-modelarts” 和文件夹名称均为举例，请替换为用户自定义的名称。创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。请确保您使用的OBS与ModelArts在同一区域。表1 OBS桶文件夹列表文件夹名称用途

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
配置多分支节点数据 - AI开发平台ModelArts

JobStep的输入在运行时配置；data字段也可使用data=wf.data.OBSPath(obs_path="fake_obs_path")表示 outputs=wf.steps.JobOutput(name="train_url",

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
查询所有Notebook实例列表 - AI开发平台ModelArts

查询所有Notebook实例列表功能介绍查询所有Notebook实例列表，用户可按需查询满足条件的Notebook实例列表。接口约束暂无约束调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
套餐包 - AI开发平台ModelArts
套餐包 - AI开发平台ModelArts

量预警步骤如下：进入控制台“费用中心 > 资源包”，单击右上角“剩余量预警”。在“剩余量预警”弹窗中，设置套餐包阈值类型，并在套餐包列表中打开需开启剩余量预警的套餐包开关、设置阈值类型和剩余量阈值。图1 设置剩余量预警设置完成后，单击“确定”，即可完成套餐包剩余量预警。父主题：

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
查询Notebook实例列表 - AI开发平台ModelArts

查询Notebook实例列表功能介绍查询Notebook实例列表，用户可按需查询满足条件的Notebook实例列表。接口约束暂无约束调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

4.2版本。仅支持FP16和BF16数据类型推理。本案例仅支持在专属资源池上运行。支持的模型列表本方案支持的模型列表、对应的开源权重获取地址如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化是否支持W8A8量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
附录：训练常见问题 - AI开发平台ModelArts

atch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考模型NPU卡数、梯度累积值取值表，如原使用Accelerator可替换为Deepspeed-ZeRO-1，Deepspeed-ZeRO-1替换为Deepspeed-ZeRO

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909）
（可选）Session鉴权 - AI开发平台ModelArts

Id和Secret Access Key）。 “project_id”即项目ID，获取方式如下：在“我的凭证”页面，单击“API凭证”，在“项目列表”中可查看项目ID和名称（即“项目”）。多项目时，展开“所属区域”，从“项目ID”列获取子项目ID。图1 查看项目ID “region_n

帮助中心 > AI开发平台ModelArts > SDK参考 > Session鉴权
附录：训练常见问题 - AI开发平台ModelArts

atch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考模型NPU卡数、梯度累积值取值表，如原使用Accelerator可替换为Deepspeed-ZeRO-1，Deepspeed-ZeRO-1替换为Deepspeed-ZeRO

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910）
附录：训练常见问题 - AI开发平台ModelArts

atch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考模型NPU卡数、梯度累积值取值表，如原使用Accelerator可替换为Deepspeed-ZeRO-1，Deepspeed-ZeRO-1替换为Deepspeed-ZeRO

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911）

总条数： 1272

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

线下容器镜像构建及调试 - AI开发平台ModelArts

创建并管理工作空间 - AI开发平台ModelArts

免费资产和商用资产 - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

SD3.5基于Lite Server适配PyTorch NPU的推理指导（6.3.912） - AI开发平台ModelArts

训练网络迁移总结 - AI开发平台ModelArts

查询支持的镜像列表 - AI开发平台ModelArts

msprobe精度比对 - AI开发平台ModelArts

ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（Tensorflow+GPU） - AI开发平台ModelArts

配置多分支节点数据 - AI开发平台ModelArts

查询所有Notebook实例列表 - AI开发平台ModelArts

套餐包 - AI开发平台ModelArts

查询Notebook实例列表 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

（可选）Session鉴权 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线