搜索_华为云

准备Notebook - AI开发平台ModelArts

准备Notebook ModelArts Notebook云上云下，无缝协同，更多关于ModelArts Notebook的详细资料请查看开发环境介绍。本案例中的训练作业需要通过SFS Turbo挂载盘的形式创建，因此需要将上述数据集、代码、权重文件从OBS桶上传至SFS Turbo中。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
Notebook cache盘告警上报 - AI开发平台ModelArts

图3 告警条件设置设置告警通知，单击“立即创建”。 “告警方式”：选择“直接告警” “行动规则”：开启开关，选择已创建的行动规则。如果现有列表中的告警行动规则无法满足需要，可单击“新建告警行动规则”添加，详细操作请参考创建告警行动规则。 “告警恢复通知”：开启开关图4 设置告警通知

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
套餐包 - AI开发平台ModelArts
套餐包 - AI开发平台ModelArts

量预警步骤如下：进入控制台“费用中心 > 资源包”，单击右上角“剩余量预警”。在“剩余量预警”弹窗中，设置套餐包阈值类型，并在套餐包列表中打开需开启剩余量预警的套餐包开关、设置阈值类型和剩余量阈值。图1 设置剩余量预警设置完成后，单击“确定”，即可完成套餐包剩余量预警。父主题：

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

无误后，单击“提交”，完成Notebook的创建操作。进入Notebook列表，正在创建中的Notebook状态为“创建中”，创建过程需要几分钟，请耐心等待。当Notebook状态变为“运行中”时，表示Notebook已创建并启动完成。打开运行中的Notebook实例。图1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
配置多分支节点数据 - AI开发平台ModelArts

JobStep的输入在运行时配置；data字段也可使用data=wf.data.OBSPath(obs_path="fake_obs_path")表示 outputs=wf.steps.JobOutput(name="train_url",

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
Notebook中构建新镜像 - AI开发平台ModelArts

Notebook中构建新镜像 ModelArts中注册镜像通过ECS获取和上传基础镜像将基础镜像上传后，可在SWR中查看已上传的镜像。但在ModelArts中还需要完成镜像注册后，才能在后续的Notebook中使用。访问ModelArts，在镜像管理中选择注册镜像，如图所示：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像
发布和管理AI Gallery项目 - AI开发平台ModelArts

Notebook 界面提示成功创建分享后，返回至AI Gallery，进入示例的详情页面查看示例。进入AI Gallery首页。选择“项目”，进入项目列表页面。在搜索框中输入创建好的Notebook名称，单击页签进入详情页。编辑资产详情资产发布成功后，发布者可以进入详情页修改该资产的名称

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
配置Workflow的输入输出目录 - AI开发平台ModelArts

不填默认使用name的值。否 str description 描述信息。否 str create_dir 表示是否自动创建目录，默认为“False”。否 bool with_execution_id 表示创建目录时是否拼接execution_id，默认为“False”。该字段只有在create

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
在ModelArts Standard上运行GPU多机多卡训练任务 - AI开发平台ModelArts

docker run -ti -d -v /mnt/sfs_turbo:/sfs my_deeplearning_image:v1 上述命令表示把宿主机的"/mnt/sfs_turbo"目录挂载到容器的"/sfs"目录，在宿主机和容器对应目录的所有改动都是实时同步的。分析错误时：

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
从0制作自定义镜像用于创建训练作业（PyTorch+CPU/GPU） - AI开发平台ModelArts

要创建的文件夹列表如表1所示，示例中的桶名称“test-modelarts”和文件夹名称均为举例，请替换为用户自定义的名称。创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。请确保您使用的OBS与ModelArts在同一区域。表1 OBS桶文件夹列表文件夹名称用途

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
保存Notebook实例 - AI开发平台ModelArts

the threshold (25G)”如何解决？处理。前提条件 Notebook实例状态为“运行中”。保存镜像在Notebook列表中，对于要保存的Notebook实例，单击右侧“操作”列中的“更多 > 保存镜像”，进入“保存镜像”对话框。图1 保存镜像在保存镜像对话

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
使用ma-cli obs-copy命令复制OBS数据 - AI开发平台ModelArts

profile is "DEFAULT". -H, -h, --help Show this message and exit. 表1 参数说明参数名参数类型是否必选参数说明 -d / --drop-last-dir Bool 否如果指定，在复制文件夹时不会将源

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
附录：微调训练常见问题 - AI开发平台ModelArts

atch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考模型NPU卡数、梯度累积值取值表，如原使用Accelerator可替换为Deepspeed-ZeRO-1，Deepspeed-ZeRO-1替换为Deepspeed-ZeRO

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
基于MindSpore Lite的模型转换 - AI开发平台ModelArts

输入数据：编译后的模型提供了predict接口用户执行模型推理任务，Inputs输入为List Tensor，这里的Tensor是MSLite的概念，具体的列表长度和tensor类型由转换时的InputShape来确定，由于后端指定了ascend，这些tensor都是在昇腾设备的显存中，用户需要在对

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
ModelArts入门实践 - AI开发平台ModelArts

ModelArts入门实践本章节列举了一些常用的实践案例，方便您快速了解并使用ModelArts完成AI开发。表1 常用最佳实践分类实践案例描述适用人群 ModelArts Studio 在ModelArts Studio基于Llama3-8B模型实现新闻自动分类本案例介绍在ModelArts

帮助中心 > AI开发平台ModelArts > 快速入门
使用Prometheus查看Lite Cluster监控指标 - AI开发平台ModelArts

绑定弹性公网IP，并打开节点的安全组配置，添加入方向规则，允许外部访问9090端口。如果使用Grafana对接Prometheus制作报表，可以将Grafana部署在集群内，这里不需要对Prometheus绑定公网IP和配置安全组，只需要对Grafana绑定公网IP和配置安全组即可。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
Standard资源管理 - AI开发平台ModelArts

集群信息，可帮助您及时了解集群现状，更好的规划使用资源。自助管理集群GPU/NPU驱动：每个用户对集群的驱动要求不同，在新版专属资源池列表页中，可自行选择加速卡驱动，并根据业务需要进行立即变更或平滑升级。父主题： Standard功能介绍

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
pipeline代码适配 - AI开发平台ModelArts

le_diffusion/pipeline_onnx_stable_diffusion_img2img.py”，其中${diffuers}表示diffusers包的安装路径，可以通过pip进行查看。 # shell pip show diffusers 修改代码依赖新建并进入/

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
示例：从 0 到 1 制作自定义镜像并用于训练（Pytorch+CPU/GPU） - AI开发平台ModelArts

要创建的文件夹列表如表1所示，示例中的桶名称“test-modelarts”和文件夹名称均为举例，请替换为用户自定义的名称。创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。请确保您使用的OBS与ModelArts在同一区域。表1 OBS桶文件夹列表文件夹名称用途

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
上传算法至SFS - AI开发平台ModelArts

上传算法至SFS 下载Swin-Transformer代码。 git clone --recursive https://github.com/microsoft/Swin-Transformer.git 修改lr_scheduler.py文件，把第27行：t_mul=1. 注释掉。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡

总条数： 882

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备Notebook - AI开发平台ModelArts

Notebook cache盘告警上报 - AI开发平台ModelArts

套餐包 - AI开发平台ModelArts

在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

配置多分支节点数据 - AI开发平台ModelArts

Notebook中构建新镜像 - AI开发平台ModelArts

发布和管理AI Gallery项目 - AI开发平台ModelArts

配置Workflow的输入输出目录 - AI开发平台ModelArts

在ModelArts Standard上运行GPU多机多卡训练任务 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（PyTorch+CPU/GPU） - AI开发平台ModelArts

保存Notebook实例 - AI开发平台ModelArts

使用ma-cli obs-copy命令复制OBS数据 - AI开发平台ModelArts

附录：微调训练常见问题 - AI开发平台ModelArts

基于MindSpore Lite的模型转换 - AI开发平台ModelArts

ModelArts入门实践 - AI开发平台ModelArts

使用Prometheus查看Lite Cluster监控指标 - AI开发平台ModelArts

Standard资源管理 - AI开发平台ModelArts

pipeline代码适配 - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（Pytorch+CPU/GPU） - AI开发平台ModelArts

上传算法至SFS - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线