搜索_华为云

LLaVA-NeXT基于Lite Server适配PyTorch NPU训练微调指导（6.3.912） - AI开发平台ModelArts

AscendCloud-6.3.912软件包中的AscendCloud-AIGC-6.3.912-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取路径：Support-E，在此路径中查找下载ModelArts 6.3.912 版本。说明：如果上述软件获取路

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

AscendCloud-6.3.910-xxx.zip 说明：软件包名称中的xxx表示时间戳。包含了本教程中使用到的模型训练代码、推理部署代码和推理评测代码。代码包具体说明请参见模型软件包结构说明。 AscendSpeed是用于模型并行计算的框架，其中包含了许多模型的输入处理方法。获取路径：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 准备工作
准备预测分析数据 - AI开发平台ModelArts

表格数据集对训练数据的要求：训练数据列数一致，总数据量不少于100条不同数据（有一个特征取值不同，即视为不同数据）。训练数据列内容不能有时间戳格式（如：yy-mm-dd、yyyy-mm-dd等）的数据。如果某一列的取值只有一种，会被视为无效列。请确保标签列的取值至少有两个且无数据缺失。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现预测分析
LoRA微调训练 - AI开发平台ModelArts

业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图2 开启故障重启断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权重、优化器状态、调度器状态）。即便模型训

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
数据保护技术 - AI开发平台ModelArts

算SHA256值的方式对上传下载的数据进行一致性校验。数据隔离机制在ModelArts的开发环境中创建Notebook实例时，数据存储是按照租户隔离，租户之间互相看不到数据。父主题：安全

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
资产识别与管理 - AI开发平台ModelArts

资产识别与管理资产识别用户在AI Gallery中的资产包括用户发布的AI资产以及用户提供的一些个人信息。 AI资产包括但不限于文本、图形、数据、文章、照片、图像、插图、代码、AI算法、AI模型等。用户的个人信息包括：用户注册时提供的昵称、头像、邮箱。用户参加实践时提供的姓名、手机号、邮箱。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
配置用户缺失的服务权限 - AI开发平台ModelArts

图6 授权用户组在“授权”页面，选中步骤1创建的策略名称，单击“下一步”，按需选择授权范围方案，单击“确定”。图7 授权页面在“权限生效时间提醒”对话框，仔细阅读相关信息，然后单击“知道了”。查看并配置缺失的服务权限。登录MaaS控制台，单击顶部提示中的“此处”，在“服务权限缺失”对话框，查看缺失的服务权限。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
查询用户所有DevServer实例列表 - AI开发平台ModelArts

ASC升序。 DESC降序。 sort_key 否 String 排序字段，枚举值如下： createTime：默认值，创建时间。 updateTime：更新时间。 limit 否 Integer 每一页的数量。 offset 否 Integer 分页记录的起始位置偏移量。请求参数

 帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
训练启动脚本说明和参数配置 - AI开发平台ModelArts

MOSSInstructionHandler：使用微调的moss数据集。 MBS 1 表示流水线并行中一个micro batch所处理的样本量。在流水线并行中，为了减少气泡时间，会将一个step的数据切分成多个micro batch。该值与TP和PP以及模型大小相关，可根据实际情况进行调整。 GBS 128 表

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.907） > 训练脚本说明
CogVideoX模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.911） - AI开发平台ModelArts

Server环境中，使用NPU卡对CogVideoX模型基于sat框架进行全量微调。本文档中提供的脚本，是基于原生CogVideoX的代码基础适配修改，可以用于NPU芯片训练。 CogVideo是一个94亿参数的Transformer模型，用于文本到视频生成。通过继承一个预训练的文本到图像

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
训练启动脚本说明和参数配置 - AI开发平台ModelArts

MOSSInstructionHandler：使用微调的moss数据集。 MBS 1 表示流水线并行中一个micro batch所处理的样本量。在流水线并行中，为了减少气泡时间，会将一个step的数据切分成多个micro batch。该值与TP和PP以及模型大小相关，可根据实际情况进行调整。 GBS 128 表

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

MOSSMultiTurnHandler：使用微调的moss数据集。 MBS 4 表示流水线并行中一个micro batch所处理的样本量。在流水线并行中，为了减少气泡时间，会将一个step的数据切分成多个micro batch。该值与TP和PP以及模型大小相关，可根据实际情况进行调整。 GBS 512 表

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
查询节点列表 - AI开发平台ModelArts

name}/nodes 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 资源池名称。表2 Query参数参数是否必选参数类型描述 continue

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
部署推理服务 - AI开发平台ModelArts

否有对应运行的进程如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。驱动版本要求是23.0.6。如果不符合要求请参考安装固件和驱动章节升级驱动。启动后容器默认端口是8080。配置需要使用的NPU卡为

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
Open-Sora1.2基于Lite Server适配PyTorch NPU训练推理指导（6.3.910） - AI开发平台ModelArts

AscendCloud-6.3.910软件包中的AscendCloud-AIGC-6.3.910-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取路径：Support-E，在此路径中查找下载ModelArts 6.3.910 版本。说明：如果上述软件获取路

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
在ModelArts的Notebook中安装远端插件时不稳定要怎么办？ - AI开发平台ModelArts

方法二：设置远端默认安装的插件按照在ModelArts的Notebook中如何设置VS Code远端默认安装的插件？配置，即会在连接远端时自动安装，减少等待时间。方法三：VS Code官网排查方式https://code.visualstudio.com/docs/remote/troubleshooting

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
VS Code一键连接Notebook - AI开发平台ModelArts

图14 选择Python版本对于打开的代码文件，单击run按钮，即可执行，可以在下方的Terminal中看到代码输出信息。如果执行较长时间的训练作业，建议使用nohup命令后台运行，否则SSH窗口关闭或者网络断连会影响正在运行的训练作业，命令参考： nohup your_train_job

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

onfig/jobstart_hccl.json”，“/user/config/jobstart_hccl.json”配置文件生成需要一段时间，业务进程需要等待“/user/config/jobstart_hccl.json”中“status”字段为“completed”状态，才能生成卡间通信信息。如下图所示。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
迁移效果校验 - AI开发平台ModelArts

pipeline输出的结果图片进行对比，在这里保证输入图片及文本提示词一致。如果差异较为明显可以进行模型精度调优。确认性能是否满足要求在推理代码开始结尾处加入时间记录，并打印出推理执行耗时。根据用户需求判断性能是否满足要求，如果不满足可以进行性能调优。 import time start_time =

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
实时推理的部署及使用流程 - AI开发平台ModelArts

实时推理的部署及使用流程在创建完模型后，可以将模型部署为一个在线服务。当在线服务的状态处于“运行中”，则表示在线服务已部署成功，部署成功的在线服务，将为用户提供一个可调用的API，此API为标准Restful API。访问在线服务时，您可以根据您的业务需求，分别确认使用何种认证

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业

总条数： 1073

上一页
1
...
26
27
28
...
54
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

LLaVA-NeXT基于Lite Server适配PyTorch NPU训练微调指导（6.3.912） - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备预测分析数据 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

数据保护技术 - AI开发平台ModelArts

资产识别与管理 - AI开发平台ModelArts

配置用户缺失的服务权限 - AI开发平台ModelArts

查询用户所有DevServer实例列表 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

CogVideoX模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.911） - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

查询节点列表 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

Open-Sora1.2基于Lite Server适配PyTorch NPU训练推理指导（6.3.910） - AI开发平台ModelArts

在ModelArts的Notebook中安装远端插件时不稳定要怎么办？ - AI开发平台ModelArts

VS Code一键连接Notebook - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

迁移效果校验 - AI开发平台ModelArts

实时推理的部署及使用流程 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线