搜索_华为云

LoRA训练 - AI开发平台ModelArts
LoRA训练 - AI开发平台ModelArts

使用ma-user用户执行如下命令运行训练脚本。 sh run_lora.sh 所有数据保存在auto_log/avg_step_time.txt文本中 auto_log/log/目录下存放各个shapes的数据。启动SDXL LoRA训练服务使用ma-user用户执行如下命令运行训练脚本。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Kohya框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
Standard Workflow - AI开发平台ModelArts

、监控、持续运行等功能针对工作流开发，Workflow提供流水线需要覆盖的功能以及功能需要的参数描述，供用户使用SDK对步骤以及步骤之间的关系进行定义针对工作流复用，用户可以在开发完成后将流水线固化下来，提供下次或其他人员使用，同时无需关注流水线中包含什么算法或如何实现图1

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
ModelArts团队标注的数据分配机制是什么？ - AI开发平台ModelArts

ModelArts团队标注的数据分配机制是什么？目前不支持用户自定义成员任务分配，数据是平均分配的。当数量和团队成员人数不成比例，无法平均分配时，则将多余的几张图片，随机分配给团队成员。如果样本数少于待分配成员时，部分成员会存在未分配到样本的情况。样本只会分配给labele

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
产品优势 - AI开发平台ModelArts
产品优势 - AI开发平台ModelArts

多年软硬件经验沉淀，AI场景极致优化。加速套件，训练、推理、数据访问多维度加速。一站式端到端生产工具链，一致性开发体验开“箱”即用，涵盖AI开发全流程，包含数据处理、模型开发、训练、管理、部署功能，可灵活使用其中一个或多个功能。支持本地IDE+ModelArts 插件远程开发能力，线上线下协同开发，开发训

 帮助中心 > AI开发平台ModelArts > 产品介绍
新建Workflow Execution - AI开发平台ModelArts

是否必选参数类型描述 attribute 否 String 条件属性，参数的某个字段值。 operator 否 String 操作，当前只支持equal操作。 value 否 Object 取值。表14 WorkflowParameter 参数是否必选参数类型描述 name

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
【下线公告】华为云ModelArts算法套件下线公告 - AI开发平台ModelArts

无法在Notebook中基于已有算法工程进行资产（数据、模型权重、算法文件）安装、模型开发、训练和推理部署等任务。如您有任何问题，可随时通过工单或者服务热线（4000-955-988或950808）与我们联系。父主题：下线公告

 帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
训练的权重转换说明 - AI开发平台ModelArts

训练完成的权重文件默认不会自动转换为Hugging Face格式权重。若用户需要自动转换，则在运行脚本，例如0_pl_pretrain_13b.sh中，添加变量CONVERT_MG2HF并赋值TRUE。若用户后续不需要自动转换，则在运行脚本中必须删除CONVERT_MG2HF变量。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
查询训练作业详情 - AI开发平台ModelArts

Long 训练作业创建时间戳，单位为毫秒，创建成功后由ModelArts生成返回，无需填写。 user_name String 训练作业创建用户的用户名，创建成功后由ModelArts生成返回，无需填写。 annotations Map<String,String> 训练作业申明模板，

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
自动续费 - AI开发平台ModelArts
自动续费 - AI开发平台ModelArts

弹性集群Cluster”页面中的Standard资源池页签中，单击包年包月的资源池名称，进入详情页，在右上角选择“更多 > 开通自动续费”，按照页面提示跳转到费用中心进行续费操作。在ModelArts控制台修改自动续费包年/包月的Standard专属资源池和弹性集群Lite Cluster资源池在购买成功后支持修改自动续费。

帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
创建工作流定时调度 - AI开发平台ModelArts

/{workflow_id}/schedules 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workflow_id 是 String 工作流的ID。请求参数表2 请求Body参数参数

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
如何定位Workflow运行报错 - AI开发平台ModelArts

根据具体报错信息定位到报错的代码行，分析上下文逻辑。历史SDK包常见的报错如下服务部署节点运行报错输入服务相关的参数后，执行报错如下：解决方案以上两种常见报错均可通过升级最新的SDK包解决。父主题： Standard Workflow

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Workflow
训练中的权重转换说明 - AI开发平台ModelArts

训练完成的权重文件默认不会自动转换为Hugging Face格式权重。若用户需要自动转换，则在运行脚本，例如0_pl_pretrain_13b.sh中，添加变量CONVERT_MG2HF并赋值TRUE。若用户后续不需要自动转换，则在运行脚本中必须删除CONVERT_MG2HF变量。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明
训练中的权重转换说明 - AI开发平台ModelArts

训练完成的权重文件默认不会自动转换为Hugging Face格式权重。若用户需要自动转换，则在运行脚本，例如0_pl_pretrain_13b.sh中，添加变量CONVERT_MG2HF并赋值TRUE。若用户后续不需要自动转换，则在运行脚本中必须删除CONVERT_MG2HF变量。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
附录：config.json文件 - AI开发平台ModelArts

n+maxIterTimes的和。config.json文件中默认是16k，用户可以根据自己的推理场景设置。 maxInputTokenLen：输入最大长度。config.json文件中默认是15k，用户可以根据自己的推理场景设置。 maxPrefillTokens：最大prefill

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导
训练中的权重转换说明 - AI开发平台ModelArts

训练完成的权重文件默认不会自动转换为Hugging Face格式权重。若用户需要自动转换，则在运行脚本，例如0_pl_pretrain_13b.sh中，添加变量CONVERT_MG2HF并赋值TRUE。若用户后续不需要自动转换，则在运行脚本中必须删除CONVERT_MG2HF变量。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
训练中的权重转换说明 - AI开发平台ModelArts

训练完成的权重文件默认不会自动转换为Hugging Face格式权重。若用户需要自动转换，则在运行脚本，例如0_pl_pretrain_13b.sh中，添加变量CONVERT_MG2HF并赋值TRUE。若用户后续不需要自动转换，则在运行脚本中必须删除CONVERT_MG2HF变量。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明
日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

requirements are installed’ 原因分析出现该问题的可能原因如下：用户/训练系统，将CUDA_VISIBLE_DEVICES传错了，检查CUDA_VISIBLE_DEVICES变量是否正常。用户选择了1/2/4卡这些规格的作业，然后设置了CUDA_VISIBLE_DEV

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
如何关闭Mox的warmup - AI开发平台ModelArts

up的原因。等到训练过程基本稳定之后就可以使用原先设定的初始学习率进行训练。原因分析 Tensorflow分布式有多种执行模式，mox会通过4次执行50 step记录执行时间，选择执行时间最少的模型。处理方法创建训练作业时，在“运行参数”中增加参数“variable_upd

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
查询服务监控信息 - AI开发平台ModelArts

model_version String 模型版本。 invocation_times Number 模型实例的总调用次数。 failed_times Number 模型实例调用失败次数。 cpu_core_usage Float 已使用CPU核数。 cpu_core_total

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
查询训练作业列表 - AI开发平台ModelArts

分组条件键对应值。表3 get_job_list返回参数说明参数参数类型描述 total Integer 查询到当前用户名下的所有作业总数。 count Integer 查询到当前用户名下的所有符合查询条件的作业总数。 limit Integer 查询作业的限制量。最小为1，最大为50。 offset

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业

总条数： 2308

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

LoRA训练 - AI开发平台ModelArts

Standard Workflow - AI开发平台ModelArts

ModelArts团队标注的数据分配机制是什么？ - AI开发平台ModelArts

产品优势 - AI开发平台ModelArts

新建Workflow Execution - AI开发平台ModelArts

【下线公告】华为云ModelArts算法套件下线公告 - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

自动续费 - AI开发平台ModelArts

创建工作流定时调度 - AI开发平台ModelArts

如何定位Workflow运行报错 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

附录：config.json文件 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

如何关闭Mox的warmup - AI开发平台ModelArts

查询服务监控信息 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线