检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
收敛且趋势与GPU训练loss一致 图5 lora微调双机loss曲线对比结果 图6 lora微调双机loss曲线对比结果 父主题: MLLM多模态模型训练推理
增量训练在很多领域都有应用,比如自然语言处理、计算机视觉和推荐系统等。它使得AI系统能够更加灵活和适应性强,更好地应对现实世界中不断变化的数据环境。 ModelArts Standard中如何实现增量训练 增量训练是通过Checkpoint机制实现。
LLM大语言模型训练推理场景 样例 场景 说明 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导 预训练、SFT全参微调训练、LoRA微调训练
DeepSeek系列模型 表1 DeepSeek系列模型 支持模型 应用场景 软件技术栈 指导文档 DeepSeek R1 推理 MindIE DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导 DeepSeek V3 推理 MindIE LLM大语言模型
表2 Query参数 参数 是否必选 参数类型 描述 locale 是 String 语言。可选值如下: zh-cn:中文 en-us:英文(默认值) 请求参数 表3 请求Body参数 参数 是否必选 参数类型 描述 action 是 Integer 验收行为。
表2 Query参数 参数 是否必选 参数类型 描述 locale 否 String 语言。可选值如下: zh-cn:中文 en-us:英文(默认值) sample_state 否 String 样本状态。
表2 Query参数 参数 是否必选 参数类型 描述 locale 否 String 语言。可选值如下: zh-cn:中文 en-us:英文(默认值) sample_state 否 String 样本状态。
locale 否 String 语言。可选值如下: zh-cn:中文 en-us:英文(默认值) offset 否 Integer 分页列表的起始页,默认为0。 process_parameter 否 String 图像缩略设置,同OBS缩略图设置,详见OBS缩略图设置。
locale 否 String 语言。可选值如下: zh-cn:中文 en-us:英文(默认值) low_score 否 String 置信度下界,默认为0。 offset 否 Integer 分页列表的起始页,默认为0。 order 否 String 指定查询的排序顺序。
Alpaca:用于训练语言模型的数据集格式,文件类型为jsonl。 ShareGPT:用于分享GPT模型对话结果的数据集格式,文件类型为jsonl。 请按数据集格式要求准备数据,否则会导致调优作业失败。
ModelArts只支持使用Python语言编写的启动文件,因此启动文件必须以“.py”结尾。 本地代码目录 仅当“代码来源”选择“对象OBS存储”时才显示该参数。 指定训练容器的本地目录,启动训练时系统会将代码目录下载至此目录。
无效的系统语言 请检查系统语言是否支持 400 ModelArts.4399 Type match error 创建智能标注任务时,数据集类型和算法模型不匹配 请检查算法模型是否正确。