搜索_华为云

各个模型训练前文件替换 - AI开发平台ModelArts

各个模型训练前文件替换在训练开始前，因模型权重文件可能与训练框架不匹配或有优化，因此需要针对模型的tokenizer文件进行修改或替换，不同模型的tokenizer文件修改内容如下。 falcon-11B模型在训练开始前，针对falcon-11B模型中的tokenizer文件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
各个模型训练前文件替换 - AI开发平台ModelArts

各个模型训练前文件替换在训练开始前，因模型权重文件可能与训练框架不匹配或有优化，因此需要针对模型的tokenizer文件进行修改或替换，不同模型的tokenizer文件修改内容如下。 falcon-11B模型在训练开始前，针对falcon-11B模型中的tokenizer文件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
查询团队标注任务统计信息 - AI开发平台ModelArts

标签的多维度属性，如标签为“音乐”，可能包含属性“风格”、“歌手”等。 count Integer 该标签的打标数量。 name String 标签名称。 property LabelProperty object 标签基本属性键值对，如颜色、快捷键等。 sample_count Integer 包含该标签的样本数量。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

处理后的数据集名称，必选。 proportion: 测试集所占份数，范围[1,9]，可选。 test_count: 测试集的个数，范围[1,处理后数据集总长度 - 1]，可选。(用户在输入test_count时，要小于 Excel文件中指定的不同conversation_id的个数 + conversation_id为空的个数)

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

处理后的数据集名称，必选。 proportion: 测试集所占份数，范围[1,9]，可选。 test_count: 测试集的个数，范围[1,处理后数据集总长度 - 1]，可选。(用户在输入test_count时，要小于 Excel文件中指定的不同conversation_id的个数 + conversation_id为空的个数)

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

vpc_id参数不生效，使用专属资源池部署服务时需确保集群状态正常，该参数优先级高于cluster_id，配置该参数时需要同时配置服务层级的cluster_id或pool_name参数，且该参数优先级高于服务层级的cluster_id及pool_name，当config内的clu

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
Standard自动学习 - AI开发平台ModelArts

ModelArts自动学习，为入门级用户提供AI零代码解决方案支持图片分类、物体检测、预测分析、声音分类场景自动执行模型开发、训练、调优和推理机器学习的端到端过程根据最终部署环境和开发者需求的推理速度，自动调优并生成满足要求的模型 ModelArts自动学习，为资深级用户提供模板化开发能力

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
性能调优 - AI开发平台ModelArts
性能调优 - AI开发平台ModelArts

Optimization Engine)，可以对于模型的图和算子运行通过内置的知识库进行自动优化，以提升模型的运行效率。开启AOE调优后，模型转换时会自动进行性能调优操作，该过程耗时较长，可能需要数小时。 AOE性能自动优化在模型转换阶段进行配置（即执行converter_lite命令时），通过-

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

成功执行动态路由的回显只有任务节点大于等于3的训练任务才能成功执行动态路由。如果执行失败可以参考故障排除：ranktable路由优化执行失败处理。故障排除：ranktable路由优化执行失败故障现象容器日志有error信息。可能原因集群节点没有下发topo文件和ranktable文件。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

ModelArts模型负载 1分钟 req_count_2xx 2xx响应次数统计api接口2xx响应的次数 ≥Count/min ModelArts在线服务 1分钟 req_count_4xx 4xx异常次数统计api接口返回4xx错误的次数 ≥Count/min ModelArts在线服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
查询数据处理任务的版本详情 - AI开发平台ModelArts

表2 响应Body参数参数参数类型描述 add_sample_count Integer 处理后新增的图片数量。 create_time Long 数据处理任务的创建时间。 deleted_sample_count Integer 处理后删除的图片数量。 description

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
资产识别与管理 - AI开发平台ModelArts

Gallery会将资产保存在AI Gallery官方的SWR仓库内。对于用户提供的一些个人信息，AI Gallery会保存在数据库中。个人信息中的敏感信息，如手机，邮箱等，AI Gallery会在数据库中做加密处理。 AI Gallery的更多介绍请参见《AI Gallery》。父主题：安全

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
查询服务列表 - AI开发平台ModelArts

响应Body参数参数参数类型描述 total_count Integer 不分页的情况下符合查询条件的总服务数量。 count Integer 当前查询结果的服务数量，不设置offset、limit查询参数时，count与total相同。 services Array of

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

MaaS集成了业界主流开源大模型，含Llama、Baichuan、Yi、Qwen、AIGC等模型系列，所有的模型均基于昇腾AI云服务进行全面适配和优化，使得精度和性能显著提升。开发者无需从零开始构建模型，只需选择合适的预训练模型进行微调或直接应用，大大减轻模型集成的负担。零代码、免配置、免调优模型开发

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

数值仅供参考，请根据自己实际要求合理配置其他加速框架或ZeRO (Zero Redundancy Optimizer)优化器、NPU节点数即其他配置。具体优化工具使用说明可参考如何选择最佳性能的zero-stage和-offloads。父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
查询标注团队列表 - AI开发平台ModelArts

标注团队的创建时间。 description String 标注团队的描述。 update_time Long 标注团队的更新时间。 worker_count Integer 标注团队的成员总数。 workforce_id String 标注团队ID。 workforce_name String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询标注团队详情 - AI开发平台ModelArts

标注团队的创建时间。 description String 标注团队的描述。 update_time Long 标注团队的更新时间。 worker_count Integer 标注团队的成员总数。 workforce_id String 标注团队ID。 workforce_name String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

处理后的数据集名称，必选。 proportion: 测试集所占份数，范围[1,9]，可选。 test_count: 测试集的个数，范围[1,处理后数据集总长度 - 1]，可选。(用户在输入test_count时，要小于 Excel文件中指定的不同conversation_id的个数 + conversation_id为空的个数)

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作
分页查询智能任务列表 - AI开发平台ModelArts

"progress" : 100.0, "total_sample_count" : 246, "annotated_sample_count" : 38, "unconfirmed_sample_count" : 208, "model_id" : "c717

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
开启训练故障自动重启功能 - AI开发平台ModelArts

断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权重、优化器状态、调度器状态）。即便模型训练中断，也可以基于checkpoint接续训练。当训练作业发生故障中断本次作业时，代码可自动从训练中断的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）

总条数： 323

上一页
1
2
3
4
5
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

各个模型训练前文件替换 - AI开发平台ModelArts

各个模型训练前文件替换 - AI开发平台ModelArts

查询团队标注任务统计信息 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

Standard自动学习 - AI开发平台ModelArts

性能调优 - AI开发平台ModelArts

在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

查询数据处理任务的版本详情 - AI开发平台ModelArts

资产识别与管理 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

查询标注团队列表 - AI开发平台ModelArts

查询标注团队详情 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

分页查询智能任务列表 - AI开发平台ModelArts

开启训练故障自动重启功能 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线