搜索_华为云

训练的数据集预处理说明 - AI开发平台ModelArts

enizer的存放路径，与HF权重存放在一个文件夹下。 --seq-length：要处理的最大seq length。 --workers：设置数据处理使用执行卡数量 / 启动的工作进程数。 --log-interval：是一个用于设置日志输出间隔的参数，表示输出日志的频率。在训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

sh方式启动（历史版本）的启动方式，本章节新增了通过benchmark工具启动训练的方式。此方式训练完成后json日志或打屏日志直接打印性能结果，免于计算，方便用户验证发布模型的质量。并且新的训练方式将统一管理训练日志、训练结果和训练配置，使用yaml配置文件方便用户根据自己实际需求进行修改。权

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 执行训练任务
查询超参搜索所有trial的结果 - AI开发平台ModelArts

超参搜索所有trial结果的字段信息。 data Array<Array<String>> 超参搜索所有trial结果的每条数据列表。请求示例如以下查询training_job_id为5b60a667-1438-4eb5-9705-85b860e623dc的作业的所有trial的信息。 GET

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
模型配置文件编写说明 - AI开发平台ModelArts

框架时，请选择您使用的引擎所对应的运行时环境。目前支持的运行时环境列表请参见推理支持的AI引擎。需要注意的是，如果您的模型需指定CPU或GPU上运行时，请根据runtime的后缀信息选择，当runtime中未包含cpu或gpu信息时，请仔细阅读“推理支持的AI引擎”中每个runtime的说明信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
查询数据处理任务版本的结果展示 - AI开发平台ModelArts

Array of objects 样本的处理描述。 result_property Integer 样本的处理状态。可选值如下： -1：全部 0：保留 1：修改 2：删除 3：新增 sample_id String 样本ID，通过OBS路径的md5生成。 signed_new_source

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

Megatron-DeepSpeed是一个基于PyTorch的深度学习模型训练框架。它结合了两个强大的工具：Megatron-LM和DeepSpeed，可在具有分布式计算能力的系统上进行训练，并且充分利用了多个GPU和深度学习加速器的并行处理能力。可以高效地训练大规模的语言模型。 Megatron-LM是

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
查询数据集导出任务的状态 - AI开发平台ModelArts

object 导出数据集任务的参数。 export_type Integer 导出类型。可选值如下： 0：已标注 1：未标注 2：全部 3：条件筛选 finished_sample_count Integer 已完成的样本数量。 path String 导出的输出路径。 progress

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用预置算法训练时，训练失败，报“bndbox”错误 - AI开发平台ModelArts

KeyError: 'bndbox' 原因分析用于训练的数据集中，使用了“非矩形框”标注。而预置使用算法不支持“非矩形框”标注的数据集。处理方法此问题有两种解决方法：方法1：使用常用框架自行编码开发模型，支持“多边形”标注的数据集。方法2：修改数据集，使用矩形标注。然后再启动训练作业。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
查看日志和性能 - AI开发平台ModelArts

训练过程中，训练日志会在第一个的Rank节点打印。图1 打印训练日志训练完成后，如果需要单独获取训练日志文件，日志存放在第一个的Rank节点中；日志存放路径为：对应修改重要参数表格中output_dir参数值路径下的trainer_log.jsonl文件查看性能训练性能主要通过训练日志中的2个指标查看，吞吐量和loss收敛情况。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912）
获取用户绑定APP的api列表 - AI开发平台ModelArts

获取用户绑定APP的api列表功能介绍获取用户绑定app的API列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
创建诊断任务 - AI开发平台ModelArts

advisor分析进程数，可选范围为1-8的任意整数。当LLM类模型训练的流水并行参数pp大于1时，advisor会对不同pp stage的训练profilingg数据进行分析。通过设置更大的进程数可以使能并行分析从而加快分析速度，但也会增大分析占用的cpu资源。通常单进程需要占用1U的cpu和一定cpu

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
查询节点池的节点列表 - AI开发平台ModelArts

String 节点所在的可用区。 privateIp String 节点的IP地址。 resources NodeResource object 节点资源量信息。 availableResources NodeResource object 节点可用资源量信息。表9 NodeResource

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

在SWR服务页面创建镜像组织。图2 创建镜像组织在SWR中单击右上角的“登录指令”，然后在跳出的登录指定窗口，单击复制临时登录指令。在创建的ECS中粘贴临时登录指令，即可完成登录。图3 复制登录指令修改并上传镜像。在ECS中输入上一步的登录指令后，使用下列示例命令： docker tag {image_url}

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
查询Notebook支持的有效规格列表 - AI开发平台ModelArts

flavors Array of NotebookFlavor objects 支持切换的规格列表。 pages Integer 总的页数。 size Integer 每一页的数量。 total Long 总的记录数量。表4 NotebookFlavor 参数参数类型描述 arch String

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
在ModelArts中如何查看OBS目录下的所有文件？ - AI开发平台ModelArts

在ModelArts中如何查看OBS目录下的所有文件？在使用Notebook或训练作业时，需要查看目录下的所有文件，您可以通过如下方式实现：通过OBS管理控制台进行查看。使用当前账户登录OBS管理控制台，去查找对应的OBS桶、文件夹、文件。通过接口判断路径是否存在。在已有

 帮助中心 > AI开发平台ModelArts > 常见问题 > 存储相关
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

优先验证自定义镜像提供的websocket服务的情况，不同的工具实现的websocket服务会有不同，可能出现连接建立后维持不住，可能出现请求一次后连接就中断需要重新连接的情况，ModelArts平台只保证，未上ModelArts前自定义镜像的websocket的形态跟上了Model

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
执行训练任务（推荐） - AI开发平台ModelArts

启动后，可通过以下命令获取所有已创建的pod信息。若pod已全部启动，则状态为：Running。 kubectl get pod -A -o wide 若查看启动作业日志信息，可通过以下命令打印正在启动的日志信息。其中${pod_name}为上述pod信息中的NAME，例如vcjob-main-0。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练任务
报错“no such identity: C:/Users/xx /test.pem: No such file or directory”如何解决？ - AI开发平台ModelArts

pem: No such file or directory”如何解决？问题现象原因分析密钥文件不存在于该路径下，或者该路径下密钥文件名被修改。解决方法重新选择密钥路径。父主题： VS Code连接开发环境失败故障处理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
Lite Cluster资源管理介绍 - AI开发平台ModelArts

后，由于用户AI开发业务的变化，对于资源池资源量的需求可能会产生变化，面对这种场景，ModelArts提供了扩缩容功能，用户可以根据自己的需求动态调整。升级Lite Cluster资源池驱动：当资源池中的节点含有GPU/Ascend资源时，用户基于自己的业务，可能会有自定义GP

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
训练的数据集预处理说明 - AI开发平台ModelArts

} moss原始数据集是一个多轮对话的jsonl，filter的输入就是其中的一行循环处理其中的单轮对话在单轮对话中对user和assistant的文本进行清洗分别encode处理后的文本，获得对应的token序列，user_ids和assistant_ids

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.907） > 训练脚本说明

总条数： 1420

上一页
1
...
17
18
19
...
71
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练的数据集预处理说明 - AI开发平台ModelArts

ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

查询超参搜索所有trial的结果 - AI开发平台ModelArts

模型配置文件编写说明 - AI开发平台ModelArts

查询数据处理任务版本的结果展示 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

查询数据集导出任务的状态 - AI开发平台ModelArts

使用预置算法训练时，训练失败，报“bndbox”错误 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

获取用户绑定APP的api列表 - AI开发平台ModelArts

创建诊断任务 - AI开发平台ModelArts

查询节点池的节点列表 - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

查询Notebook支持的有效规格列表 - AI开发平台ModelArts

在ModelArts中如何查看OBS目录下的所有文件？ - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

报错“no such identity: C:/Users/xx /test.pem: No such file or directory”如何解决？ - AI开发平台ModelArts

Lite Cluster资源管理介绍 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线