搜索_华为云

训练启动脚本说明和参数配置 - AI开发平台ModelArts

示例值需要根据数据集的不同，选择其一。 GeneralPretrainHandler：使用预训练的alpaca数据集。 GeneralInstructionHandler：使用微调的alpaca数据集。 MOSSMultiTurnHandler：使用微调的moss数据集。 MBS 4 表示流水线并行中一个micro

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

示例值需要根据数据集的不同，选择其一。 GeneralPretrainHandler：使用预训练的alpaca数据集。 GeneralInstructionHandler：使用微调的alpaca数据集。 MOSSInstructionHandler：使用微调的moss数据集。 MBS 1 表示流水线并行中一个micro

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
查询数据集的统计信息 - AI开发平台ModelArts

@modelarts:from_type String 内置属性：三元组关系标签的起始实体类型，创建关系标签时必须指定，该参数仅文本三元组数据集使用。 @modelarts:rename_to String 内置属性：重命名后的标签名。 @modelarts:shortcut String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询团队标注任务统计信息 - AI开发平台ModelArts

@modelarts:from_type String 内置属性：三元组关系标签的起始实体类型，创建关系标签时必须指定，该参数仅文本三元组数据集使用。 @modelarts:rename_to String 内置属性：重命名后的标签名。 @modelarts:shortcut String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
训练启动脚本说明和参数配置 - AI开发平台ModelArts

示例值需要根据数据集的不同，选择其一。 GeneralPretrainHandler：使用预训练的alpaca数据集。 GeneralInstructionHandler：使用微调的alpaca数据集。 MOSSInstructionHandler：使用微调的moss数据集。 MBS 1 表示流水线并行中一个micro

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 训练脚本说明
创建Notebook失败，查看事件显示JupyterProcessKilled - AI开发平台ModelArts

创建Notebook失败，查看事件显示JupyterProcessKilled 问题现象创建Notebook失败，查看事件显示JupyterProcessKilled。图1 查看事件原因分析出现此故障是因为Jupyter进程被清理掉了，一般情况Notebook会自动重启的

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
报错“An SSH installation couldn't be found”或者“Could not establish connection to instance xxx: 'ssh' ...”如何解决？ - AI开发平台ModelArts

rule name=sshd dir=in action=allow protocol=TCP localport=22 启动OpenSSH服务，在CMD执行以下命令： Start-Service sshd 若OpenSSH未安装在默认路径下，打开命令面板（Windows： Ct

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
管理标注作业 - AI开发平台ModelArts

文件名或目录：根据文件名称或者文件存储目录筛选。标注人：选择执行标注操作的账号名称。样本属性：表示自动分组生成的属性。只有启用了自动分组任务后才可使用此筛选条件。数据属性：暂不支持。图2 筛选条件父主题：标注ModelArts数据集中的数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据
管理团队和团队成员 - AI开发平台ModelArts

“角色”支持“Labeler”、“Reviewer”和“Team Manager”，“Team Manager”只能设置为一个人。删除团队当已有的团队不再使用，您可以执行删除操作。在“标注团队”管理页面中，选中需删除的团队，然后单击“删除”。在弹出的对话框中，确认信息无误后，单击“确定”完成团队删除。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
引言 - AI开发平台ModelArts
引言 - AI开发平台ModelArts

引言训练精度问题是多种因素共同作用的结果，主要表现是训练过程的Loss不收敛、Loss收敛不符合预期或者Loss收敛趋势符合预期，但是模型评测结果表现不佳。影响模型Loss收敛的原因是多方面的：首先，数据问题可能导致不收敛，例如数据预处理不完善；其次，模型的训练超参数也同样会

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
精度校验 - AI开发平台ModelArts
精度校验 - AI开发平台ModelArts

精度校验迁移之后的精度校验工作是以CPU/GPU环境训练过程作为标杆的，这里的前提是在迁移前，模型已经在CPU/GPU环境达到预期训练结果。在此基础上，迁移过程的精度问题一般包括： Loss曲线与CPU/GPU差异不符合预期。验证准确度与CPU/GPU差异不符合预期。在迁移

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
更新管理 - AI开发平台ModelArts
更新管理 - AI开发平台ModelArts

更新管理 ModelArts在线服务更新对于已部署的推理服务，ModelArts支持通过更换AI应用的版本号，实现服务升级。推理服务有三种升级模式：全量升级、滚动升级（扩实例）和滚动升级（缩实例）。了解三种升级模式的流程，请参见图1。全量升级需要额外的双倍的资源，先全量创建新版本实例，然后再下线旧版本实例。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
LoRA微调训练 - AI开发平台ModelArts

由于模型中LoRA微调训练存在已知的精度问题，因此不支持TP(tensor model parallel size)张量模型并行策略，推荐使用PP(pipeline model parallel size)流水线模型并行策略，具体详细参数配置如表2所示。 Step3 启动训练脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907）
查询用户镜像组列表 - AI开发平台ModelArts

DEDICATED：用户保存的镜像。 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。请求参数无响应参数状态码： 200 表3 响应Body参数参数参数类型描述 current Integer

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

代码包名称代码说明下载地址 AscendCloud-6.3.906-xxx.zip 说明：软件包名称中的xxx表示时间戳。包含了本教程中使用到的模型训练代码、推理部署代码和推理评测代码。代码包具体说明请参见模型软件包结构说明。 AscendSpeed是用于模型并行计算的框架，其中包含了许多模型的输入处理方法。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 准备工作
创建和管理团队 - AI开发平台ModelArts

M用户ID”、“角色”、“描述”，单击左下角“添加账号ID”。填写完成之后，然后单击“确定”。邮箱作为团队管理中的唯一标识，不同成员不能使用同一个邮箱。您填写的邮箱地址将被记录并保存在ModelArts中，仅用于ModelArts团队标注功能，当成员删除后，其填写的邮箱信息也将被一并删除。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
查看授权列表 - AI开发平台ModelArts

当user_id为all时，表示对所有IAM子用户进行授权，如果已有部分用户已授权，则更新授权。仅当授权类型为委托时，需要该字段。 type String 授权类型。推荐使用委托方式。可选值： agency：委托 credential：访问密钥（AK/SK） content String 授权内容。当授权类型是委托，该字段为委托名称。

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
工具介绍及准备工作 - AI开发平台ModelArts

k目录下，包含训练性能测试和训练精度测试脚本。代码目录如下: benchmark ├── config # 默认的配置，使用前根据实际情况修改数据集路径dataset_dir、权重路径model_name_or_path ├── deepspeed

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
训练性能测试 - AI开发平台ModelArts

yaml相对或绝对路径，此配置文件为训练最优配置参数。 --baseline <baseline>：<可选>GP-Ant8机器性能基线yaml文件路径，用户可自行修改，不填则使用工具自带基线配置，默认基线配置样例如下： --o <output_dir>： <可选>任务完成输出excel表格路径，默认为"./"当前所在路径。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
Standard资源池节点故障定位 - AI开发平台ModelArts

Bit Isolated Pages Count值大于等于64。 A050146 Runtime 其他 ntp异常。 ntpd或者chronyd服务异常。 A050202 Runtime 其他节点NotReady。节点不可达，k8sNode存在以下污点之一： node.kubernetes

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池

总条数： 2472

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

查询数据集的统计信息 - AI开发平台ModelArts

查询团队标注任务统计信息 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

创建Notebook失败，查看事件显示JupyterProcessKilled - AI开发平台ModelArts

报错“An SSH installation couldn't be found”或者“Could not establish connection to instance xxx: 'ssh' ...”如何解决？ - AI开发平台ModelArts

管理标注作业 - AI开发平台ModelArts

管理团队和团队成员 - AI开发平台ModelArts

引言 - AI开发平台ModelArts

精度校验 - AI开发平台ModelArts

更新管理 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

查询用户镜像组列表 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

创建和管理团队 - AI开发平台ModelArts

查看授权列表 - AI开发平台ModelArts

工具介绍及准备工作 - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

Standard资源池节点故障定位 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线