搜索_华为云

模型训练使用流程 - AI开发平台ModelArts

业的参数设置，训练作业事件等。查看训练作业日志训练日志用于记录训练作业运行过程和异常信息，可以通过查看训练作业日志定位作业运行中出现的问题。表2 训练作业的创建方式介绍创建方式适用场景使用预置框架创建训练作业如果您已在本地使用一些常用框架完成算法开发，您可以选择常用框架，创建训练作业来构建模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
VS Code一键连接Notebook - AI开发平台ModelArts

对当前代码进行打断点，即在代码左侧进行单击，就会出现小红点。此时，即可按照正常的代码调试步骤对代码调试，在界面左边会显示debug信息，代码上方有相应的调试步骤。常见问题在ModelArts控制台界面上单击VS Code接入并在新界面单击打开，未弹出VS Code窗口远程连接出现弹窗报错：Could not

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
MaaS使用场景和使用流程 - AI开发平台ModelArts

时间与资源损耗，确保进展与收益。大模型应用开发，帮助开发者快速构建智能Agents 在企业中，项目级复杂任务通常需要理解任务并拆解成多个问题再进行决策，然后调用多个子系统去执行。MaaS基于多个优质昇腾云开源大模型，提供优质Prompt模板，让大模型准确理解业务意图，分解复杂任

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
安全边界 - AI开发平台ModelArts
安全边界 - AI开发平台ModelArts

准入校验机制，保证制品源头的安全性权限配置和凭证下发权限最小化 AI应用运行时（自定义镜像，OBS模型和依赖）的安全性及时更新修复安全问题凭证等敏感数据的安全存储推理部署安全最佳实践外部依赖服务 ModelArts推理使用中需要用到一些其他的云服务，当您需要授权时，可以

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
VS Code ToolKit连接Notebook - AI开发平台ModelArts

会显示debug信息，代码上方有相应的调试步骤。相关操作卸载VS Code插件操作如图15所示。图15 卸载VS Code插件常见问题报错“Permissions for 'x:/xxx.pem' are too open”如何解决？报错“ssh: connect to

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
准备镜像环境 - AI开发平台ModelArts

指在容器中请求的最小CPU核心数量，可使用Requests中的值，例如2650m。 ${requests_memory} 指在容器中请求的最小内存空间大小，可使用Requests中的值，例如3200Mi。 ${limits_cpu} 指在容器中可使用的最大CPU核心数量，例如192。 ${limits_memory}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.911） > 准备工作
准备镜像环境 - AI开发平台ModelArts

指在容器中请求的最小CPU核心数量，可使用Requests中的值，例如2650m。 ${requests_memory} 指在容器中请求的最小内存空间大小，可使用Requests中的值，例如3200Mi。 ${limits_cpu} 指在容器中可使用的最大CPU核心数量，例如192。 ${limits_memory}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.910） > 准备工作
准备镜像环境 - AI开发平台ModelArts

指在容器中请求的最小CPU核心数量，可使用Requests中的值，例如2650m。 ${requests_memory} 指在容器中请求的最小内存空间大小，可使用Requests中的值，例如3200Mi。 ${limits_cpu} 指在容器中可使用的最大CPU核心数量，例如192。 ${limits_memory}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） > 准备工作
推理精度测试 - AI开发平台ModelArts

里是ppl的配置项。由于离线执行推理，消耗的显存相当庞大。其中以下参数需要根据实际来调整。 batch_size, 推理时传入的 prompts 数量，可配合后面的参数适当减少 offline，是否启动离线模型，使用 ppl 时必须为 True tp_size，使用推理的卡数 max_s

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
推理精度测试 - AI开发平台ModelArts

里是ppl的配置项。由于离线执行推理，消耗的显存相当庞大。其中以下参数需要根据实际来调整。 batch_size, 推理时传入的 prompts 数量，可配合后面的参数适当减少 offline，是否启动离线模型，使用 ppl 时必须为 True tp_size，使用推理的卡数 max_s

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。获取模型权重文件表2 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
推理精度测试 - AI开发平台ModelArts

里是ppl的配置项。由于离线执行推理，消耗的显存相当庞大。其中以下参数需要根据实际来调整。 batch_size, 推理时传入的 prompts 数量，可配合后面的参数适当减少 offline，是否启动离线模型，使用 ppl 时必须为 True tp_size，使用推理的卡数 max_s

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）
推理精度测试 - AI开发平台ModelArts

里是ppl的配置项。由于离线执行推理，消耗的显存相当庞大。其中以下参数需要根据实际来调整。 batch_size，推理时传入的prompts数量，可配合后面的参数适当减少 offline，是否启动离线模型，使用ppl时必须为True tp_size，使用推理的卡数 max_seq_

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909）
推理精度测试 - AI开发平台ModelArts

里是ppl的配置项。由于离线执行推理，消耗的显存相当庞大。其中以下参数需要根据实际来调整。 batch_size, 推理时传入的 prompts 数量，可配合后面的参数适当减少 offline，是否启动离线模型，使用 ppl 时必须为 True tp_size，使用推理的卡数 max_s

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
查询训练作业列表 - AI开发平台ModelArts

task_statuses Array of TaskStatuses objects 训练在子任务状态信息。 running_records Array of RunningRecord objects 训练作业运行及故障恢复记录。表8 TaskStatuses 参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

Speed; sh ./scripts/llama2/0_pl_pretrain_13b.sh 创建训练作业时，可开启自动重启功能。当环境问题导致训练作业异常时，系统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907）
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

Speed; sh ./scripts/llama2/0_pl_pretrain_13b.sh 创建训练作业时，可开启自动重启功能。当环境问题导致训练作业异常时，系统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908）
LoRA微调训练 - AI开发平台ModelArts

cendSpeed; sh ./scripts/llama2/0_pl_lora_13b.sh 创建训练作业时，可开启自动重启功能。当环境问题导致训练作业异常时，系统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.911）
准备预测分析数据 - AI开发平台ModelArts

密导致后期的训练失败。创建数据集数据准备完成后，需要创建相应项目支持的类型的数据集，具体操作请参考创建ModelArts数据集。常见问题使用从OBS选择的数据创建表格数据集如何处理Schema信息？ Schema信息表示表格的列名和对应类型，需要跟导入数据的列数保持一致。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现预测分析
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

Speed; sh ./scripts/llama2/0_pl_pretrain_13b.sh 创建训练作业时，可开启自动重启功能。当环境问题导致训练作业异常时，系统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.910）

总条数： 1603

上一页
1
...
75
76
77
...
81
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

模型训练使用流程 - AI开发平台ModelArts

VS Code一键连接Notebook - AI开发平台ModelArts

MaaS使用场景和使用流程 - AI开发平台ModelArts

安全边界 - AI开发平台ModelArts

VS Code ToolKit连接Notebook - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

准备预测分析数据 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线