搜索_华为云

主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912）场景介绍准备工作执行训练任务查看日志和性能训练脚本说明参考常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

准备工作准备环境准备代码准备数据准备镜像父主题：主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912）
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

准备工作准备资源准备数据准备权重准备代码准备镜像父主题：主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912）
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

准备镜像镜像方案说明 ECS获取和上传基础镜像使用基础镜像 ECS中构建新镜像父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练启动脚本说明和参数配置【旧】训练tokenizer文件说明断点续训和故障快恢说明父主题：主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912）
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

准备工作准备环境准备代码准备镜像环境 DockerFile构建镜像（可选）准备数据（可选）父主题：主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912）
训练脚本说明参考 - AI开发平台ModelArts

训练脚本说明参考训练参数配置说明【旧】训练tokenizer文件说明断点续训和故障快恢说明父主题：主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912）
常见错误原因和解决方法 - AI开发平台ModelArts

常见错误原因和解决方法显存溢出错误网卡名称错误工作负载Pod异常 mc2融合算子报错父主题：主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912）
执行训练任务 - AI开发平台ModelArts

执行训练任务执行训练任务（推荐）执行训练任务（历史版本）父主题：主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）
监控Lite Server资源 - AI开发平台ModelArts

监控Lite Server资源使用CES监控Lite Server资源使用DCGM监控Lite Server资源父主题： Lite Server资源管理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

支持3条。 “部署类型” 选择此模型支持部署服务的类型，部署上线时只支持部署为此处选择的部署类型，例如此处只选择在线服务，那您导入后只能部署为在线服务。当前支持“在线服务”、“批量服务”和“边缘服务”。确认信息填写无误，单击“立即创建”，完成模型的创建。在模型列表中，您可以查

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
管理标注作业 - AI开发平台ModelArts

在标注任务复制的弹窗中，填写作业描述，作业名称task-xxxx-copy-xxxx，其中xxxx为系统生成的随机码，用来区分新作业与被复制作业。也可以修改新生成的作业名称。单击“确定”。复制完成后，在标注作业列表页即可查询新的标注任务，复制标注作业信息包含标注任务的样本、标签、团队标注信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据
ModelArts Standard资源监控概述 - AI开发平台ModelArts

Standard训练作业：用户在运行训练作业时，可以查看训练作业占用的CPU、GPU或NPU资源使用情况。具体请参见训练资源监控章节。 Standard在线服务：用户将模型部署为在线服务后，可以通过监控功能查看该推理服务的CPU、内存或GPU等资源使用统计信息和模型调用次数统计，具体参见查看推理服务详情章节。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

crictl image # nerdctl 工具查看 nerdctl --namespace k8s.io image list Step3 制作推理镜像获取模型软件包，并上传到机器SFS Turbo的目录下（可自定义路径），获取地址参考表1。解压AscendCloud压缩包及该

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 准备工作
构造请求 - AI开发平台ModelArts
构造请求 - AI开发平台ModelArts

API请求的组成，并以调用IAM服务的获取用户Token接口说明如何调用API，Token可以用于调用其他API时的鉴权。您还可以通过这个视频教程了解如何构造请求调用API：https://bbs.huaweicloud.com/videos/102987 。请求URI 请求URI由如下部分组成：

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
更新管理 - AI开发平台ModelArts
更新管理 - AI开发平台ModelArts

更新管理 ModelArts在线服务更新对于已部署的推理服务，ModelArts支持通过更换模型的版本号，实现服务升级。推理服务有三种升级模式：全量升级、滚动升级（扩实例）和滚动升级（缩实例）。了解三种升级模式的流程，请参见图1。全量升级需要额外的双倍的资源，先全量创建新版本实例，然后再下线旧版本实例。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
查询数据集导入任务的详情 - AI开发平台ModelArts

导入的OBS路径或manifest路径。导入manifest时，path必须精确到具体manifest文件。导入为目录时，目前仅支持数据集类型为图片分类、物体检测、文本分类、声音分类。 import_type Integer 导入方式。可选值如下： 0：目录导入 1：按manifest文件导入

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
按标签名称更新单个标签 - AI开发平台ModelArts

100：文本分类 101：命名实体 102：文本三元组关系标签 103：文本三元组实体标签 200：语音分类 201：语音内容 202：语音分割 600：视频标注请求参数表3 请求Body参数参数是否必选参数类型描述 @modelarts:color 否 String 内置属性：标签

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

|-- VersionMame2 ... |-- ... 以视频标注为例，在数据集发布后，标注结果将标注结果文件（XML）存放在数据集输出目录下。 1 2 3 4 5 6 7 8 9 10

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
推理部署计费项 - AI开发平台ModelArts

规则。综上，在线服务的运行费用 = 计算资源费用（3.50 元） + 存储费用示例：使用专属资源池。计费项：存储费用假设用户于2023年4月1日10:00:00创建了一个使用专属资源池的在线服务，并在11:00:00停止运行。按照存储费用结算，那么运行这个在线服务的费用计算过程如下：

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项

总条数： 996

上一页
1
...
40
41
42
...
50
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

训练脚本说明参考 - AI开发平台ModelArts

常见错误原因和解决方法 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

监控Lite Server资源 - AI开发平台ModelArts

从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

管理标注作业 - AI开发平台ModelArts

ModelArts Standard资源监控概述 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

构造请求 - AI开发平台ModelArts

更新管理 - AI开发平台ModelArts

查询数据集导入任务的详情 - AI开发平台ModelArts

按标签名称更新单个标签 - AI开发平台ModelArts

发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

推理部署计费项 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线