搜索_华为云

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

表1 NPU卡数、加速框架、梯度配置取值表模型 Template 模型参数量训练策略类型序列长度cutoff_len 梯度累积值优化工具(Deepspeed) 规格与节点数 llama2 llama2 7B lora 4096/8192 gradient_accumulation_steps:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
VS Code连接开发环境失败常见问题 - AI开发平台ModelArts

VS Code自动升级后，导致远程连接时间过长使用SSH连接，报错“Connection reset”如何解决？使用MobaXterm工具SSH连接Notebook后，经常断开或卡顿，如何解决？ VS Code连接开发环境时报错Missing GLIBC，Missing required

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

在创建OBS桶创建的桶下创建文件夹用以存放数据，例如在桶standard-llama2-13b中创建文件夹training_data。利用OBS Browser+工具将步骤1下载的数据集上传至步骤2创建的文件夹目录下。得到OBS下数据集结构： obs://<bucket_name>/training_data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

在创建OBS桶创建的桶下创建文件夹用以存放数据，例如在桶standard-llama2-13b中创建文件夹training_data。利用OBS Browser+工具将步骤1下载的数据集上传至步骤2创建的文件夹目录下。得到OBS下数据集结构： obs://<bucket_name>/training_data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
解析Manifest文件 - AI开发平台ModelArts

标注属性请见表4。 usage String 用途，可选值为TRAIN、EVAL、TEST、INFERENCE。指明该对象用于训练、评估、测试、推理，如果没有给出该字段，则使用者自行决定如何使用该对象。 inference_loc String 当此Manifest文件由推理服务

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
Standard模型训练 - AI开发平台ModelArts

提供训练作业的事件信息（训练作业生命周期中的关键事件点）、训练日志（训练作业运行过程和异常信息）、资源监控（资源使用率数据）、Cloud Shell（登录训练容器的工具）等能力，方便用户更清楚得了解训练作业运行过程，并在遇到任务异常时更加准确的排查定位问题父主题： Standard功能介绍

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

在创建OBS桶创建的桶下创建文件夹用以存放数据，例如在桶standard-llama2-13b中创建文件夹training_data。利用OBS Browser+工具将步骤1下载的数据集上传至步骤2创建的文件夹目录下。得到OBS下数据集结构： obs://<bucket_name>/training_data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
自动学习训练作业失败 - AI开发平台ModelArts

数据集文件有以下限制：如果您使用2u8g规格，测试建议数据集文件应小于10MB。当文件大小符合限制要求，如果存在极端的数据规模（行数列数之积）时，仍可能会导致训练失败，建议的数据规模低于10000。如果您使用8u32g规格，测试建议数据集文件应小于100MB。当文件大小符合限

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 模型训练
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

部署推理服务在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。若需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。在推理生产环境中部署推理服务介绍如何在创建AI应用

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
在线服务处于运行中状态时，如何填写推理请求的request header和request body - AI开发平台ModelArts

服务的APP的AppCode。 APP签名认证需要在header的X-Sdk-Date和Authorization字段中填入通过sdk或者工具使用该在线服务绑定的APP的AppKey和AppSecret所生产的这两个字段的值，以完成对该请求的签名认证。具体指导参见链接：访问在线服务（APP认证）。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──llm_inference # 推理代码包 |──llm_tools # 推理工具代码上传至OBS 将llm_train文件上传至OBS中。结合准备数据、准备权重、准备代码，将数据集、原始权重、代码文件都上传至OBS后，OBS桶的目录结构如下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 准备工作
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

从0-1制作自定义镜像并创建AI应用 05 自动学习 ModelArts自动学习是帮助人们实现AI应用的低门槛、高灵活、零代码的定制化模型开发工具。自动学习简介自动学习功能介绍项目分类图像分类物体检测预测分析声音分类文本分类操作指导准备数据创建项目数据标注自动训练

 帮助中心 > AI开发平台ModelArts > 成长地图
（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

C:\Users\xxx>python --version Python *.*.* 检查是否已安装Python通用包管理工具pip。如果Python安装过程中没有安装通用包管理工具pip，则参见pip官网完成pip安装，推荐pip版本小于24.0。在本地环境执行命令pip --version，显示如下内容说明pip已安装。

帮助中心 > AI开发平台ModelArts > SDK参考
Notebook的自定义镜像制作方法 - AI开发平台ModelArts

考在ECS上构建自定义镜像并在Notebook中使用场景二：基于Notebook提供的预置镜像或第三方镜像，借助ModelArts命令行工具(ma-cli镜像构建命令介绍)制作和注册镜像，构建一个面向AI开发的自定义镜像。此场景Notebook作为制作镜像的平台。具体案例参考在

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
AI开发基本流程介绍 - AI开发平台ModelArts

一些常用的指标，如准确率、召回率、AUC等，能帮助您有效的评估，最终获得一个满意的模型。部署模型模型的开发训练，是基于之前的已有数据（有可能是测试数据），而在得到一个满意的模型之后，需要将其应用到正式的实际数据或新产生数据中，进行预测、评价、或以可视化和报表的形式把数据中的高价值信息

 帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

部署推理服务在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。若需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。在推理生产环境中部署推理服务介绍如何创建AI应用，部署模型并启动推理服务，在线预测服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
分离部署推理服务 - AI开发平台ModelArts

模式，全量节点和增量节点分别占用2张卡，一共使用4张卡。配置tools工具根目录环境变量使用AscendCloud-LLM发布版本进行推理，基于AscendCloud-LLM包的解压路径配置tool工具根目录环境变量： export LLM_TOOLS_PATH=${root

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
AIGC模型训练推理 - AI开发平台ModelArts

Open-Clip基于DevServer适配PyTorch NPU训练指导 moondream2基于DevServer适配PyTorch NPU推理指导 AIGC工具tailor使用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──llm_inference # 推理代码包 |──llm_tools # 推理工具下载代码之后需要修改llm_train/AscendSpeed/scripts/install.sh文件。具体为删除install.sh的第43行

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
Qwen-VL基于DevServer适配Pytorch NPU的Finetune训练指导(6.3.906) - AI开发平台ModelArts

loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。可以使用可视化工具TrainingLogParser查看loss收敛情况。 FAQ 问题：使用TrainingLogParser工具解析训练日志中loss数据，坐标栏空白，未显示数据走势曲线。解决方法：在解析工具页面右侧，单击日志文件名右边的设置图标，在弹出的窗口中修改Loss

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理

总条数： 401

上一页
1
...
15
16
17
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

VS Code连接开发环境失败常见问题 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

解析Manifest文件 - AI开发平台ModelArts

Standard模型训练 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

自动学习训练作业失败 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

在线服务处于运行中状态时，如何填写推理请求的request header和request body - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

Notebook的自定义镜像制作方法 - AI开发平台ModelArts

AI开发基本流程介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

AIGC模型训练推理 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的Finetune训练指导(6.3.906) - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线