搜索_华为云

LoRA微调训练 - AI开发平台ModelArts

Step1 上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件和数据集到容器中，可以忽略此步骤。如果未上传训练权重文件和数据集到容器中，具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。如果想详细

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备AscendSpeed训练代码、分词器Tokenizer和推理代码。准备数据准备训练数据，可以用Alpaca数据集，也可以使用自己准备的数据集。准备镜像准备训练模型适用的容器镜像。预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、训练任务、断点续训及性能查看。微调训练 SFT全参微调

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

--port：服务部署的端口8080。 --max-model-len：最大数据输入+输出长度，不能超过模型配置文件config.json里面定义的“max_position_embeddings”和“seq_length”；如果设置过大，会占用过多显存，影响kvcache的空间。不同模型推理支持的max-model

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|── data # 预处理后数据 |── pretrain # 预训练加载的数据 |── finetune # 微调加载的数据 |──converted_weights #

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
创建图像分类数据集并进行标注任务 - AI开发平台ModelArts

调用创建数据集接口创建一个图像分类类型的数据集。调用查询数据集详情接口根据数据集ID查询数据集的详情。调用查询样本列表接口根据数据集ID获取数据集的样本详情。调用批量更新样本标签接口根据数据集ID和样本ID给样本添加标签进行人工标注。调用查询数据集的统计信息接口查看数据集的标注统计信息。

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
推理精度测试 - AI开发平台ModelArts

mmlu_subject_mapping.json # mmlu数据集学科信息 │ ├── ceval_subject_mapping.json # ceval数据集学科信息 ├── evaluators │ ├── evaluator.py # 数据集数据预处理方法集 │ ├── chatglm

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
获取智能任务的信息 - AI开发平台ModelArts

1：置信度偏低。 2：基于训练数据集的聚类结果和预测结果不一致。 3：预测结果和训练集同类别数据差异较大。 4：连续多张相似图片的预测结果不一致。 5：图像的分辨率与训练数据集的特征分布存在较大偏移。 6：图像的高宽比与训练数据集的特征分布存在较大偏移。 7：图像的亮度与训练数据集的特征分布存在较大偏移。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用ma-cli obs-copy命令复制OBS数据 - AI开发平台ModelArts

使用ma-cli obs-copy命令复制OBS数据使用ma-cli obs-copy [SRC] [DST]可以实现本地和OBS文件或文件夹的相互复制。 $ma-cli obs-copy -h Usage: ma-cli obs-copy [OPTIONS ] SRC

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备AscendSpeed训练代码、分词器Tokenizer和推理代码。准备数据准备训练数据，可以用Alpaca数据集，也可以使用自己准备的数据集。准备镜像准备训练模型适用的容器镜像。预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、训练任务、断点续训及性能查看。微调训练 SFT全参微调

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904）
ModelArts Standard准备工作 - AI开发平台ModelArts

ModelArts Standard准备工作配置ModelArts Standard访问授权创建并管理工作空间创建OBS桶用于ModelArts存储数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
使用大模型在ModelArts Standard创建AI应用部署在线服务 - AI开发平台ModelArts

服务部署时，默认情况下，动态加载的模型包位于临时磁盘空间，服务停止时已加载的文件会被删除，再次启动时需要重新加载。为了避免反复加载，平台允许使用资源池节点的本地存储空间来加载模型包，并在服务停止和重启时仍有效（通过哈希值保证数据一致性）使用大模型要求用户采用自定义引擎，并开启动

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
LoRA微调训练 - AI开发平台ModelArts

LoRA微调数据处理训练前需要对数据集进行预处理，转化为.bin和.idx格式文件，以满足训练要求。 LoRA微调训练与SFT微调使用同一个数据集，如果已经在SFT微调时处理过数据，可以直接使用，无需重复处理。如果未处理过数据，请参见SFT全参微调数据处理章节先处理数据。 Step2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904）
查询模型对象列表 - AI开发平台ModelArts

String 工作空间ID，默认为“0”。表2 get_model_list打印参数说明参数参数类型描述 total_count Integer 不分页的情况下，符合查询条件的总模型数量。 count Integer 模型数量。 models model结构数组模型元数据信息。表3

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
准备Notebook - AI开发平台ModelArts

Turbo挂载盘的形式创建，因此需要将上述数据集、代码、权重文件从OBS桶上传至SFS Turbo中。用户需要创建开发环境Notebook，并绑定SFS Turbo，以便能够通过Notebook访问SFS Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
LoRA微调训练 - AI开发平台ModelArts

步骤1 上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件和数据集到容器中，可以忽略此步骤。如果未上传训练权重文件和数据集到容器中，具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。如果想详细

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）
预训练任务 - AI开发平台ModelArts

Step1 上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件和数据集到容器中，可以忽略此步骤。如果未上传训练权重文件和数据集到容器中，具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。如果想详细

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）
创建预测分析自动学习项目时，对训练数据有什么要求？ - AI开发平台ModelArts

训练数据：训练数据列数一致，总数据量不少于100条不同数据（有一个特征取值不同，即视为不同数据）。训练数据列内容不能有时间戳格式（如：yy-mm-dd、yyyy-mm-dd等）的数据。如果某一列的取值只有一种，会被视为无效列。请确保标签列的取值至少有两个且无数据缺失。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 准备数据
预训练任务 - AI开发平台ModelArts

步骤1 上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件和数据集到容器中，可以忽略此步骤。如果未上传训练权重文件和数据集到容器中，具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。如果想详细

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）
AI Gallery功能介绍 - AI开发平台ModelArts

Gallery功能介绍面向开发者提供了AI Gallery大模型开源社区，通过大模型为用户提供服务，普及大模型行业。AI Gallery提供了大量基于昇腾云底座适配的三方开源大模型，同步提供了可以快速体验模型的能力、极致的开发体验，助力开发者快速了解并学习大模型。构建零门槛线上模型体验，零基础开

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
LoRA微调训练 - AI开发平台ModelArts

LoRA微调数据处理训练前需要对数据集进行预处理，转化为.bin和.idx格式文件，以满足训练要求。 LoRA微调训练与SFT微调使用同一个数据集，如果已经在SFT微调时处理过数据，可以直接使用，无需重复处理。如果未处理过数据，请参见SFT全参微调数据处理章节先处理数据。 Step2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904）

总条数： 1254

上一页
1
...
16
17
18
...
63
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

LoRA微调训练 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

创建图像分类数据集并进行标注任务 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

获取智能任务的信息 - AI开发平台ModelArts

使用ma-cli obs-copy命令复制OBS数据 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

ModelArts Standard准备工作 - AI开发平台ModelArts

使用大模型在ModelArts Standard创建AI应用部署在线服务 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

查询模型对象列表 - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

创建预测分析自动学习项目时，对训练数据有什么要求？ - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

AI Gallery功能介绍 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线