搜索_华为云

附录：大模型推理常见问题 - AI开发平台ModelArts

is not completed，见图2。再次设置输入输出的token和小于max_model_len访问推理服务，服务端响应200，见图3。客户端仍返回报错Response payload is not completed，见图4。图2 服务端返回报错Response payload

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
创建数据集 - AI开发平台ModelArts

表2 数据集输入位置，用于将此目录及子目录下的源数据(如图片/文件/音频等)同步到数据集。对于表格数据集，该参数为导入目录。表格数据集的工作目录不支持为KMS加密桶下的OBS路径。 work_path 是表6 数据集输出位置，用于存放输出的标注信息等文件。 labels 否 List

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
Ascend-vLLM推理常见问题 - AI开发平台ModelArts

is not completed，见图2。再次设置输入输出的token和小于max_model_len访问推理服务，服务端响应200，见图3。客户端仍返回报错Response payload is not completed，见图4。图2 服务端返回报错Response payload

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 附录
上传数据和算法至OBS（首次使用时需要） - AI开发平台ModelArts

Browser+（win）、obsutil（linux）。上述例子为obsutil使用方法。准备算法 main.py文件内容如下，并将其上传至OBS桶的demo文件夹中： import argparse import os import random import shutil import

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
创建和管理团队 - AI开发平台ModelArts

在“标注团队”管理页面，单击“添加团队”。在弹出的“添加团队”对话框中，填写团队“名称”和“描述”，然后单击“确定”。完成标注团队的添加。团队添加完成后，“标注团队”管理页面呈现新添加的团队，在页面右侧区域，可以查看团队详情。新添加的团队，其成员列表为空，请参考添加成员操作，为您的团队添加成员。添加成员

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
日志提示“No space left on device” - AI开发平台ModelArts

训练过程中复制数据/代码/模型时出现如下报错：图1 错误日志原因分析出现该问题的可能原因如下。磁盘空间不足。分布式作业时，有些节点的docker base size配置未生效，容器内“/”根目录空间未达到50G，只有默认的10GB，导致作业训练失败。实际存储空间足够，却依旧报错“No

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
人工标注文本数据 - AI开发平台ModelArts

在“未标注”页签添加：单击页面中标签集右侧的加号，然后在弹出的“新增标签”页中，添加标签名称，选择标签颜色，单击“确定”完成标签的新增。图5 添加标签（1）在“已标注”页签添加：单击页面中标签集右侧的加号，然后在弹出的“新增标签”页中，添加标签名称，选择标签颜色，单击“确定”完成标签的新增。图6 添加标签（2）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
创建图像分类数据集并进行标注任务 - AI开发平台ModelArts

调用创建数据集接口创建一个图像分类类型的数据集。调用查询数据集详情接口根据数据集ID查询数据集的详情。调用查询样本列表接口根据数据集ID获取数据集的样本详情。调用批量更新样本标签接口根据数据集ID和样本ID给样本添加标签进行人工标注。调用查询数据集的统计信息接口查看数据集的标注统计信息。

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
ModelArts权限管理基本概念 - AI开发平台ModelArts

ModelArts的功能都需经过授权，可以更精确的控制子账号的权限范围，达成权限最小化的安全策略。用工作空间限制资源访问工作空间是ModelArts面向企业用户提供的一个高阶功能，用于进一步将用户的资源划分在多个逻辑隔离的空间中，并支持以空间维度进行访问的权限限定。目前工作空

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理
yaml配置文件参数配置说明 - AI开发平台ModelArts

用于指定预处理数据的工作线程数。随着线程数的增加，预处理的速度也会提高，但也会增加内存的使用。 per_device_train_batch_size 1 必须修改，指定每个设备的训练批次大小。 gradient_accumulation_steps 8 指定梯度累积的步数,这可以增加批次大小而不增加内存消耗。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
解析Manifest文件 - AI开发平台ModelArts

<=1，表示机器标注的置信度。 creation_time String 创建该标注的时间。是用户写入标注的时间，不是Manifest生成时间。 annotated_by String 标注人。 annotation_format String 描述标注文件的格式。默认为“PASCAL

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
Llama 3.2-Vision基于Lite Server适配Pytorch NPU训练微调指导（6.3.912） - AI开发平台ModelArts

每张卡上的批次大小。以单机结果为例，训练成功如下图所示。图1 sft全参微调训练成功图2 lora微调训练成功附：loss曲线 loss结果 sft全参微调NPU训练结果loss收敛且趋势与GPU训练loss一致图3 sft全参微调单机loss曲线对比结果图4 sft全参微调双机loss曲线对比结果

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
Lite Cluster资源配置流程 - AI开发平台ModelArts

单击需要登录的节点名称，跳转至弹性云服务器页面。图2 节点管理绑定弹性公网IP。若已有未绑定的弹性公网IP，直接选择即可。如果没有可用的弹性公网IP，需要先购买弹性公网IP。图3 弹性公网IP 单击“购买弹性公网IP”，进入购买页。图4 绑定弹性公网IP 图5 购买弹性公网IP

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
模型训练存储加速 - AI开发平台ModelArts

加载带来的I/O挑战，华为云提供了基于对象存储服务OBS+高性能弹性文件服务SFS Turbo的AI云存储解决方案，如下图所示。 SFS Turbo HPC型支持和OBS数据联动，您可以通过SFS Turbo HPC型文件系统来加速对OBS对象存储中的数据访问，并将生成的结果数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
执行训练任务【新】 - AI开发平台ModelArts

Turbo文件系统。云上挂载路径：输入镜像容器中的工作路径 /home/ma-user/work/ 存储位置：输入用户的“子目录挂载”路径。如果默认没有填写，则忽略。图6 选择SFS Turbo 作业日志选择OBS中的路径，ModelArts的训练作业的日志信息则保存该路径下。最后，请参

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

ion的block大小，推荐设置为128。 --host=${docker_ip}：服务部署的IP，${docker_ip}替换为宿主机实际的IP地址。 --port：服务部署的端口。 --gpu-memory-utilization：NPU使用的显存比例，复用原vLLM的入参名称，默认为0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

机器学习从有限的观测数据中学习一般性的规律，并利用这些规律对未知的数据进行预测。为了获取更准确的预测结果，用户需要选择一个合适的算法来训练模型。针对不同的场景，ModelArts提供大量的算法样例。以下章节提供了关于业务场景、算法学习方式、算法实现方式的指导。选择算法的实现方式 M

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
SFT全参微调训练 - AI开发平台ModelArts

分别单击“输入”和“输出”的数据存储位置，如图所示，选择OBS桶中指定的目录。ORIGINAL_TRAIN_DATA_PATH中则直接选中数据集文件。 “输入”和“输出”中的获取方式全部选择为：环境变量。 “输出”中的预下载至本地目标选择：下载，此时输出路径中的数据则会下载至OBS中。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
精度问题概述 - AI开发平台ModelArts

Precision等）,则是由于浮点数计算过程的有限字长效应及计算序所带来的近似误差，包括各种计算的数学表达，都会带来结果的近似性。二者是完全不同的两个问题，不能混为一谈。计算数值的近似性一定概率上会影响模型的收敛性，但是影响大模型收敛的原因是复杂且多样的，大模型本身也对计算差异有一定韧性，所

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
Notebook使用场景 - AI开发平台ModelArts

ok。在AI开发过程中，如何将文件方便快速地上传到Notebook几乎是每个开发者都会遇到的问题。ModelArts提供了多种文件上传方式，在文件上传过程中，可以查看上传进度和速度。将本地文件上传，请参考支持上传本地文件； GitHub的开源仓库的文件上传，请参考支持Clone

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试

总条数： 857

上一页
1
...
38
39
40
...
43
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

附录：大模型推理常见问题 - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

Ascend-vLLM推理常见问题 - AI开发平台ModelArts

上传数据和算法至OBS（首次使用时需要） - AI开发平台ModelArts

创建和管理团队 - AI开发平台ModelArts

日志提示“No space left on device” - AI开发平台ModelArts

人工标注文本数据 - AI开发平台ModelArts

创建图像分类数据集并进行标注任务 - AI开发平台ModelArts

ModelArts权限管理基本概念 - AI开发平台ModelArts

yaml配置文件参数配置说明 - AI开发平台ModelArts

解析Manifest文件 - AI开发平台ModelArts

Llama 3.2-Vision基于Lite Server适配Pytorch NPU训练微调指导（6.3.912） - AI开发平台ModelArts

Lite Cluster资源配置流程 - AI开发平台ModelArts

模型训练存储加速 - AI开发平台ModelArts

执行训练任务【新】 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

精度问题概述 - AI开发平台ModelArts

Notebook使用场景 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线