搜索_华为云

日志提示“pandas.errors.ParserError: Error tokenizing data. C error: Expected .* fields” - AI开发平台ModelArts

field 原因分析 csv中文件的每一行的列数不相等。处理方法可以使用以下方法处理：校验csv文件，将多出字段的行删除。在代码中忽略错误行，参考如下： import pandas as pd pd.read_csv(filePath,error_bad_lines=False)

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
权限管理 - AI开发平台ModelArts
权限管理 - AI开发平台ModelArts

任务时打开了“消息通知”，该功能依赖SMN委托授权，但只有训练任务运行过程中，真正需要发送消息时，系统才会“出错”，而有些错误系统会选择“忽略”，另一些错误则可能导致任务直接失败。当您做深入的“权限最小化”限制时，请确保您在ModelArts上将要执行的操作仍旧有足够的权限。严格授权模式

 帮助中心 > AI开发平台ModelArts > 产品介绍
第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

/home/ma-user -m -u 1000 -g 100 -s /bin/bash ma-user 通过增加nginx代理，支持https协议。协议转换为https之后，对外暴露的端口从tfserving的8501变为8080。 Dockerfile中执行如下命令完成nginx的安装和配置。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
准备数据（可选） - AI开发平台ModelArts

准备数据（可选）此小节为自定义数据集执行过程，如非自定义数据集此小节忽略。本教程使用到的是LLamaFactory代码包自带数据集。您也可以自行准备数据集，目前支持alpaca格式和sharegpt格式的微调数据集；使用自定义数据集时，请更新代码目录下data/dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 准备工作
发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

类”类型数据集支持进行数据切分功能。默认不启用。启用后，需设置对应的训练验证比例。输入“训练集比例”，数值只能是0~1区间内的数。设置好“训练集比例”后，“验证集比例”自动填充。“训练集比例”加“验证集比例”等于1。说明：为确保训练模型的精度，建议将训练集比例设置为0.8或者0

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
执行微调训练任务 - AI开发平台ModelArts

执行微调训练任务 Step1 上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件、自定义数据集，可以忽略此步骤。未上传训练权重文件，具体参考上传代码和权重文件到工作环境。使用自定义数据集训练未上传自定义数据集。具体参考上传自定义数据到指定目录章节并更新dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
准备数据（可选） - AI开发平台ModelArts

准备数据（可选）此小节为自定义数据集执行过程，如非自定义数据集此小节忽略。本教程使用到的是LLamaFactory代码包自带数据集。您也可以自行准备数据集，目前指令微调数据集支持alpaca格式和sharegpt格式的数据集；使用自定义数据集时，请更新代码目录下data/dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 准备工作
指令监督微调训练任务 - AI开发平台ModelArts

指令监督微调训练任务 Step1 上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件、自定义数据集，可以忽略此步骤。未上传训练权重文件，具体参考上传代码和权重文件到工作环境。使用自定义数据集训练未上传自定义数据集。具体参考上传自定义数据到指定目录章节并更新dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
准备数据（可选） - AI开发平台ModelArts

准备数据（可选）此小节为自定义数据集执行过程，如非自定义数据集此小节忽略。本教程使用到的是LLamaFactory代码包自带数据集。您也可以自行准备数据集，目前支持alpaca格式和sharegpt格式的微调数据集；使用自定义数据集时，请更新代码目录下data/dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 准备工作
执行训练任务 - AI开发平台ModelArts

glm4-9b，参考glm4-9b模型修改文件内容。 qwen2_vl系列，数据集为多模态数据集，若前面步骤已配置请忽略。具体配置如下：数据集dataset配置： dataset: mllm_demo,identity 否，忽略此步骤，执行下一步。如需其他配置参数，可参考表1按照实际需求修改。步骤三启动训练脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
语言模型推理性能测试 - AI开发平台ModelArts

requirements.txt # 第三方依赖目前性能测试已经支持投机推理能力。静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在步骤四制作推理镜像步骤中已经上传过AscendCloud-LLM-x.x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理性能测试
创建Workflow数据集版本发布节点 - AI开发平台ModelArts

Data"。否 str train_evaluate_sample_ratio 训练-验证集比例，默认值为"1.00"。取值范围为0-1.00，例如"0.8"表示训练集比例为80%，验证集比例为20%。否 str或者Placeholder clear_hard_property

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
自定义引擎创建模型规范 - AI开发平台ModelArts

自定义引擎的规范可以在安装有docker的本地机器上通过以下步骤提前验证：将自定义引擎镜像下载至本地机器，假设镜像名为custom_engine:v1。将模型包文件夹复制到本地机器，假设模型包文件夹名字为model。在模型包文件夹的同级目录下验证如下命令拉起服务： docker run --user

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建AI应用规范参考
推理性能测试 - AI开发平台ModelArts

requirements.txt # 第三方依赖目前性能测试还不支持投机推理能力。静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在Step4 制作推理镜像步骤中已经上传过AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
通过APP认证的方式访问在线服务 - AI开发平台ModelArts

“{在线服务的调用地址}/predictions/poetry”。如果是部署SD WebUI推理服务，调用地址后需添加"/"。如：“https://8e******5fe.apig.******.huaweicloudapis.com/v1/infers/f2682******f42/”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将AI应用部署为实时推理作业 > 访问在线服务支持的认证方式
GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败 - AI开发平台ModelArts

dpkg -l | grep nvidia-fabricmanager 卸载并重新安装正确版本的nvidia-fabricmanager，验证CUDA成功。处理方法查看nvidia-fabricmanager的版本，若nvidia-fabricmanager版本与当前NVID

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
创建数据集导出任务 - AI开发平台ModelArts

ratio_sample_usage 否 Boolean 指定切分比例后，是否按指定比例随机分配训练-验证集。可选值如下： true：主动随机分配训练集-验证集 false：不主动随机分配训练集-验证集（默认值） sample_state 否 String 样本状态。可选样本状态如下： __ALL__：已标注

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
保存ckpt时超时报错 - AI开发平台ModelArts

需要保证磁盘IO带宽正常，可以在36分钟内将文件保存到磁盘。单个节点内，最大只有60G（实际应该在40G以下）的文件内容，只要在36分钟内保存完成，就不会报超时错误。 2. 忽略该报错，因为报错不影响实际报错的权重。父主题：常见错误原因和解决方法

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 常见错误原因和解决方法
LoRA微调训练 - AI开发平台ModelArts

LoRA微调训练步骤一上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件和数据集到容器中，可以忽略此步骤。如果未上传训练权重文件和数据集到容器中，具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909）
SFT全参微调训练任务 - AI开发平台ModelArts

SFT全参微调训练任务 Step1 上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件和数据集到容器中，可以忽略此步骤。如果未上传训练权重文件和数据集到容器中，具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）

总条数： 383

上一页
1
2
3
4
5
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

日志提示“pandas.errors.ParserError: Error tokenizing data. C error: Expected .* fields” - AI开发平台ModelArts

权限管理 - AI开发平台ModelArts

第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

执行微调训练任务 - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

指令监督微调训练任务 - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

创建Workflow数据集版本发布节点 - AI开发平台ModelArts

自定义引擎创建模型规范 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

通过APP认证的方式访问在线服务 - AI开发平台ModelArts

GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败 - AI开发平台ModelArts

创建数据集导出任务 - AI开发平台ModelArts

保存ckpt时超时报错 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线