搜索_华为云

在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

# 参考input_params格式描述 output_params=output_params, # 参考output_params格式描述

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
在Workflow中更新已部署的服务 - AI开发平台ModelArts

default="True", description="是否进行数据清洗, 数据格式异常会导致训练失败，建议开启，保证训练稳定性。数据量过大时，数据清洗可能耗时较久，可自行线下清洗（支持BMP.JPEG,PNG格式, RGB三通道）。建议用JPEG格式数据")), wf.Algor

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
查询资源实时利用率 - AI开发平台ModelArts

表5 Allocated 参数参数类型描述 value Value object 资源量。 timestamp String UTC时间，格式yyyy-MM-dd'T'HH:mm:ss'Z'。 window String 统计间隔，1s表示1秒，1m表示1分钟，1h为1小时。表6

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

json，数据大小：42M左右。自定义数据用户也可以自行准备训练数据。数据要求如下：使用标准的.json格式的数据，通过设置--json-key来指定需要参与训练的列。请注意huggingface中的数据集具有如下this格式。可以使用–json-key标志更改数据集文本字段的名称，默认为text。在维

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 准备工作
训练的数据集预处理说明 - AI开发平台ModelArts

get_tokenized_data()中调用self._filter方法处理每一个sample self._filter在基类中未定义，需要各个子类针对目标数据集格式进行实现所有handler依据实际数据集实现self._filter方法，处理原始数据集中的单一sample，其余方法复用基类的实现。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明参考
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

jsonl，数据大小：42M左右。自定义数据用户也可以自行准备训练数据。数据要求如下：使用标准的.json格式的数据，通过设置--json-key来指定需要参与训练的列。请注意huggingface中的数据集具有如下this格式。可以使用–json-key标志更改数据集文本字段的名称，默认为text。在维

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 准备工作
为什么项目删除完了，仍然还在计费？ - AI开发平台ModelArts

您在创建Notebook时，选择了云硬盘EVS存储，该存储会单独收费，Notebook停止后，EVS还在计费，请及时删除该Notebook实例。您在体验CodeLab时，切换规格为付费的规格时会收费。请前往CodeLab界面单击右上角停止Notebook实例。父主题：计费FAQ

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
为什么项目删除完了，仍然还在计费？ - AI开发平台ModelArts

您在创建Notebook时，选择了云硬盘EVS存储，该存储会单独收费，Notebook停止后，EVS还在计费，请及时删除该Notebook实例。您在体验CodeLab时，切换规格为付费的规格时会收费。请前往CodeLab界面单击右上角停止Notebook实例。父主题：计费相关

 帮助中心 > AI开发平台ModelArts > 常见问题 > 计费相关
AIGC模型训练推理 - AI开发平台ModelArts

Open-Clip基于DevServer适配PyTorch NPU训练指导 moondream2基于DevServer适配PyTorch NPU推理指导 AIGC工具tailor使用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──llm_inference # 推理代码包 |──llm_tools # 推理工具下载代码之后需要修改llm_train/AscendSpeed/scripts/install.sh文件。具体为删除install.sh的第43行

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
创建资源池失败 - AI开发平台ModelArts

资源配额限制在使用专属资源池时（如资源扩缩容、创建VPC、创建VPC-子网、打通VPC），如果提示相关资源配额受限，请提交工单处理。创建失败/变更失败登录ModelArts管理控制台，在左侧导航栏中选择“AI专属资源池 > 弹性集群 Cluster”，进入“弹性集群 Cluster”页面。

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
人工标注视频数据 - AI开发平台ModelArts

的视频将呈现在“已标注”页签下。常见问题 Q：视频数据集无法显示或者无法播放视频？ A：如果无法显示和播放视频，请检查视频格式类型，目前只支持MP4格式。父主题：通过人工标注方式标注数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
SFT全参微调超参配置 - AI开发平台ModelArts

d_for_ma_input/BaiChuan2-13B/converted_weights 从 huggingface 格式转化为 magatron 格式的权重文件。 WORK_DIR /home/ma-user/ws 容器的工作目录。训练的权重文件保存在此路径下。非必填，默认值为：/home/ma-user/ws

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT全参微调
附录：微调训练常见问题 - AI开发平台ModelArts

ue 将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考模型NPU卡数、梯度累积值取值表，如原使用Accelerator可替换为Deepspeed-ZeRO-1，Dee

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
日志提示“errorMessage:The specified key does not exist” - AI开发平台ModelArts

出现该问题的可能原因如下：桶中的对象不存在，请检查OBS路径中的内容是否存在。具体错误码请参见OBS官方文档。处理方法检查OBS路径及内容格式是否正常。必现的问题，使用本地Pycharm远程连接Notebook调试。建议与总结在创建训练作业前，推荐您先使用ModelArts

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
启动智能任务 - AI开发平台ModelArts

训练作业的输出文件OBS路径URL，默认为空。 version_format 否 String 数据集版本格式。可选值如下： Default：默认格式 CarbonData：Carbon格式（仅表格数据集支持） CSV：CSV格式 worker_server_num 否 Integer 训练作业worker的个数。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
训练的数据集预处理说明 - AI开发平台ModelArts

get_tokenized_data()中调用self._filter方法处理每一个sample self._filter在基类中未定义，需要各个子类针对目标数据集格式进行实现所有handler依据实际数据集实现self._filter方法，处理原始数据集中的单一sample，其余方法复用基类的实现。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 训练脚本说明
训练的数据集预处理说明 - AI开发平台ModelArts

get_tokenized_data()中调用self._filter方法处理每一个sample self._filter在基类中未定义，需要各个子类针对目标数据集格式进行实现所有handler依据实际数据集实现self._filter方法，处理原始数据集中的单一sample，其余方法复用基类的实现。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明参考
查询数据集版本详情 - AI开发平台ModelArts

Long 版本更新时间。 version_format String 数据集版本格式。可选值如下： Default：默认格式 CarbonData：Carbon格式（仅表格数据集支持） CSV：CSV格式 version_id String 数据集版本ID。 version_name

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
训练的数据集预处理说明 - AI开发平台ModelArts

get_tokenized_data()中调用self._filter方法处理每一个sample self._filter在基类中未定义，需要各个子类针对目标数据集格式进行实现所有handler依据实际数据集实现self._filter方法，处理原始数据集中的单一sample，其余方法复用基类的实现。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） > 训练脚本说明

总条数： 1188

上一页
1
...
51
52
53
...
60
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

在Workflow中更新已部署的服务 - AI开发平台ModelArts

查询资源实时利用率 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

为什么项目删除完了，仍然还在计费？ - AI开发平台ModelArts

为什么项目删除完了，仍然还在计费？ - AI开发平台ModelArts

AIGC模型训练推理 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

创建资源池失败 - AI开发平台ModelArts

人工标注视频数据 - AI开发平台ModelArts

SFT全参微调超参配置 - AI开发平台ModelArts

附录：微调训练常见问题 - AI开发平台ModelArts

日志提示“errorMessage:The specified key does not exist” - AI开发平台ModelArts

启动智能任务 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

查询数据集版本详情 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线