搜索_华为云

准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

准备数据本教程使用到的训练数据集是Alpaca数据集。您也可以自行准备数据集。数据集下载本教程使用Alpaca数据集，数据集的介绍及下载链接如下。 Alpaca数据集是由OpenAI的text-davinci-003引擎生成的包含52k条指令和演示的数据集。这些指令数据可以

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
查询数据集标签列表 - AI开发平台ModelArts

查询数据集标签列表功能介绍查询数据集下所有标签列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/datasets/

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
在ModelArts上训练模型如何配置输入输出数据？ - AI开发平台ModelArts

完成参数解析后，用户使用“data_url”、“train_url”代替算法中数据来源和数据输出所需的路径。在使用预置框架创建算法时，根据1中的代码参数设置定义的输入输出参数。训练数据是算法开发中必不可少的输入。“输入”参数建议设置为“data_url”，表示数据输入来源，也支持用户根据1的算法代码自定义代码参数。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
调优数据集异常日志说明 - AI开发平台ModelArts

arranged like ["conversation_id", "text"]. 对于csv、xlsx文件，平台会根据训练类型的不同，将其转为Alpaca格式或MOSS格式，选择预期的数据类型无效。父主题： Studio

帮助中心 > AI开发平台ModelArts > 常见问题 > Studio
复制数据至容器中空间不足 - AI开发平台ModelArts

复制数据至容器中空间不足问题现象 ModelArts训练作业运行时，日志中遇到如下报错，导致数据无法复制至容器中。 OSError:[Errno 28] No space left on device 原因分析数据下载至容器的位置空间不足。处理方法请排查是否将数据下载至“

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
查询数据集版本列表 - AI开发平台ModelArts

查询数据集版本列表查询数据集的版本列表。 dataset.list_versions() 示例代码查询数据集版本列表 from modelarts.session import Session from modelarts.dataset import Dataset session

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集版本管理
通过智能标注方式标注数据 - AI开发平台ModelArts

通过智能标注方式标注数据创建智能标注作业确认智能标注作业的数据难例使用自动分组智能标注作业父主题：标注ModelArts数据集中的数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据
从OBS导入数据到数据集场景介绍 - AI开发平台ModelArts

支持可以导入未标注或已标注数据已标注数据格式规范：图像分类物体检测支持可以导入未标注或已标注数据已标注数据格式规范：物体检测支持可以导入未标注或已标注数据已标注数据格式规范：物体检测图像分割支持可以导入未标注或已标注数据已标注数据格式规范：图像分割支持可以导入未标注或已标注数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
ModelArts Standard数据管理相关计费FAQ - AI开发平台ModelArts

ModelArts Standard数据管理相关计费FAQ ModelArts上传数据集收费吗？ ModelArts中的数据集管理、标注等操作不收费，但是由于数据集存储在OBS中，因此会根据您使用的OBS桶进行收费。建议您前往OBS服务，了解OBS计费详情，创建相应的OBS桶用于存储ModelArts使用的数据。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
准备数据（可选） - AI开发平台ModelArts

准备数据（可选）此小节为自定义数据集执行过程，如非自定义数据集此小节忽略。本教程使用到的是LLamaFactory代码包自带数据集。您也可以自行准备数据集，目前指令微调数据集支持alpaca格式和sharegpt格式的数据集；使用自定义数据集时，请更新代码目录下data/dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 准备工作
准备数据（可选） - AI开发平台ModelArts

准备数据（可选）此小节为自定义数据集执行过程，如非自定义数据集此小节忽略。本教程使用到的是LLamaFactory代码包自带数据集。您也可以自行准备数据集，目前支持alpaca格式和sharegpt格式的微调数据集；使用自定义数据集时，请更新代码目录下data/dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 准备工作
查询数据处理任务的版本详情 - AI开发平台ModelArts

否则不需要这个字段。 type String 数据源类型。可选值如下： OBS：数据来源于OBS TASK：数据处理任务 DATASET：数据集 CUSTOM：资源租户调用 version_id String 数据集的版本。 version_name String 数据集的版本名称。表4 TemplateParam

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
删除数据处理任务的版本 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。 task_id 是 String 数据处理任务ID。 version_id 是 String 数据处理任务的版本ID。请求参数无响应参数无请求示例删除数据处理任务的版本 DELETE https://{endpoint}/v2/

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
功能介绍 - AI开发平台ModelArts
功能介绍 - AI开发平台ModelArts

功能介绍 Standard功能介绍 MaaS大模型即服务平台功能介绍 Lite Cluster&Server介绍 AI Gallery功能介绍

 帮助中心 > AI开发平台ModelArts > 产品介绍
准备数据（可选） - AI开发平台ModelArts

准备数据（可选）此小节为自定义数据集执行过程，如非自定义数据集此小节忽略。本教程使用到的是LLamaFactory代码包自带数据集。您也可以自行准备数据集，目前支持alpaca格式和sharegpt格式的微调数据集；使用自定义数据集时，请更新dataset_info.json文件；请务必在dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 准备工作
准备数据（可选） - AI开发平台ModelArts

准备数据（可选）此小节为自定义数据集执行过程，如非自定义数据集此小节忽略。本教程使用到的是LLamaFactory代码包自带数据集。您也可以自行准备数据集，目前支持alpaca格式和sharegpt格式的微调数据集；使用自定义数据集时，请更新代码目录下data/dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 准备工作
准备数据（可选） - AI开发平台ModelArts

准备数据（可选）此小节为自定义数据集执行过程，如非自定义数据集此小节忽略。本教程使用到的是LLamaFactory代码包自带数据集。您也可以自行准备数据集，目前支持alpaca格式和sharegpt格式的微调数据集；使用自定义数据集时，请更新代码目录下data/dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 准备工作
查询数据集导入任务的详情 - AI开发平台ModelArts

SchemaMap objects 表格数据对应的schema映射信息。 source_info SourceInfo object 导入表格数据源所需的信息。 with_column_header Boolean 文件中首行是否是列名，用于表格数据集。可选值如下： true：文件首行为列名

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询数据集的统计信息 - AI开发平台ModelArts

data_path String 数据集数据存储路径。 data_spliting_enable Boolean 根据样本标注统计，判断数据集是否可以进行训练/验证集切分。可选值如下： true：数据集可以进行训练/验证集切分 false：数据集无法进行训练/验证集切分 grouped_label_stats

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
在Workflow中使用大数据能力（DLI/MRS） - AI开发平台ModelArts

在Workflow中使用大数据能力（DLI/MRS）功能介绍该节点通过调用MRS服务，提供大数据集群计算能力。主要用于数据批量处理、模型训练等场景。应用场景需要使用MRS Spark组件进行大量数据的计算时，可以根据已有数据使用该节点进行训练计算。使用案例在华为云MR

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > Workflow高阶能力

总条数： 2651

上一页
1
...
5
6
7
...
133
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备数据 - AI开发平台ModelArts

查询数据集标签列表 - AI开发平台ModelArts

在ModelArts上训练模型如何配置输入输出数据？ - AI开发平台ModelArts

调优数据集异常日志说明 - AI开发平台ModelArts

复制数据至容器中空间不足 - AI开发平台ModelArts

查询数据集版本列表 - AI开发平台ModelArts

通过智能标注方式标注数据 - AI开发平台ModelArts

从OBS导入数据到数据集场景介绍 - AI开发平台ModelArts

ModelArts Standard数据管理相关计费FAQ - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

查询数据处理任务的版本详情 - AI开发平台ModelArts

删除数据处理任务的版本 - AI开发平台ModelArts

功能介绍 - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

查询数据集导入任务的详情 - AI开发平台ModelArts

查询数据集的统计信息 - AI开发平台ModelArts

在Workflow中使用大数据能力（DLI/MRS） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线