搜索_华为云

镜像在SWR上显示只有13G，安装少量的包，然后镜像保存过程会提示超过35G大小保存失败，为什么？ - AI开发平台ModelArts

镜像在SWR上显示只有13G，安装少量的包，然后镜像保存过程会提示超过35G大小保存失败，为什么？问题现象我的镜像在SWR侧看，只有13G左右，在开发环境Notebook镜像管理注册，启动Notebook实例后，安装一些包后，镜像保存过程会提示超过35G大小，保存失败？原因分析 SWR侧看到的

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
数据管理（旧版） - AI开发平台ModelArts

数据管理（旧版）查询数据集列表创建数据集查询数据集详情更新数据集删除数据集查询数据集的统计信息查询数据集监控数据查询数据集的版本列表创建数据集标注版本查询数据集版本详情删除数据集标注版本查询样本列表批量添加样本批量删除样本查询单个样本信息获取样本搜索条件

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API
如何保证自定义镜像能不因为超过35G而保存失败？ - AI开发平台ModelArts

目录，请将数据集等放到work路径下，不要放到非work路径下。请不要将实例频繁保存镜像，建议一次将需要的安装包安装好，然后执行镜像保存，避免频繁执行镜像保存的动作，保存次数越多镜像越大，且多次保存后的镜像过大问题无法通过清理磁盘方式减少镜像的大小（Docker保存原理机制）。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
数据管理 - AI开发平台ModelArts
数据管理 - AI开发平台ModelArts

数据管理数据集管理数据集版本管理样本管理导入任务管理导出任务管理 Manifest管理标注任务管理

 帮助中心 > AI开发平台ModelArts > SDK参考
Standard数据管理 - AI开发平台ModelArts

ModelArts Standard数据管理模块重构中，当前能力不做演进，将结合大模型时代能力进行全新升级，敬请期待。 ModelArts Standard数据管理支持多维度数据管理能力数据集管理：提供数据集创建、数据预览、数据集版本管理等能力数据标注：提供在线标注能力，包含图像分类、

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
创建和保存Manifest文件 - AI开发平台ModelArts

save_mode="w") 示例代码在保存Manifest文件之前需要先创建包含Manifest信息的对象，包括Sample样本信息及其标签信息Annotation，然后将若干个样本组成Manifest。保存的时候调用save接口，将session信息传入，即可保存到指定路径。 from modelarts

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
如何切分ModelArts数据集？ - AI开发平台ModelArts

如何切分ModelArts数据集？在发布数据集时，仅“图像分类”、“物体检测”、“文本分类”和“声音分类”类型数据集支持进行数据切分功能。一般默认不启用该功能。启用后，需设置对应的训练验证比例。输入“训练集比例”，数值只能是0~1区间内的数。设置好“训练集比例”后，“验证集

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
发布数据 - AI开发平台ModelArts
发布数据 - AI开发平台ModelArts

发布数据在AI Gallery中，您可以将个人数据集分享给他人使用。 ModelArts数据管理模块在重构升级中，对未使用过数据管理的用户不可见。建议新用户选择发布OBS或本地的数据集。前提条件本地或对象存储服务（OBS）中已准备好待发布的数据集，或ModelArts的数据集列表存在待发布的数据集。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
创建OBS桶用于ModelArts存储数据 - AI开发平台ModelArts

创建OBS桶用于ModelArts存储数据由于ModelArts本身没有数据存储的功能，ModelArts使用对象存储服务（Object Storage Service，简称OBS）进行数据存储以及模型的备份和快照，实现安全、高可靠和低成本的存储需求。 AI开发过程中的输入数据、输出数据、中间缓存数据都可以在

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

只有发布后的数据集支持数据特征分析。发布后的Default格式数据集版本支持数据特征分析。数据特征分析的数据范围，不同类型的数据集，选取范围不同：对于标注任务类型为“物体检测”的数据集版本，当已标注样本数为0时，发布版本后，数据特征页签版本置灰不可选，无法显示数据特征。否则，显示已标注的图片的数据特征。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
W4A16量化 - AI开发平台ModelArts
W4A16量化 - AI开发平台ModelArts

W4A16量化大模型推理中，模型权重数据类型（weight），推理计算时的数据类型（activation）和kvcache一般使用半精度浮点FP16或BF16。量化指将高比特的浮点转换为更低比特的数据类型的过程。例如int4、int8等。模型量化分为weight-only量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
保存Notebook实例 - AI开发平台ModelArts

页面。镜像保存时，哪些目录的数据可以被保存可以保存的目录：包括容器构建时静态添加到镜像中的文件和目录，可以保存在镜像环境里。例如：安装的依赖包、“/home/ma-user”目录不会被保存的目录：容器启动时动态连接到宿主机的挂载目录或数据卷，这些内容不会被保存在镜像中。可以通过df

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
数据集管理 - AI开发平台ModelArts

数据集管理查询数据集列表创建数据集查询数据集详情更新数据集删除数据集父主题：数据管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理
训练作业使用MoXing复制数据较慢，重复打印日志 - AI开发平台ModelArts

训练作业使用MoXing复制数据较慢，重复打印日志问题现象 ModelArts训练作业使用MoXing复制数据较慢。重复打印日志“INFO:root:Listing OBS”。原因分析复制数据慢的可能原因如下：直接从OBS上读数据会造成读数据变成训练的瓶颈，导致迭代缓慢。

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
导出ModelArts数据集中的数据为新数据集 - AI开发平台ModelArts

导出ModelArts数据集中的数据为新数据集针对数据集中的数据，用户可以选中部分数据或者通过条件筛选出需要的数据，导出成新的数据集。用户可以通过任务历史查看数据导出的历史记录。本章主要介绍将ModelArts数据集中的数据为新数据集的方式，新导出的数据集可直接在ModelArts控制台数据集列表中显示。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导出ModelArts数据集中的数据
训练数据集预处理说明 - AI开发平台ModelArts

a.sh 。预训练数据集预处理参数说明预训练数据集预处理脚本 scripts/llama2/1_preprocess_data.sh 中的具体参数如下： --input：原始数据集的存放路径。 --output-prefix：处理后的数据集保存路径+数据集名称（例如：alpaca_gpt4_data）。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
数据处理场景介绍 - AI开发平台ModelArts

数据一般是不能直接满足训练要求的。为了保障数据质量，以免对后续操作（如数据标注、模型训练等）带来负面影响，开发过程通常需要进行数据处理。常见的数据处理类型有以下四种：数据校验：通常数据采集后需要进行校验，保证数据合法。数据校验是指对数据可用性的基本判断和验证的过程。通常，用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
【下线公告】华为云ModelArts服务旧版数据集下线公告 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务旧版数据集下线公告华为云计划于2024/10/31 00:00（北京时间）用AI开发平台ModelArts的新版数据集全面替代旧版数据集，旧版数据集正式下线。下线范围下线区域：华北-北京四（其他区域已下线）受影响服务 ModelArts旧版数据集。下线影响

 帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
创建和保存Pascal VOC文件 - AI开发平台ModelArts

save_mode='w', session=None) 示例代码在保存Pascal VOC的XML文件之前需要先创建包含Pascal VOC信息的对象，包括voc object信息等。保存的时候调用save_xml接口，将session信息传入，即可保存到指定路径。 from modelarts.dataset

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
在ModelArts中如何将图片划分到验证集或者训练集？ - AI开发平台ModelArts

目前只能指定切分比例，随机将样本划分到训练集或者验证集，不支持指定。切分比例的指定：在发布数据集时，仅“图像分类”、“物体检测”、“文本分类”和“声音分类”类型数据集支持进行数据切分功能。一般默认不启用该功能。启用后，需设置对应的训练验证比例。输入“训练集比例”，数值只能是0~

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备

总条数： 1618

上一页
1
2
3
4
5
...
81
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

镜像在SWR上显示只有13G，安装少量的包，然后镜像保存过程会提示超过35G大小保存失败，为什么？ - AI开发平台ModelArts

数据管理（旧版） - AI开发平台ModelArts

如何保证自定义镜像能不因为超过35G而保存失败？ - AI开发平台ModelArts

数据管理 - AI开发平台ModelArts

Standard数据管理 - AI开发平台ModelArts

创建和保存Manifest文件 - AI开发平台ModelArts

如何切分ModelArts数据集？ - AI开发平台ModelArts

发布数据 - AI开发平台ModelArts

创建OBS桶用于ModelArts存储数据 - AI开发平台ModelArts

分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

W4A16量化 - AI开发平台ModelArts

保存Notebook实例 - AI开发平台ModelArts

数据集管理 - AI开发平台ModelArts

训练作业使用MoXing复制数据较慢，重复打印日志 - AI开发平台ModelArts

导出ModelArts数据集中的数据为新数据集 - AI开发平台ModelArts

训练数据集预处理说明 - AI开发平台ModelArts

数据处理场景介绍 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务旧版数据集下线公告 - AI开发平台ModelArts

创建和保存Pascal VOC文件 - AI开发平台ModelArts

在ModelArts中如何将图片划分到验证集或者训练集？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线