搜索_华为云

自动学习为什么训练失败？ - AI开发平台ModelArts

如果OBS路径符合要求，请您按照服务具体情况执行3。自动学习项目不同导致的失败原因可能不同。图像识别训练失败请检查是否存在损坏图片，如有请进行替换或删除。物体检测训练失败请检查数据集标注的方式是否正确，目前自动学习仅支持矩形标注。预测分析训练失败请检查标签列的选取。标签列目前支持离散和连续型数据，只能选择一列。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 模型训练
发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

”和“@”开头的命令时，为了安全考虑，ModelArts会自动加上Tab键，并对双引号进行转义处理。 “数据切分” 仅“图像分类”、“物体检测”、“文本分类”和“声音分类”类型数据集支持进行数据切分功能。默认不启用。启用后，需设置对应的训练验证比例。输入“训练集比例”，数值只

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

和简单操作即可完成模型训练和部署。当前自动学习支持快速创建图像分类、物体检测、预测分析、声音分类和文本分类模型的定制化开发。可广泛应用在工业、零售安防等领域。图像分类：识别图片中物体的类别。物体检测：识别出图片中每个物体的位置和类别。预测分析：对结构化数据做出分类或数值预测。

帮助中心 > AI开发平台ModelArts > 功能总览
日志提示“cuda runtime error (10) : invalid device ordinal at xxx” - AI开发平台ModelArts

ID号。如果cuda相关运算设置的卡ID号在所选规格范围内，但是依旧出现了上述报错。可能是该资源节点中存在GPU卡损坏的情况，导致实际能检测到的卡少于所选规格。处理方法建议直接根据系统分卡情况下传进去的CUDA_VISIBLE_DEVICES去设置，不用手动指定默认的。如

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
查看ModelArts模型详情 - AI开发平台ModelArts

参数设置情况。启动探针：用于检测应用实例是否已经启动。如果提供了启动探针(startup probe)，则禁用所有其他探针，直到它成功为止。如果启动探针失败，将会重启实例。如果没有提供启动探针，则默认状态为成功Success。就绪探针：用于检测应用实例是否已经准备好接收流量。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
自动学习的每个项目对数据有哪些要求？ - AI开发平台ModelArts

在上传数据时，请选择非加密桶进行上传，否则会由于加密桶无法解密导致后期的训练失败。用于训练的图片，至少有2种以上的分类，每种分类的图片数不少20张。物体检测对数据集的要求文件名规范，不能有中文，不能有+、空格、制表符。保证图片质量：不能有损坏的图片；目前支持的格式包括jpg、jpeg、bmp、png。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 准备数据
精度问题诊断 - AI开发平台ModelArts

精度问题诊断逐个替换模型，检测有问题的模型该方式主要是通过模型替换，先定位出具体哪个模型引入的误差，进一步诊断具体的模型中哪个算子或者操作导致效果问题，模型替换原理如下图所示。通过设置开关选项（是否使用onnx模型），控制模型推理时，模型使用的是onnx模型或是mindir的模型。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 模型精度调优
GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

查看nv_peer_mem是否已安装。 dpkg -i | grep peer 若未安装则需要安装，安装方法参考装机指导。若已安装则进入下一检测项。查看该软件是否已经加载至内核。 lsmod | grep peer 若没有则需要重新加载至内核，执行如下命令进行加载： /etc/init

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
ModelArts入门实践 - AI开发平台ModelArts

面向AI开发零基础的用户使用Standard自动学习实现口罩检测本案例基于华为云AI开发者社区AI Gallery中的数据集资产，让零AI基础的开发者使用ModelArts Standard的自动学习功能完成“物体检测”AI模型的训练和部署。依据开发者提供的标注数据及选择的场景

 帮助中心 > AI开发平台ModelArts > 快速入门
查询数据集的版本列表 - AI开发平台ModelArts

内置属性：标签展示的颜色，为色彩的16进制代码，默认为空。例如：“#FFFFF0”。 @modelarts:default_shape String 内置属性：物体检测标签的默认形状（物体检测标签专用属性），默认为空。可选值如下： bndbox：矩形。 polygon：多边形。 circle：圆形。 line：直线。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
从OBS中导入模型文件创建模型 - AI开发平台ModelArts

当前支持以下三种探针：启动探针：用于检测应用实例是否已经启动。如果提供了启动探针(startup probe)，则禁用所有其他探针，直到它成功为止。如果启动探针失败，将会重启实例。如果没有提供启动探针，则默认状态为成功Success。就绪探针：用于检测应用实例是否已经准备好接收流量。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
advisor分析报告html文件详解 - AI开发平台ModelArts

计算维度，识别AICPU算子，部分AICPU算子计算性能较差 computation - operator dynamic shape 计算维度，检测动态shape，动态shape会触发频繁的算子编译 computation - operator bound 计算维度，算子计算性能分析，例如算子是否充分使用AICORE核数

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
产品优势 - AI开发平台ModelArts
产品优势 - AI开发平台ModelArts

支持MLOps能力，提供数据诊断、模型监测等分析能力，训练智能日志分析与诊断容错能力强，故障恢复快提供机柜、节点、加速卡、任务多场景故障感知和检测提供节点级、作业级、容器级，多级故障恢复，保障千卡作业稳定训练多种资源形态集群模式，开箱即提供好Kubernetes集群，直接使用，方便高效

 帮助中心 > AI开发平台ModelArts > 产品介绍
哪里可以了解Atlas800训练服务器硬件相关内容 - AI开发平台ModelArts

训练服务器 1.0.11 HCCN Tool接口参考主要介绍集群网络工具hccn_tool对外接口说明，包括配置RoCE网卡的IP、网关，配置网络检测对象IP和查询LLDP信息等。 Atlas 800训练服务器备件查询助手备件查询助手可以帮助你查询服务器的所有部件、规格描述，数量等详细信息。

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
创建数据集 - AI开发平台ModelArts

work_path=None, **kwargs) 根据数据类型创建数据集，用户可以在相同的数据集上创建不同类型的标注任务，如在图像数据集上创建图像分类、物体检测等标注任务。 create_dataset(session,dataset_name=None, data_type=None, data_sources=None

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
从Manifest文件导入规范说明 - AI开发平台ModelArts

图像分类 text_classification：文本分类 text_entity：文本命名实体 object_detection：对象检测 audio_classification：声音分类 audio_content：声音内容 audio_segmentation：声音起止点

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
创建数据集版本 - AI开发平台ModelArts

Default：默认格式 label_task_type 否 Integer 版本数据对应的标注类型。可选值如下： 0：图像分类 1：物体检测 3：图像分割 100：文本分类 101：命名实体 102：文本三元组 200：声音分类 201：语音内容 202：语音分割 400：表格数据集

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集版本管理
按标签名称删除标签及仅包含此标签的文件 - AI开发平台ModelArts

true：删除样本源文件 false：不删除样本源文件（默认值） label_type 否 Integer 标签类型。可选值如下： 0：图像分类 1：物体检测 3: 图像分割 100：文本分类 101：命名实体 102：文本三元组关系标签 103：文本三元组实体标签 200：语音分类 201：语音内容

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
人工标注图片数据 - AI开发平台ModelArts

登录ModelArts管理控制台，在总览页选择“数据准备>数据标注”，进入“我创建的”页签，在右上方的作业类型中下拉选择对应类型的标注作业。（仅物体检测与图像分割支持快速复核功能）在物体检测类型的标注作业列表，单击标注作业名称，进入标注详情页。单击“已标注”页签的“快速复核”，进入复核页面，对标注结果进行确认。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
设置无条件自动重启 - AI开发平台ModelArts

设置。控制台设置在创建训练作业页面，开启“自动重启”开关，并勾选“无条件自动重启”，开启无条件自动重启。开启无条件自动重启后，只要系统检测到训练异常，就无条件重启训练作业。如果未勾选“无条件自动重启”只是打开了“自动重启”开关，则表示仅环境问题导致训练作业异常时才会自动重启，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性

总条数： 357

上一页
1
...
6
7
8
...
18
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

自动学习为什么训练失败？ - AI开发平台ModelArts

发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

日志提示“cuda runtime error (10) : invalid device ordinal at xxx” - AI开发平台ModelArts

查看ModelArts模型详情 - AI开发平台ModelArts

自动学习的每个项目对数据有哪些要求？ - AI开发平台ModelArts

精度问题诊断 - AI开发平台ModelArts

GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

ModelArts入门实践 - AI开发平台ModelArts

查询数据集的版本列表 - AI开发平台ModelArts

从OBS中导入模型文件创建模型 - AI开发平台ModelArts

advisor分析报告html文件详解 - AI开发平台ModelArts

产品优势 - AI开发平台ModelArts

哪里可以了解Atlas800训练服务器硬件相关内容 - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

从Manifest文件导入规范说明 - AI开发平台ModelArts

创建数据集版本 - AI开发平台ModelArts

按标签名称删除标签及仅包含此标签的文件 - AI开发平台ModelArts

人工标注图片数据 - AI开发平台ModelArts

设置无条件自动重启 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线