搜索_华为云

在Lite Cluster资源池上使用Ascend FaultDiag工具完成日志诊断 - AI开发平台ModelArts

单节点采集的日志，即单worker目录下，总文件大小应限制在5G以下，文件总数量不能超过一百万，否则将影响日志清洗效率。用户训练打屏日志无大小限制，会默认只读最后100KB日志。 CANN日志单个文件应限制在20MB以下。 NPU状态监测指标文件、NPU网口统计监测指标文件、主机侧资源信息文件应限制在512MB以下。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
msprobe梯度监控 - AI开发平台ModelArts

梯度监控工具，可以实现对训练过程模型每一层梯度信息进行监控，目前支持两种能力：将模型权重的梯度数据导出。这种功能可以将模型权重的梯度值以统计量的形式采集出来，用以分析问题，例如检测确定性问题，使用训练状态监控工具监控NPU训练过程中的确定性计算问题。将两份梯度数据进行相似度对

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
创建ModelArts数据集 - AI开发平台ModelArts

除图片类型之外的数据集（如视频、文本、音频等），单个样本大小限制：5GB。针对图片类数据集（物体检测、图像分类、图像分割），单个图片大小限制：25MB。单个manifest文件大小限制：5GB。文本文件单行大小限制：100KB。数据集标注结果文件大小限制：100MB。前提条件数据集功能

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
故障恢复 - AI开发平台ModelArts
故障恢复 - AI开发平台ModelArts

这些可用区通过延迟低、吞吐量高且冗余性高的网络连接在一起。利用可用区，您可以设计和操作在可用区之间无中断地自动实现故障转移的应用程序和数据库。与传统的单个或多个数据中心基础设施相比，可用区具有更高的可用性、容错性和可扩展性。 ModelArts通过对DB的数据进行备份，保证在原数据被破坏或损坏的情况下可以恢复业务。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
查询团队标注任务详情 - AI开发平台ModelArts

Boolean 是否返回标签统计信息。可选值如下： true：返回标签统计信息 false：不返回标签统计信息（默认值） sample_stats 否 Boolean 是否返回样本统计信息。可选值如下： true：返回样本统计信息 false：不返回样本统计信息（默认值） workforce_stats

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询数据集详情 - AI开发平台ModelArts

DataSource objects 数据来源列表。 data_statistics Map<String,Object> 数据集的样本统计信息，包括样本元信息的统计。 data_update_time Long 样本和标签的更新时间。 dataset_format Integer 数据集格式。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查看诊断报告 - AI开发平台ModelArts

取单步计算、下发和通信耗时。 slow rank 对于集群profiling进行性能统计，获取每张卡不同step的计算、下发和通信耗时。 slow link 对于集群profiling进行性能统计，获取每张卡不同step的带宽信息。 environment variable 识别

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
查询数据集列表 - AI开发平台ModelArts

DataSource objects 数据来源列表。 data_statistics Map<String,Object> 数据集的样本统计信息，包括样本元信息的统计，json格式。 data_update_time Long 样本和标签的更新时间。 data_url String 训练所用的数据路径。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
在ModelArts的Notebook中不同规格资源/cache目录的大小是多少？ - AI开发平台ModelArts

昇腾资源为单卡时，cache目录保持500G大小限制；除单卡外，cache盘大小与卡数有关，计算方式为卡数*500G，上限为3T。详细表1所示。表1 不同Notebook规格资源“/cache”目录的大小规格类别 cache盘大小 GPU-0.25卡 500G*0.25 GPU-0

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
ModelArts训练中不同规格资源“/cache”目录的大小是多少？ - AI开发平台ModelArts

ModelArts训练中不同规格资源“/cache”目录的大小是多少？在创建训练作业时可以根据训练作业的大小选择资源。 ModelArts会挂载硬盘至“/cache”目录，用户可以使用此目录来储存临时文件。“/cache”与代码目录共用资源，不同资源规格有不同的容量。 k8s磁

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
查询团队标注验收任务报告 - AI开发平台ModelArts

参数类型描述 checking_stats CheckTaskStats object 实时验收统计信息。 total_stats CheckTaskStats object 历史汇总后的统计信息。表4 CheckTaskStats 参数参数类型描述 accepted_sample_count

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
在ModelArts数据集中添加图片对图片大小有限制吗？ - AI开发平台ModelArts

在ModelArts数据集中添加图片对图片大小有限制吗？在数据管理功能中，针对“物体检测”或“图像分类”的数据集，在数据集中上传更多的图片时，是有限制的。要求单张图片大小不超过8MB，且只支持JPG、JPEG、PNG和BMP四种格式的图片。请注意，针对自动学习功能中的添加图片，其图片大小限制不同，要求上传的图片大小不超过5MB。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
创建图像分类数据集并进行标注任务 - AI开发平台ModelArts

调用查询样本列表接口根据数据集ID获取数据集的样本详情。调用批量更新样本标签接口根据数据集ID和样本ID给样本添加标签进行人工标注。调用查询数据集的统计信息接口查看数据集的标注统计信息。当数据集使用完成或不再使用时，调用删除数据集接口删除数据集。前提条件已获取IAM的EndPoint和ModelArts的EndPoint。

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
使用Msprobe工具分析偏差 - AI开发平台ModelArts

} 这里Step指定为0表示只对首个Step进行数据Dump。task指定为statistics表示使用统计量模式，该模式下针对整网训练API输入输出保存最大值、最小值、均值等统计量信息比对，落盘数据量较小。GPU和NPU环境依次进行数据Dump，正常执行结束标识如下图回显Exception:

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优 > 精度对齐
AI开发基本流程介绍 - AI开发平台ModelArts

AI开发的目的是什么 AI开发的目的是将隐藏在一大批数据背后的信息集中处理并进行提炼，从而总结得到研究对象的内在规律。对数据进行分析，一般通过使用适当的统计、机器学习、深度学习等方法，对收集的大量数据进行计算、分析、汇总和整理，以求最大化地开发数据价值，发挥数据作用。 AI开发的基本流程 AI

帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
查询数据集导入任务的详情 - AI开发平台ModelArts

file_num_total Long 总文件数。 file_size_finished Long 传输完成文件大小（字节）。 file_size_total Long 总文件大小(字节)。请求示例查询导入任务详情 GET https://{endpoint}/v2/{projec

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询数据集导入任务列表 - AI开发平台ModelArts

file_num_total Long 总文件数。 file_size_finished Long 传输完成文件大小（字节）。 file_size_total Long 总文件大小(字节)。请求示例获取数据集导入任务列表 GET https://{endpoint}/v2/{pro

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查看在线服务详情 - AI开发平台ModelArts

“历史更新记录”：展示历史模型相关信息。监控信息展示当前服务的“资源统计信息”和“模型调用次数统计”。 “资源统计信息”：包括CPU、内存、GPU、NPU的可用和已用信息。 “模型调用次数统计”：当前模型的调用次数，从模型状态为“已就绪”后开始统计。（websocket服务不显示）事件展示当前

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
费用账单 - AI开发平台ModelArts
费用账单 - AI开发平台ModelArts

并输入步骤1中复制的Notebook的ID，单击图标即可搜索该资源的账单。图1 查询资源账单这里设置的统计维度为“按使用量”，统计周期为“按账期”，您也可以设置其他统计维度和周期，详细介绍请参见流水与明细账单。查看训练作业的账单 ModelArts训练作业查询资源账单首先需

 帮助中心 > AI开发平台ModelArts > 计费说明
资源管理 - AI开发平台ModelArts
资源管理 - AI开发平台ModelArts

更新网络资源查询资源实时利用率创建资源池查询资源池列表查询资源池删除资源池更新资源池资源池监控资源池统计查询资源规格列表查询专属资源池作业列表查询专属资源池作业统计信息

 帮助中心 > AI开发平台ModelArts > API参考

总条数： 543

上一页
1
2
3
4
5
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Lite Cluster资源池上使用Ascend FaultDiag工具完成日志诊断 - AI开发平台ModelArts

msprobe梯度监控 - AI开发平台ModelArts

创建ModelArts数据集 - AI开发平台ModelArts

故障恢复 - AI开发平台ModelArts

查询团队标注任务详情 - AI开发平台ModelArts

查询数据集详情 - AI开发平台ModelArts

查看诊断报告 - AI开发平台ModelArts

查询数据集列表 - AI开发平台ModelArts

在ModelArts的Notebook中不同规格资源/cache目录的大小是多少？ - AI开发平台ModelArts

ModelArts训练中不同规格资源“/cache”目录的大小是多少？ - AI开发平台ModelArts

查询团队标注验收任务报告 - AI开发平台ModelArts

在ModelArts数据集中添加图片对图片大小有限制吗？ - AI开发平台ModelArts

创建图像分类数据集并进行标注任务 - AI开发平台ModelArts

使用Msprobe工具分析偏差 - AI开发平台ModelArts

AI开发基本流程介绍 - AI开发平台ModelArts

查询数据集导入任务的详情 - AI开发平台ModelArts

查询数据集导入任务列表 - AI开发平台ModelArts

查看在线服务详情 - AI开发平台ModelArts

费用账单 - AI开发平台ModelArts

资源管理 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线