搜索_华为云

创建资源池失败 - AI开发平台ModelArts

Cluster”页面。您可以通过单击“购买AI专属集群”右侧的“操作记录”，查看当前处于失败状态的资源池信息。图1 创建失败资源池信息鼠标悬停在“状态”列的上，即可看到该操作失败的具体原因。失败的记录默认按照操作的申请时间排序，最多显示500条并保留3天。父主题：资源池

 帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
管理Lite Cluster节点 - AI开发平台ModelArts

“节点管理”页签中提供对单个节点替换的功能。可单击操作列的“替换”，即可实现对单个节点的替换。替换节点操作不会收取费用。单击“操作记录”可查看当前资源池替换节点的操作记录。“运行中”表示节点在替换中。替换成功后，节点列表中会显示新的节点名称。替换最长时间为24小时，超时后仍然未找到合适的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
制作自定义镜像用于推理 - AI开发平台ModelArts

AI应用的自定义镜像制作流程在Notebook中通过镜像保存功能制作自定义镜像用于推理在Notebook中通过Dockerfile从0制作自定义镜像用于推理在ECS中通过Dockerfile从0制作自定义镜像用于推理父主题：制作自定义镜像用于ModelArts Standard

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard
管理员和开发者权限分离 - AI开发平台ModelArts

"ecs:serverKeypairs:list", "ecs:serverKeypairs:get", "ecs:serverKeypairs:delete", "ecs:serverKeypairs:create"

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
制作自定义镜像用于创建Notebook - AI开发平台ModelArts

制作自定义镜像用于创建Notebook Notebook的自定义镜像制作方法在ECS上构建自定义镜像并在Notebook中使用在Notebook中通过Dockerfile从0制作自定义镜像在Notebook中通过镜像保存功能制作自定义镜像父主题：制作自定义镜像用于ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard
修复Standard专属资源池故障节点 - AI开发平台ModelArts

实现对单个节点的重启。勾选多个节点的复选框，单击操作记录旁的“重启”按钮，可实现对多个节点的重启。下发重启节点任务时需要选择对应节点，重启节点将影响相关业务的运行，请谨慎操作。单击“操作记录”可查看当前资源池节点的操作记录。重启中节点状态为“重启中”，重启成功后，节点状态变为“可用”。重启节点操作不会收取费用。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
配置IAM权限 - AI开发平台ModelArts

"Action": [ "vpc:*:*", "ecs:*:get*", "ecs:*:list*" ], "Effect": "Allow"

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
训练作业重调度 - AI开发平台ModelArts

训练作业重调度当训练作业发生故障恢复时（例如进程级恢复、POD级重调度、JOB级重调度等），作业详情页面中会出现“故障恢复详情”页签，里面记录了训练作业的启停情况。在ModelArts管理控制台的左侧导航栏中选择“模型训练 > 训练作业”。在训练作业列表中，单击作业名称进入训练作业详情页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
查询数据集列表 - AI开发平台ModelArts

示例四：分页查询数据集列表 # 默认一次返回10条数据集记录，可通过设置limit和offset进行分页查询 dataset_list = Dataset.list_datasets(session, offset=0, limit=50) # 查询第1-50条记录 print(dataset_list)

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
Standard资源池节点故障定位 - AI开发平台ModelArts

-a查询到存在Pending Page Blacklist为Yes的记录，或多比特Register File大于0。对于Ampere架构的GPU，存在以下场景：存在不可纠正的SRAM错误。存在Remapping Failure记录。 dmsg中存在Xid 95事件。（参考NVIDIA GPU

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
新建Workflow Execution - AI开发平台ModelArts

String 创建时间。 name 否 String 执行记录名称。 execution_id 否 String 工作流执行ID。 description 否 String 执行记录描述。 status 否 String 执行记录状态。 workspace_id 否 String 工作空间ID。

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
管理Workflow - AI开发平台ModelArts

管理Workflow 查找Workflow工作流查看Workflow工作流运行记录管理Workflow工作流重试/停止/运行Workflow节点父主题：使用Workflow实现低代码AI开发

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
更新Workflow Execution - AI开发平台ModelArts

String 创建时间。 name 否 String 执行记录名称。 execution_id 否 String 工作流执行ID。 description 否 String 执行记录描述。 status 否 String 执行记录状态。 workspace_id 否 String 工作空间ID。

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
查询Workflow Execution - AI开发平台ModelArts

created_at String 创建时间。 name String 执行记录名称。 execution_id String 工作流执行ID。 description String 执行记录描述。 status String 执行记录状态。 workspace_id String 工作空间ID。

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
Notebook专属预置镜像列表 - AI开发平台ModelArts

像时基础镜像太大的问题，所以镜像中未安装任何组件；如果需使用OBS SDK相关功能，推荐使用ModelArts SDK进行文件复制等操作，详细操作请参考文件传输。镜像一：conda3-cuda10.2-cudnn7-ubuntu18.04 表12 conda3-cuda10.2-cudnn7-ubuntu18

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > ModelArts支持的预置镜像列表
管理Workflow Execution - AI开发平台ModelArts

created_at String 创建时间。 name String 执行记录名称。 execution_id String 工作流执行ID。 description String 执行记录描述。 status String 执行记录状态。 workspace_id String 工作空间ID。

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
查询Notebook支持的有效规格列表 - AI开发平台ModelArts

规格处理器类型。 CPU GPU ASCEND limit 否 Integer 每一页的数量，默认不限制。 offset 否 Integer 分页记录的起始位置偏移量，默认值0。 type 否 String 集群类型。枚举值如下： MANAGED：公共集群 DEDICATED：专属集群 sort_dir

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
创建Workflow数据集导入节点 - AI开发平台ModelArts

false：不导入样本否 bool import_type 导入方式。可选值如下： dir：目录导入 manifest：按manifest文件导入否 ImportTypeEnum included_labels 导入包含指定标签的样本。否 Label的列表 label_format

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
如何关闭Mox的warmup - AI开发平台ModelArts

up的原因。等到训练过程基本稳定之后就可以使用原先设定的初始学习率进行训练。原因分析 Tensorflow分布式有多种执行模式，mox会通过4次执行50 step记录执行时间，选择执行时间最少的模型。处理方法创建训练作业时，在“运行参数”中增加参数“variable_update=parameter

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
迁移效果校验 - AI开发平台ModelArts

pipeline输出的结果图片进行对比，在这里保证输入图片及文本提示词一致。如果差异较为明显可以进行模型精度调优。确认性能是否满足要求在推理代码开始结尾处加入时间记录，并打印出推理执行耗时。根据用户需求判断性能是否满足要求，如果不满足可以进行性能调优。 import time start_time = time

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导

总条数： 1308

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建资源池失败 - AI开发平台ModelArts

管理Lite Cluster节点 - AI开发平台ModelArts

制作自定义镜像用于推理 - AI开发平台ModelArts

管理员和开发者权限分离 - AI开发平台ModelArts

制作自定义镜像用于创建Notebook - AI开发平台ModelArts

修复Standard专属资源池故障节点 - AI开发平台ModelArts

配置IAM权限 - AI开发平台ModelArts

训练作业重调度 - AI开发平台ModelArts

查询数据集列表 - AI开发平台ModelArts

Standard资源池节点故障定位 - AI开发平台ModelArts

新建Workflow Execution - AI开发平台ModelArts

管理Workflow - AI开发平台ModelArts

更新Workflow Execution - AI开发平台ModelArts

查询Workflow Execution - AI开发平台ModelArts

Notebook专属预置镜像列表 - AI开发平台ModelArts

管理Workflow Execution - AI开发平台ModelArts

查询Notebook支持的有效规格列表 - AI开发平台ModelArts

创建Workflow数据集导入节点 - AI开发平台ModelArts

如何关闭Mox的warmup - AI开发平台ModelArts

迁移效果校验 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线