搜索_华为云

发布Workflow - AI开发平台ModelArts

发布Workflow 发布Workflow到ModelArts 发布Workflow到AI Gallery 父主题：开发Workflow命令参考

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
Workflow高阶能力 - AI开发平台ModelArts

Workflow高阶能力在Workflow中使用大数据能力（DLI/MRS）在Workflow中指定仅运行部分节点父主题：开发Workflow命令参考

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
管理Lite Cluster节点池 - AI开发平台ModelArts

管理Lite Cluster节点池为帮助您更好地管理Kubernetes集群内的节点，ModelArts支持通过节点池来管理节点。一个节点池包含一个节点或多个节点，能通过节点池批量配置一组节点。在资源池详情页，单击“节点池管理”页签，您可以创建、更新和删除节点池。图1 节点池管理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
使用自动学习实现预测分析 - AI开发平台ModelArts

使用自动学习实现预测分析准备预测分析数据创建预测分析项目训练预测分析模型部署预测分析服务父主题：使用自动学习实现零代码AI开发

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发
使用moxing适配OBS路径，pandas读取文件报错 - AI开发平台ModelArts

_wirte_check_passed = True df = pd.read_csv(ff, **param) 必现的问题，使用本地Pycharm远程连接Notebook调试。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
查询数据集列表 - AI开发平台ModelArts

查询数据集列表分页查询用户的数据集列表。 list_datasets(session, dataset_type=None, dataset_name=None, offset=None, limit=None) 示例代码示例一：查询数据集列表 from modelarts.session

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

异常模式-NVLINK部分互通，出现带宽波动较大的情况。如下图中GPU0和GPU4之间带宽远低于理论值，存在问题。图3 异常模式带宽性能出现这种现象，可尝试重装nvidia/cuda/nvidia-fabricmanager，重装后再测试又恢复到了正式模式，GPU0和GPU4之间带宽恢复到370GB/s。

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
设置断点续训练 - AI开发平台ModelArts

ckpoint继续训练。当需要从训练中断的位置接续训练，只需要加载checkpoint，并用checkpoint信息初始化训练状态即可。用户需要在代码里加上reload ckpt的代码，使能读取前一次训练保存的预训练模型。 ModelArts Standard中如何实现断点续训练

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
训练作业重调度 - AI开发平台ModelArts

训练作业重调度当训练作业发生故障恢复时（例如进程级恢复、POD级重调度、JOB级重调度等），作业详情页面中会出现“故障恢复详情”页签，里面记录了训练作业的启停情况。在ModelArts管理控制台的左侧导航栏中选择“模型训练 > 训练作业”。在训练作业列表中，单击作业名称进入训练作业详情页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

ModelArts提供AI诊断功能，用户可以通过NCCl Test，测试节点GPU状态，并且测试多个节点间的通信速度。操作步骤单击资源池名称，进入资源池详情。单击左侧“AI组件管理 > AI诊断”。单击“诊断”，选择“日志上传路径”和NCCL Test节点，其余参数可保持默认值或根据实际需求修改。

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Cluster
添加资源标签 - AI开发平台ModelArts

d}/tags/create 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 resource_id 是 String 资源ID，也就是服务ID。请求参数表2 请求Header参数参数

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
通过人工标注方式标注数据 - AI开发平台ModelArts

通过人工标注方式标注数据创建ModelArts人工标注作业人工标注图片数据人工标注文本数据人工标注音频数据人工标注视频数据管理标注数据父主题：标注ModelArts数据集中的数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据
设置在线服务故障自动重启 - AI开发平台ModelArts

仅支持使用Snt9b资源的同步在线服务。只支持针对整节点资源复位，请确保部署的在线服务为8*N卡规格，请谨慎评估对部署在该节点的其他服务的影响。开启故障自动重启用户可以在部署在线服务任务时，勾选“高级选项”的“现在配置”，可以看到“故障自动重启”参数，打开开关即可。图1 故障自动重启父主题：管理同步在线服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
计费样例 - AI开发平台ModelArts
计费样例 - AI开发平台ModelArts

141.1 元。计费场景二某用户于2023/03/18 15:30:00购买了一个按需计费的专属资源池，规格配置如下：规格：CPU: 8 核 32GB (modelarts.vm.cpu.8ud) 计算节点个数：1个用了一段时间后，用户发现当前规格无法满足业务需要，于2023/03/20

帮助中心 > AI开发平台ModelArts > 计费说明
使用自动学习实现物体检测 - AI开发平台ModelArts

使用自动学习实现物体检测准备物体检测数据创建物体检测项目标注物体检测数据训练物体检测模型部署物体检测服务父主题：使用自动学习实现零代码AI开发

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发
查询OS的配置参数 - AI开发平台ModelArts

String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数无响应参数状态码：200 表2 响应Body参数参数参数类型描述 networkCidrs Array of strings 网络配置项。 networkQuota Integer 用户可创建网络个数配额。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
重试/停止/运行Workflow节点 - AI开发平台ModelArts

对于单个节点中设置了需要运行中配置的参数时，节点运行会处于“等待操作”状态，用户完成相关数据的配置后，可单击“继续运行”按钮并确认继续执行当前节点。部分运行Workflow节点针对大型、复杂的Workflow，为节省重复运行消耗的时间，在运行业务场景时，用户可以选择其中的部分节点作为业务场景运行，工作流在执行时将会按顺序执行部分运行节点。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
从MRS导入数据到ModelArts数据集 - AI开发平台ModelArts

已有的MRS集群，并从HDFS文件列表选择文件名称或所在目录，导入文件的列数需与数据集schema一致。MRS的详细功能说明，请参考MRS用户指南。图1 从MRS导入数据集群名称：系统自动将当前账号下的MRS集群展现在此列表中，但是流式集群不支持导入操作。请在下拉框中选择您所需的集群。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集
OOM导致训练作业失败 - AI开发平台ModelArts

释放一些不需要的tensor，使用过的，如下： del tmp_tensor torch.cuda.empty_cache() 必现的问题，使用本地Pycharm远程连接Notebook调试超参。如果还存在问题，可能需要提工单进行定位，甚至需要隔离节点修复。建议与总结在创建训练作业前，推荐您先使用M

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
使用自动学习实现图像分类 - AI开发平台ModelArts

使用自动学习实现图像分类准备图像分类数据创建图像分类项目标注图像分类数据训练图像分类模型部署图像分类服务父主题：使用自动学习实现零代码AI开发

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发

总条数： 2469

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

发布Workflow - AI开发平台ModelArts

Workflow高阶能力 - AI开发平台ModelArts

管理Lite Cluster节点池 - AI开发平台ModelArts

使用自动学习实现预测分析 - AI开发平台ModelArts

使用moxing适配OBS路径，pandas读取文件报错 - AI开发平台ModelArts

查询数据集列表 - AI开发平台ModelArts

GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

设置断点续训练 - AI开发平台ModelArts

训练作业重调度 - AI开发平台ModelArts

Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

添加资源标签 - AI开发平台ModelArts

通过人工标注方式标注数据 - AI开发平台ModelArts

设置在线服务故障自动重启 - AI开发平台ModelArts

计费样例 - AI开发平台ModelArts

使用自动学习实现物体检测 - AI开发平台ModelArts

查询OS的配置参数 - AI开发平台ModelArts

重试/停止/运行Workflow节点 - AI开发平台ModelArts

从MRS导入数据到ModelArts数据集 - AI开发平台ModelArts

OOM导致训练作业失败 - AI开发平台ModelArts

使用自动学习实现图像分类 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线