搜索_华为云

在ModelArts中部署模型时，为什么无法选择Ascend Snt3资源？ - AI开发平台ModelArts

方法1：如果您希望使用公共资源池下的Ascend Snt3，可以等待其他用户释放，即其他使用Ascend Snt3芯片的服务停止，您即可选择此资源进行部署上线。方法2：如果专属资源池还有Ascend Snt3资源，您可以创建一个Ascend Snt3专属资源池使用。方法3：如果专属资源池的Ascend

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
训练权重转换说明 - AI开发平台ModelArts

--model-type：模型类型。 --loader：选择对应加载模型脚本的名称。 --saver：选择模型保存脚本的名称。 --tensor-model-parallel-size：${TP}张量并行数，需要与训练脚本中的TP值配置一样。 --pipeline-model-paralle

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
【下线公告】华为云ModelArts自动学习下线公告 - AI开发平台ModelArts

下线区域：华为云全部Region 下线影响正式下线后，所有用户将无法使用自动学习模块创建项目，但仍可在Workflow模块查看、使用历史创建的自动学习作业。如您有任何问题，可随时通过工单或者服务热线（+86-4000-955-988或+86-950808）与我们联系。父主题：下线公告

 帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
订阅算法物体检测YOLOv3 - AI开发平台ModelArts

found。原因分析该报错信息表示验证集中有label在训练集中不存在，可能由于在发布数据集版本进行数据切分时，训练集比例填写为0导致发布的数据全部为验证集，所以出现上述报错。处理方法重新发布数据，切分比例为0.8 或者0.9重新创建训练作业进行训练。父主题：训练作业运行失败

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
配置ModelArts委托权限 - AI开发平台ModelArts

授权”。在弹出的“添加授权”窗口中，选择：授权对象类型：所有用户委托选择：新增委托权限配置：普通用户选择完成后勾选“我已经详细阅读并同意《ModelArts服务声明》”，然后单击“创建”。图1 配置委托访问授权完成配置后，在ModelArts控制台的权限管理列表，可查看到此账号的委托配置信息。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
报错“Permissions for 'x:/xxx.pem' are too open”如何解决？ - AI开发平台ModelArts

原因分析一：密钥文件未放在指定路径，详情请参考安全限制或VS Code文档。请参考解决方法一处理。原因分析二：当操作系统为macOS/Linux时，可能是密钥文件或放置密钥的文件夹权限问题，请参考解决方法二处理。解决方法解决方法一：请将密钥放在如下路径或其子路径下： Windows：C:\Users\{{user}}

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
训练输出路径被其他作业使用 - AI开发平台ModelArts

出路径”在被其他作业使用。处理方法一个“训练输出路径”只能被一个处于“运行中”、“排队中”或“初始化”状态的作业使用。当出现此报错时，建议检查并重新填写训练作业的“训练输出路径”，以避免创建作业失败。父主题：云上迁移适配故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
出现ModelArts.6333错误，如何处理？ - AI开发平台ModelArts

钟。由于出现此错误，常见原因是内存占用满导致的，您可以尝试使用如下方法，从根本上解决错误。方法1：将Notebook更换为更高规格的资源。方法2：可以参考如下方法调整代码中的参数，减少内存占用。如果代码调整后仍然出现内存不足的情况，请使用方法1。调用sklearn方法si

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
特权池信息数据显示均为0%如何解决？ - AI开发平台ModelArts

登录“应用运维管理”控制台，在“配置管理 > Agent管理”中，选择未安装ICAgent的集群，并单击“安装ICAgent”。图1 安装ICAgent 建议不要随意卸载ICAgent，否则会影响特权池详情页的参数显示。父主题： Lite Cluster

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
如何查看ModelArts训练作业资源占用情况？ - AI开发平台ModelArts

如何查看ModelArts训练作业资源占用情况？在ModelArts管理控制台，选择“模型训练>训练作业”，进入训练作业列表页面。在训练作业列表中，单击目标作业名称，查看该作业的详情。您可以在“资源占用情况”页签查看到如下指标信息。 CPU：CPU使用率（cpuUsage）百分比（Percent）。 MEM：物理内存

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
开启训练故障自动重启功能 - AI开发平台ModelArts

int机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权重、优化器状态、调度器状态）。即便模型训练中断，也可以基于checkpoint接续训练。当训练作业发生故障中断本次作业时，代码可自动从训练中断的位置接续训练，加载中断生成的checkpoint，中

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
查询数据集导出任务列表 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 export_type 否 Integer 导出类型，不传则默认查询所有类型的导出任务。可选值如下： 0：已标注 1：未标注 2：全部 3：条件筛选 limit 否 Integer 指定每一页返回的最大条目数，取值范围[1

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

进行了断开操作，SSH默认配置中不存在超时主动断连的动作，但是防火墙会关闭超时空闲连接（参考：http://bluebiu.com/blog/linux-ssh-session-alive.html），后台的实例运行是一直稳定的，重连即可再次连上。解决方法如果想保持长时间连接

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
查看训练作业标签 - AI开发平台ModelArts

查看训练作业标签通过给训练作业添加标签，可以标识云资源，便于快速搜索训练作业。在ModelArts管理控制台的左侧导航栏中选择“模型训练 > 训练作业”。在训练作业列表中，单击作业名称进入训练作业详情页面。在训练作业详情页面，单击“标签”页签查看标签信息。支持添加、修改

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
如何登录并上传镜像到SWR？ - AI开发平台ModelArts

登录SWR后，使用docker tag命令给上传镜像打标签。下面命令中的组织名称deep-learning，请替换为Step1中实际创建的组织名称，以下所有命令中的deep-learning都需要替换。 sudo docker tag tf-1.13.2:latest swr.example.com/deep-learning/tf-1

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
查询数据集版本详情 - AI开发平台ModelArts

数据集版本名称。 with_column_header Boolean 发布的CSV文件的第一行是否为列名，对于表格数据集有效。可选值如下： true：发布的CSV文件的第一行是列名 false：发布的CSV文件的第一行不是列名表3 LabelStats 参数参数类型描述 attributes

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
内存不足如何处理？ - AI开发平台ModelArts

运行中服务出现告警时，需要分析是您的代码是否出现漏洞导致内存溢出、是否因为业务使用量太大需要更多的内存。如果因业务原因需要更多内存，请升级在线服务选择更大内存规格的计算节点。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
Step1 创建用户组并加入用户 - AI开发平台ModelArts

Step1 创建用户组并加入用户主用户账号下面可以创建多个子账号，并对子账号的权限进行分组管理。此步骤介绍如何创建用户组、子账号、并将子账号加入用户组中。主用户登录管理控制台，单击右上角用户名，在下拉框中选择“统一身份认证”，进入IAM服务。图1 统一身份认证创建用户组。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
管理Lite Cluster节点池 - AI开发平台ModelArts

每个资源池至少需要有一个节点池，当只有一个节点池时不支持删除。查看节点池的存储配置在节点池管理的更新页面，可以查看该节点池配置的系统盘、容器盘或数据盘的磁盘类型、大小、数量、写入模式、容器引擎空间大小、挂载路径磁盘配置等参数。在Lite资源池的扩缩容页面，也可以查看节点池的存储配置信息。查找搜索节点池在节点

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
创建数据集导出任务 - AI开发平台ModelArts

数据集版本ID。当导出数据集某一版本的数据时，需要指定该参数。 with_column_header 否 Boolean 导出时是否将列名写到CSV文件的第一行，对于表格数据集有效。可选值如下： true：导出时将列名写到CSV文件的第一行（默认值） false：导出时不将列名写到CSV文件的第一行表3

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）

总条数： 2400

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在ModelArts中部署模型时，为什么无法选择Ascend Snt3资源？ - AI开发平台ModelArts

训练权重转换说明 - AI开发平台ModelArts

【下线公告】华为云ModelArts自动学习下线公告 - AI开发平台ModelArts

订阅算法物体检测YOLOv3 - AI开发平台ModelArts

配置ModelArts委托权限 - AI开发平台ModelArts

报错“Permissions for 'x:/xxx.pem' are too open”如何解决？ - AI开发平台ModelArts

训练输出路径被其他作业使用 - AI开发平台ModelArts

出现ModelArts.6333错误，如何处理？ - AI开发平台ModelArts

特权池信息数据显示均为0%如何解决？ - AI开发平台ModelArts

如何查看ModelArts训练作业资源占用情况？ - AI开发平台ModelArts

开启训练故障自动重启功能 - AI开发平台ModelArts

查询数据集导出任务列表 - AI开发平台ModelArts

VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

查看训练作业标签 - AI开发平台ModelArts

如何登录并上传镜像到SWR？ - AI开发平台ModelArts

查询数据集版本详情 - AI开发平台ModelArts

内存不足如何处理？ - AI开发平台ModelArts

Step1 创建用户组并加入用户 - AI开发平台ModelArts

管理Lite Cluster节点池 - AI开发平台ModelArts

创建数据集导出任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线