搜索_华为云

VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

进行了断开操作，SSH默认配置中不存在超时主动断连的动作，但是防火墙会关闭超时空闲连接（参考：http://bluebiu.com/blog/linux-ssh-session-alive.html），后台的实例运行是一直稳定的，重连即可再次连上。解决方法如果想保持长时间连接

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
测试用户权限 - AI开发平台ModelArts

Turbo中单击右上角的“创建文件系统”，如果能正常打开页面，表示当前用户具备SFS的操作权限。验证ECS权限。在左上角的服务列表中，选择ECS服务，进入ECS管理控制台。在ECS管理控制台，单击右上角的“购买弹性云服务器”，如果能正常打开页面，表示当前用户具备ECS的操作权限。验证VPC权限。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
查询数据集详情 - AI开发平台ModelArts

数据集版本名称。 with_column_header Boolean 发布的CSV文件的第一行是否为列名，对于表格数据集有效。可选值如下： true：发布的CSV文件的第一行是列名 false：发布的CSV文件的第一行不是列名表10 LabelStats 参数参数类型描述 attributes

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
内存不足如何处理？ - AI开发平台ModelArts

运行中服务出现告警时，需要分析是您的代码是否出现漏洞导致内存溢出、是否因为业务使用量太大需要更多的内存。如果因业务原因需要更多内存，请升级在线服务选择更大内存规格的计算节点。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
Step1 创建用户组并加入用户 - AI开发平台ModelArts

Step1 创建用户组并加入用户主用户账号下面可以创建多个子账号，并对子账号的权限进行分组管理。此步骤介绍如何创建用户组、子账号、并将子账号加入用户组中。主用户登录管理控制台，单击右上角用户名，在下拉框中选择“统一身份认证”，进入IAM服务。图1 统一身份认证创建用户组。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
管理Lite Cluster节点池 - AI开发平台ModelArts

每个资源池至少需要有一个节点池，当只有一个节点池时不支持删除。查看节点池的存储配置在节点池管理的更新页面，可以查看该节点池配置的系统盘、容器盘或数据盘的磁盘类型、大小、数量、写入模式、容器引擎空间大小、挂载路径磁盘配置等参数。在Lite资源池的扩缩容页面，也可以查看节点池的存储配置信息。查找搜索节点池在节点

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
创建数据集导出任务 - AI开发平台ModelArts

数据集版本ID。当导出数据集某一版本的数据时，需要指定该参数。 with_column_header 否 Boolean 导出时是否将列名写到CSV文件的第一行，对于表格数据集有效。可选值如下： true：导出时将列名写到CSV文件的第一行（默认值） false：导出时不将列名写到CSV文件的第一行表3

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
数据准备与处理 - AI开发平台ModelArts

导入数据到ModelArts数据集处理ModelArts数据集中的数据标注ModelArts数据集中的数据发布ModelArts数据集中的数据版本分析ModelArts数据集中的数据特征导出ModelArts数据集中的数据入门案例：快速创建一个物体检测的数据集

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
Standard镜像相关 - AI开发平台ModelArts

注意事项？镜像在SWR上显示只有13G，安装少量的包，然后镜像保存过程会提示超过35G大小保存失败，为什么？如何保证自定义镜像能不因为超过35G而保存失败？如何减小本地或ECS构建镜像的目的镜像的大小？镜像过大，卸载原来的包重新打包镜像，最终镜像会变小吗？在ModelA

帮助中心 > AI开发平台ModelArts > 常见问题
用户创建模型时构建镜像或导入文件失败 - AI开发平台ModelArts

用户授予OBS的系统权限。子用户的IAM权限是由其主用户设置的，如果主用户没有赋予OBS的putObjectAcl权限即会导致创建模型构建失败。处理方法了解ModelArts依赖的OBS权限自定义策略，请参见ModelArts依赖的OBS权限自定义策略样例。在统一身份认证服

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

3567：用户只能访问自己账号下的obs目录，ModelArts在读取其他用户obs下的数据时，需要用户委托权限，没有创建委托，就没有权限使用其他用户obs中的数据。登录ModelArts控制台，管理控制台，在左侧导航栏中选择“权限管理”，单击“查看权限”，检查是否配置了obs的委托权限。图1

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
日志提示“label - AI开发平台ModelArts

pbtxt。原因分析算法要求标注框为矩形标注框，提供的数据标注为非矩形，因此导致该错误发生。处理方法请您将数据的标注改为矩形的标注框。建议与总结在训练作业前，推荐您检查数据的标注是否符合算法要求（如物体检测类算法的标注框为矩形标注框）。父主题：预置算法运行故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
GPU业务迁移至昇腾训练推理 - AI开发平台ModelArts

GPU业务迁移至昇腾训练推理 ModelArts昇腾迁移调优工具总览 GPU训练业务迁移至昇腾的通用指导基于AIGC模型的GPU推理业务迁移至昇腾指导 GPU推理业务迁移至昇腾的通用指导基于advisor的昇腾训练性能自助调优指导 Dit模型PyTorch迁移与精度性能调优 msprobe工具使用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践
无法导入模块 - AI开发平台ModelArts

xxx”的报错，可以判断是环境中没有包含用户依赖的python包。处理方法训练作业导入模块时日志出现前两条报错信息，处理方法如下：首先保证被导入的module中有“__init__.py”存在，创建“module_dir”的“__init__.py”，如原因分析中的结构所示。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
文生图模型训练推理 - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） SDXL基于DevServer适配PyTorch NPU的Finetune训练指导（6.3.905） SDXL基于DevServer适配PyTorch NPU的LoRA训练指导（6.3.905） SD1

帮助中心 > AI开发平台ModelArts > 最佳实践
将模型部署为实时推理作业 - AI开发平台ModelArts

将模型部署为实时推理作业实时推理的部署及使用流程部署模型为在线服务访问在线服务支持的认证方式访问在线服务支持的访问通道访问在线服务支持的传输协议父主题：使用ModelArts Standard部署模型并推理预测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
代码运行故障 - AI开发平台ModelArts

kernel，并导致实例崩溃如何解决训练过程中出现的cudaCheckError错误？如何处理使用opencv.imshow造成的内核崩溃？使用Windows下生成的文本文件时报错找不到路径？创建Notebook文件后，右上角的Kernel状态为“No Kernel”如何处理？

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
Studio - AI开发平台ModelArts
Studio - AI开发平台ModelArts

重校验失败使用AWQ或SQ压缩后的模型新增版本时，权重校验失败使用Qwen2.5-72B-1K、Qwen2.5-32B调优的Checkpoint创建模型时，权重校验失败创建Qwen2-0.5B或Qwen2-1.5B模型的LoRA微调类型的调优任务，显示创建失败创建训练任务，显示创建失败

 帮助中心 > AI开发平台ModelArts > 常见问题
数据管理（旧版） - AI开发平台ModelArts

查询智能标注的样本列表查询单个智能标注样本的信息分页查询智能任务列表启动智能任务获取智能任务的信息停止智能任务查询处理任务列表创建处理任务查询数据处理的算法类别查询处理任务详情更新处理任务删除处理任务查询数据处理任务的版本列表创建数据处理任务版本查询数据处理任务的版本详情

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API
训练作业进程被kill - AI开发平台ModelArts

在开发环境（notebook）申请相同规格的开发环境实例。在notebook调试用户代码，并找出问题的代码段。通过关键代码段 + 退出码尝试去搜索引擎寻找解决办法。，通过训练日志排查问题通过日志判断出问题的代码范围。修改代码，在问题代码段添加打印，输出更详细的日志信息。再次运行作业，判断出问题的代码段。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题

总条数： 2394

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

测试用户权限 - AI开发平台ModelArts

查询数据集详情 - AI开发平台ModelArts

内存不足如何处理？ - AI开发平台ModelArts

Step1 创建用户组并加入用户 - AI开发平台ModelArts

管理Lite Cluster节点池 - AI开发平台ModelArts

创建数据集导出任务 - AI开发平台ModelArts

数据准备与处理 - AI开发平台ModelArts

Standard镜像相关 - AI开发平台ModelArts

用户创建模型时构建镜像或导入文件失败 - AI开发平台ModelArts

批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

日志提示“label - AI开发平台ModelArts

GPU业务迁移至昇腾训练推理 - AI开发平台ModelArts

无法导入模块 - AI开发平台ModelArts

文生图模型训练推理 - AI开发平台ModelArts

将模型部署为实时推理作业 - AI开发平台ModelArts

代码运行故障 - AI开发平台ModelArts

Studio - AI开发平台ModelArts

数据管理（旧版） - AI开发平台ModelArts

训练作业进程被kill - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线