搜索_华为云

报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

750 /home/ma-user 排查密钥是否是和实例绑定的一致。停止实例，进入实例详情页。更新密钥：单击“认证”旁边的编辑按钮，然后单击“立即创建”创建并选择新密钥。重新使用VS Code连接实例，选择新创建的密钥。父主题： VS Code连接开发环境失败故障处理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

ServerResponse objects DevServer实例列表。 pages Integer 总的页数。 size Integer 每一页的数量。 total Long 总的记录数量。表4 ServerResponse 参数参数类型描述 create_at Long 创建时间。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
文生图模型训练推理 - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） SDXL基于Lite Server适配PyTorch NPU的Finetune训练指导（6.3.905） SDXL基于Lite Server适配PyTorch NPU的LoRA训练指导（6.3.905）

帮助中心 > AI开发平台ModelArts > 最佳实践
查询数据集标签列表 - AI开发平台ModelArts

@modelarts:color String 内置属性：标签展示的颜色，为色彩的16进制代码，默认为空。例如：“#FFFFF0”。 @modelarts:default_shape String 内置属性：物体检测标签的默认形状（物体检测标签专用属性），默认为空。可选值如下： bndbox：矩形。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询训练作业镜像保存任务 - AI开发平台ModelArts

可以基于保存的镜像创建训练作业。 message String 镜像创建的时间，UTC毫秒。 create_time Long 镜像保存操作过程中，展示构建信息。请求示例如下以查询uuid为2cd88daa-31a4-40a8-a58f-d186b0e93e4f的训练作业对应worker-0镜像保存任务为例。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
停止训练作业版本 - AI开发平台ModelArts

error_message String 调用失败时的错误信息。调用成功时无此字段。 error_code String 调用失败时的错误码，具体请参见错误码。调用成功时无此字段。请求示例如下以停止“job_id”为10，“version_id”为10的作业版本为例。 POST htt

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
总览Workflow工作流 - AI开发平台ModelArts

在创建并使用的工作空间，以实际取值为准。 search_type 否 String 过滤方式。可选值如下： equal表示精确匹配。 contain表示模糊匹配。具体过滤的字段，由各个接口额外定义参数。例如Workflow支持按照名称（name）进行过滤，则相应的过滤字段为na

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
查询数据集导入任务列表 - AI开发平台ModelArts

String 用户GaussDB(DWS)集群的IP地址。 port String 用户GaussDB(DWS)集群的端口。 queue_name String 表格数据集，DLI队列名。 subnet_id String MRS集群的子网ID。 table_name String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

用系统默认里面自带的。如果必须指定卡ID，需要注意1/2/4规格下，指定的卡ID与实际分配的卡ID不匹配的情况。如果上述方法还出现了错误，可以去notebook里面调试打印CUDA_VISIBLE_DEVICES变量，或者用以下代码测试，查看结果是否返回的是True。 import

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
服务启动后，状态断断续续处于“告警中” - AI开发平台ModelArts

to process the new request 原因分析该报错是因为发送预测请求后，服务出现停止后又启动的情况。处理方法需要您检查服务使用的镜像，确定服务停止的原因，修复问题。重新创建模型部署服务。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
查询用户所有DevServer实例列表 - AI开发平台ModelArts

ServerResponse objects DevServer实例列表。 pages Integer 总的页数。 size Integer 每一页的数量。 total Long 总的记录数量。表4 ServerResponse 参数参数类型描述 create_at Long 创建时间。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
创建网络 - AI开发平台ModelArts
创建网络 - AI开发平台ModelArts

列单击“启动IPv6”，如图3 打通VPC前，需要保证ModelArts网络和您的VPC网络都已开启IPv6，IPv6才会生效。若是打通VPC后，才开启ModelArts网络的IPv6或VPC网络的IPv6，此时需要重新打通VPC及子网，IPv6才会生效。图2 创建网络图3 启动IPv6

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

py中添加一行代码os.system('nvcc -V)查看该镜像的cuda版本（customize_service.py编写指导请见模型推理代码编写说明）。确认该cuda版本与您安装的mmcv版本是否匹配。部署时是否需要使用GPU，取决于的模型需要用到CPU还是GPU，以及推理脚本如何编写。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
删除训练作业版本 - AI开发平台ModelArts

project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 job_id 是 Long 训练作业的ID。 version_id 是 Long 训练作业的版本ID。请求消息无请求参数。响应消息响应参数如表2所示。表2 响应参数参数参数类型说明 is_success

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
准备模型训练代码 - AI开发平台ModelArts

准备模型训练代码预置框架启动文件的启动流程说明开发用于预置框架训练的代码开发用于自定义镜像训练的代码自定义镜像训练作业配置节点间SSH免密互信父主题：使用ModelArts Standard训练模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
在Notebook中使用Moxing命令 - AI开发平台ModelArts

MoXing Framework功能介绍 Notebook中快速使用MoXing mox.file与本地接口的对应关系和切换 MoXing常用操作的样例代码 MoXing进阶用法的样例代码父主题：使用Notebook进行AI开发调试

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
Lite Server资源使用 - AI开发平台ModelArts

Lite Server资源使用 LLM/AIGC/数字人基于Server适配NPU的训练推理指导 GPT-2基于Server适配PyTorch GPU的训练推理指导

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server）
上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

镜像构建及调试与单机单卡相同。上传镜像，参考单机单卡训练的上传镜像章节操作。准备数据登录coco数据集下载官网地址：https://cocodataset.org/#download 下载coco2017数据集的Train（18GB）、Val images（1GB）、Train/Val

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机多卡
创建模型失败，提示模型镜像构建任务超时，没有构建日志 - AI开发平台ModelArts

timed out”提示，不显示详细的构建日志。处理方法预先准备需要编译下载的依赖包，减少依赖包下载和编译的时间。可通过线下wheel包方式安装运行环境依赖。线下wheel包安装，需确保wheel包与模型文件放在同一目录。优化模型代码，提高构建模型镜像的编译效率。父主题：模型管理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练启动脚本说明和参数配置训练的数据集预处理说明训练的权重转换说明训练tokenizer文件说明父主题：主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）

总条数： 2290

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

文生图模型训练推理 - AI开发平台ModelArts

查询数据集标签列表 - AI开发平台ModelArts

查询训练作业镜像保存任务 - AI开发平台ModelArts

停止训练作业版本 - AI开发平台ModelArts

总览Workflow工作流 - AI开发平台ModelArts

查询数据集导入任务列表 - AI开发平台ModelArts

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

服务启动后，状态断断续续处于“告警中” - AI开发平台ModelArts

查询用户所有DevServer实例列表 - AI开发平台ModelArts

创建网络 - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

删除训练作业版本 - AI开发平台ModelArts

准备模型训练代码 - AI开发平台ModelArts

在Notebook中使用Moxing命令 - AI开发平台ModelArts

Lite Server资源使用 - AI开发平台ModelArts

上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

创建模型失败，提示模型镜像构建任务超时，没有构建日志 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线