搜索_华为云

ECS获取和上传基础镜像 - AI开发平台ModelArts

获取训练镜像请确保在正确的Region下获取镜像。建议使用官方提供的镜像部署训练服务。镜像地址{image_url}请参见表1。 docker pull {image_url} Step5 在ECS中Docker登录在SWR中单击右上角的“登录指令”，然后在跳出的登录指定窗口，单击复

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作 > 准备镜像
报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

750 /home/ma-user 排查密钥是否是和实例绑定的一致。停止实例，进入实例详情页。更新密钥：单击“认证”旁边的编辑按钮，然后单击“立即创建”创建并选择新密钥。重新使用VS Code连接实例，选择新创建的密钥。父主题： VS Code连接开发环境失败故障处理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

准备数据自动学习的每个项目对数据有哪些要求？创建预测分析自动学习项目时，对训练数据有什么要求？使用从OBS选择的数据创建表格数据集如何处理Schema信息？物体检测或图像分类项目支持对哪些格式的图片进行标注和训练？父主题： Standard自动学习

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
查询节点池列表 - AI开发平台ModelArts

Integer 资源规格的弹性使用量，物理池该值和count相同。 azs Array of azs objects 资源所在的AZ的数量。 nodePool String 节点池名称。比如：nodePool-1。表15 azs 参数参数类型描述 az String AZ的名称。 count

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
AIGC模型训练推理 - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） SDXL基于DevServer适配PyTorch NPU的Finetune训练指导（6.3.905） SDXL基于DevServer适配PyTorch NPU的LoRA训练指导（6.3.905） SDXL

帮助中心 > AI开发平台ModelArts > 最佳实践
ECS获取和上传基础镜像 - AI开发平台ModelArts

获取训练镜像请确保在正确的Region下获取镜像。建议使用官方提供的镜像部署训练服务。镜像地址{image_url}请参见表1。 docker pull {image_url} Step5 在ECS中Docker登录在SWR中单击右上角的“登录指令”，然后在跳出的登录指定窗口，单击复

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 准备工作 > 准备镜像
查询数据集标签列表 - AI开发平台ModelArts

@modelarts:color String 内置属性：标签展示的颜色，为色彩的16进制代码，默认为空。例如：“#FFFFF0”。 @modelarts:default_shape String 内置属性：物体检测标签的默认形状（物体检测标签专用属性），默认为空。可选值如下： bndbox：矩形。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
停止训练作业版本 - AI开发平台ModelArts

error_message String 调用失败时的错误信息。调用成功时无此字段。 error_code String 调用失败时的错误码，具体请参见错误码。调用成功时无此字段。请求示例如下以停止“job_id”为10，“version_id”为10的作业版本为例。 POST htt

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
总览Workflow工作流 - AI开发平台ModelArts

在创建并使用的工作空间，以实际取值为准。 search_type 否 String 过滤方式。可选值如下： equal表示精确匹配。 contain表示模糊匹配。具体过滤的字段，由各个接口额外定义参数。例如Workflow支持按照名称（name）进行过滤，则相应的过滤字段为na

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
服务启动后，状态断断续续处于“告警中” - AI开发平台ModelArts

to process the new request 原因分析该报错是因为发送预测请求后，服务出现停止后又启动的情况。处理方法需要您检查服务使用的镜像，确定服务停止的原因，修复问题。重新创建模型部署服务。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

of strings 允许通过SSH协议访问Notebook的公网IP地址白名单列表，默认都可以访问。当配置指定IP后，则仅允许IP所在的客户端实现对Notebook的访问。 dev_service String 支持的服务，枚举值如下： NOTEBOOK：可以通过https协议访问Notebook

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
读取文件报错，如何正确读取文件 - AI开发平台ModelArts

在ModelArts中，用户的数据都是存放在OBS桶中，而训练作业运行在容器中，无法通过访问本地路径的方式访问OBS桶中的文件。处理方法读取文件报错，您可以使用Moxing将数据复制至容器中，再直接访问容器中的数据。请参见步骤1。您也可以根据不同的文件类型，进行读取。请参见读

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

py中添加一行代码os.system('nvcc -V)查看该镜像的cuda版本（customize_service.py编写指导请见模型推理代码编写说明）。确认该cuda版本与您安装的mmcv版本是否匹配。部署时是否需要使用GPU，取决于的模型需要用到CPU还是GPU，以及推理脚本如何编写。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
删除训练作业版本 - AI开发平台ModelArts

project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 job_id 是 Long 训练作业的ID。 version_id 是 Long 训练作业的版本ID。请求消息无请求参数。响应消息响应参数如表2所示。表2 响应参数参数参数类型说明 is_success

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
查询用户所有DevServer实例列表 - AI开发平台ModelArts

of strings 允许通过SSH协议访问Notebook的公网IP地址白名单列表，默认都可以访问。当配置指定IP后，则仅允许IP所在的客户端实现对Notebook的访问。 dev_service String 支持的服务，枚举值如下： NOTEBOOK：可以通过https协议访问Notebook

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
查询数据集导入任务列表 - AI开发平台ModelArts

String 用户GaussDB(DWS)集群的IP地址。 port String 用户GaussDB(DWS)集群的端口。 queue_name String 表格数据集，DLI队列名。 subnet_id String MRS集群的子网ID。 table_name String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Lite Server资源使用 - AI开发平台ModelArts

Lite Server资源使用 LLM/AIGC/数字人基于Server适配NPU的训练推理指导 GPT-2基于Server适配PyTorch GPU的训练推理指导

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server）
创建网络 - AI开发平台ModelArts
创建网络 - AI开发平台ModelArts

列单击“启动IPv6”，如图3 打通VPC前，需要保证ModelArts网络和您的VPC网络都已开启IPv6，IPv6才会生效。若是打通VPC后，才开启ModelArts网络的IPv6或VPC网络的IPv6，此时需要重新打通VPC及子网，IPv6才会生效。图2 创建网络图3 启动IPv6

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练启动脚本说明和参数配置训练的数据集预处理说明训练的权重转换说明训练tokenizer文件说明父主题：主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）
训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练启动脚本说明和参数配置训练的数据集预处理说明训练的权重转换说明训练tokenizer文件说明父主题：主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）

总条数： 2154

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ECS获取和上传基础镜像 - AI开发平台ModelArts

报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

查询节点池列表 - AI开发平台ModelArts

AIGC模型训练推理 - AI开发平台ModelArts

ECS获取和上传基础镜像 - AI开发平台ModelArts

查询数据集标签列表 - AI开发平台ModelArts

停止训练作业版本 - AI开发平台ModelArts

总览Workflow工作流 - AI开发平台ModelArts

服务启动后，状态断断续续处于“告警中” - AI开发平台ModelArts

实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

读取文件报错，如何正确读取文件 - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

删除训练作业版本 - AI开发平台ModelArts

查询用户所有DevServer实例列表 - AI开发平台ModelArts

查询数据集导入任务列表 - AI开发平台ModelArts

Lite Server资源使用 - AI开发平台ModelArts

创建网络 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线