搜索_华为云

资源池创建失败的原因与解决方法？ - AI开发平台ModelArts

资源池创建失败的原因与解决方法？本文主要介绍在ModelArts资源池创建失败时，如何查找失败原因，并解决问题。问题定位您可以参考以下步骤，查看资源池创建失败的报错信息，并根据相应的解决方法解决问题：登录ModelArts控制台，单击弹性集群，单击资源池列表上方的“操作记录”查看创建失败的资源池。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
删除标注团队 - AI开发平台ModelArts

删除标注团队功能介绍删除标注团队。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI DELETE /v2/{project_id}/workforces/{workforce_id}

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

bashrc 如果继续使用ma-user，在使用其他属组如root用户上传的数据和文件时，可能会存在权限不足的问题，因此需要执行如下命令统一文件属主。 sudo chown -R ma-user:ma-group ${container_work_dir} # ${contain

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 准备工作
模型转换报错如何查看日志和定位？ - AI开发平台ModelArts

模型转换报错如何查看日志和定位？通过如下的配置项打开对应的模型转换日志，可以看到更底层的报错。如配置以下的环境变量之后，再重新转换模型，导出对应的日志和dump图进行分析：报错日志中搜到“not support onnx data type”，表示MindSpore暂不支持该算子。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 常见问题
如何安装C++的依赖库？ - AI开发平台ModelArts

如何安装C++的依赖库？在训练作业的过程中，会使用到第三方库。以C++为例，请参考如下操作步骤进行安装：将源码下载至本地并上传到OBS。使用OBS客户端上传文件的操作请参见上传文件。将上传到OBS的源码使用Moxing复制到开发环境Notebook中。以下为使用EVS挂载

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 编写训练代码
SDXL WebUI基于Devserver适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

如下信息。图5 服务端返回信息带controlnet运行，默认使用canny。图6 带controlnet运行可以观察到输出的图片与canny输入图片很相近，坐姿和样子比较符合，如下图所示。图7 文生图使用后台API调用文生图接口。 curl -kv -X POST

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

操作步骤本案例场景为单机单卡场景下使用Notebook进行代码调试，数据和代码存储在OBS服务的并行文件系统下，调试完成过后可保存镜像。使用主用户账号登录管理控制台，单击右上角用户名，在下拉框中选择“统一身份认证”，进入统一身份认证（IAM）服务。添加开发环境使用权限和依赖服务S

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
保存Notebook实例 - AI开发平台ModelArts

保存Notebook实例通过预置的镜像创建Notebook实例，在基础镜像上安装对应的自定义软件和依赖，在管理页面上进行操作，进而完成将运行的实例环境以容器镜像的方式保存下来。镜像保存后，默认工作目录是根目录“/”路径。保存的镜像中，安装的依赖包不丢失，持久化存储的部分（ho

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
预置框架启动文件的启动流程说明 - AI开发平台ModelArts

先在相同节点上启动一个parameter server（以下简称ps）和一个worker，平台会自动1:1分配ps与worker任务，例如2机场景，则会分配2ps与2 worker任务；并为启动文件额外注入--task_index <VC_TASK_INDEX> --ps_hosts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
查询预置算法 - AI开发平台ModelArts

查询预置算法功能介绍查看预置模型的详情。 URI GET /v1/{project_id}/built-in-algorithms 参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

bashrc 如果继续使用ma-user，在使用其他属组如root用户上传的数据和文件时，可能会存在权限不足的问题，因此需要执行如下命令统一文件属主。 sudo chown -R ma-user:ma-group ${container_work_dir} # ${contain

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 准备工作
查询标注团队详情 - AI开发平台ModelArts

查询标注团队详情功能介绍查询标注团队详情。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/workforces/{workforce_id}

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
获取超参敏感度分析结果 - AI开发平台ModelArts

获取超参敏感度分析结果功能介绍获取超参敏感度分析结果的汇总表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/trai

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
附录：指令微调训练常见问题 - AI开发平台ModelArts

附录：指令微调训练常见问题问题1：在训练过程中遇到NPU out of memory 解决方法：将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考各个模型深度学习训

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
发布镜像到AI Gallery - AI开发平台ModelArts

发布镜像到AI Gallery 除了Gallery提供的已有资产外，还可以将个人创建的资产发布至Gallery货架上，供其他AI开发者使用，实现资产共享。 AI Gallery当前只支持将模型资产、数据集或镜像资产托管至货架进行管理。镜像资产上架登录AI Gallery，选择右上角“我的Gallery”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery镜像
GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

GPU A系列裸金属服务器RoCE带宽不足如何解决？问题现象 GP Ant8支持RoCE网卡， Ubuntu20.04场景，在进行nccl-tests时，总线带宽理论峰值可达90GB/s，但实际测试下来的结果只有35GB/s。原因分析 “nv_peer_mem”是一个Linu

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
训练作业卡死检测 - AI开发平台ModelArts

训练作业卡死检测什么是训练作业卡死检测训练作业在运行中可能会因为某些未知原因导致作业卡死，如果不能及时发现，就会导致无法及时释放资源，从而造成极大的资源浪费。为了节省训练资源成本，提高使用体验，ModelArts提供了卡死检测功能，能自动识别作业是否卡死，并在日志详情界面上展

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
获取用户绑定APP的api列表 - AI开发平台ModelArts

获取用户绑定APP的api列表功能介绍获取用户绑定app的API列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
moondream2基于DevServer适配PyTorch NPU推理指导 - AI开发平台ModelArts

moondream2基于DevServer适配PyTorch NPU推理指导方案概览本文档从模型部署的环境配置、模型转换、模型推理等方面进行介绍moondream2模型在ModelArts DevServer上部署，支持NPU推理场景。本方案目前仅适用于部分企业客户，完成本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

以PyTorch框架创建训练作业（新版训练）本节通过调用一系列API，以训练模型为例介绍ModelArts API的使用流程。概述使用PyTorch框架创建训练作业的流程如下：调用认证鉴权接口获取用户Token，在后续的请求中需要将Token放到请求消息头中作为认证。调

 帮助中心 > AI开发平台ModelArts > API参考 > 应用示例

总条数： 1262

上一页
1
...
55
56
57
...
64
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

资源池创建失败的原因与解决方法？ - AI开发平台ModelArts

删除标注团队 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

模型转换报错如何查看日志和定位？ - AI开发平台ModelArts

如何安装C++的依赖库？ - AI开发平台ModelArts

SDXL WebUI基于Devserver适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

保存Notebook实例 - AI开发平台ModelArts

预置框架启动文件的启动流程说明 - AI开发平台ModelArts

查询预置算法 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

查询标注团队详情 - AI开发平台ModelArts

获取超参敏感度分析结果 - AI开发平台ModelArts

附录：指令微调训练常见问题 - AI开发平台ModelArts

发布镜像到AI Gallery - AI开发平台ModelArts

GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

训练作业卡死检测 - AI开发平台ModelArts

获取用户绑定APP的api列表 - AI开发平台ModelArts

moondream2基于DevServer适配PyTorch NPU推理指导 - AI开发平台ModelArts

以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线