搜索_华为云

训练作业卡死检测 - AI开发平台ModelArts

"INFO"，查看NCCL DEBUG信息。问题现象1 日志中还未出现NCCL DEBUG信息时已卡死。解决方案1 检查代码，检查是否有参数中未传入“master_ip”和“rank”参数等问题。问题现象2 分布式训练的日志中，发现有的节点含有GDR信息，而有的节点无GDR信息，导致卡死的原因可能为GDR。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
如何调用API - AI开发平台ModelArts

如何调用API 构造请求认证鉴权返回结果

 帮助中心 > AI开发平台ModelArts > API参考
VS Code连接远端Notebook时报错“XHR failed” - AI开发平台ModelArts

原因分析可能是所在环境的网络有问题，无法自动下载VS Code Server，请手动安装。解决方法打开VS Code，选择“Help>About”，并记下“Commit”的ID码。确认创建Notebook实例使用的镜像的系统架构，可以在Notebook中打开Terminal，通过命令uname

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
导出ModelArts数据集中的数据到AI Gallery - AI开发平台ModelArts

查看数据集资产发布信息在数据集列表中，单击某个数据集名称进入数据集详情页。选中右上角“发布 > 资产发布列表”，可以查看资产发布记录。发布成功后，会生成资产链接，用户可以单击链接跳转到资产的详情页面。删除发布的数据集当您需要删除发布在AI Gallery中的数据集时，可以执行如下步骤进行删除。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导出ModelArts数据集中的数据
动态shape - AI开发平台ModelArts
动态shape - AI开发平台ModelArts

动态shape 在某些推理场景中，模型输入的shape可能是不固定的，因此需要支持用户指定模型的动态shape，并能够在推理中接收多种shape的输入。在CPU上进行模型转换时无需考虑动态shape问题，因为CPU算子支持动态shape；而在Ascend场景上，算子需要指定具体的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

Cluster资源池节点故障如何定位故障说明和处理建议图1 Lite池故障处理流程对于ModelArts Lite资源池，每个节点会以DaemonSet方式部署node-agent组件，该组件会检测节点状态，并将检测结果写到K8S NodeCondtition中。同时，节点故障指标

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

准备训练数据中下载的MNIST数据集压缩包文件到OBS的“mnist-data”文件夹中。上传数据到OBS中时，请不要加密，否则会导致训练失败。文件无需解压，直接上传压缩包至OBS中即可。上传训练脚本“train.py”到“mnist-code”文件夹中。上传推理脚本“customize_service.py”和推理配置文件“config

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练
Standard模型部署 - AI开发平台ModelArts

边等各种设备。一键部署，可以直接推送部署到边缘设备中，选择智能边缘节点，推送模型。 ModelArts基于Snt3高性能AI推理芯片的深度优化，具有PB级别的单日推理数据处理能力，支持发布云上推理的API百万个以上，推理网络时延毫秒。父主题： Standard功能介绍

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
返回结果 - AI开发平台ModelArts
返回结果 - AI开发平台ModelArts

"error_code": "AS.0001" } 其中，error_code表示错误码，error_msg表示错误描述信息，具体请参见错误码。父主题：如何调用API

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
训练作业访问OBS时，日志提示“stat:403 reason:Forbidden” - AI开发平台ModelArts

of <moxing.framework.file.src.obs.client.ObsClient object at 0x7fddb4ad06d0>> args=('bucket-cv-competition-bj4', 'fangjiemin/output/') kwargs={}

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 权限问题
查询OS的配置参数 - AI开发平台ModelArts

查询OS的配置参数功能介绍获取ModelArts OS服务的配置参数，如网络网段，用户资源配额等。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
构造请求 - AI开发平台ModelArts
构造请求 - AI开发平台ModelArts

构造请求本节介绍REST API请求的组成，并以调用IAM服务的获取用户Token接口说明如何调用API，Token可以用于调用其他API时的鉴权。您还可以通过这个视频教程了解如何构造请求调用API：https://bbs.huaweicloud.com/videos/102987

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
认证鉴权 - AI开发平台ModelArts
认证鉴权 - AI开发平台ModelArts

oject级别的Token，即调用获取用户Token接口时，请求body中“auth.scope”的取值需要选择“project”，请求示例如下所示。在构造请求中以调用获取用户Token接口为例说明了如何调用API。 { "auth": { "identity": {

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
查询OS的配额 - AI开发平台ModelArts

查询OS的配额功能介绍获取ModelArts OS服务中部分资源的配额，如资源池配额、网络配额等。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1

帮助中心 > AI开发平台ModelArts > API参考 > 配额管理
GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？场景描述本文指导如何进行节点内NVLINK带宽性能测试，适用的环境为：Ant8或者Ant1 GPU裸金属服务器，且服务器中已经安装相关GPU驱动软件，以及Pytorch2.0。 GPU A系列裸金属服务器

 帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
创建在线服务包 - AI开发平台ModelArts

创建在线服务包功能介绍计费工作流购买资源。接口约束无调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/workfl

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
如何获取访问密钥？ - AI开发平台ModelArts

如何获取访问密钥？获取访问密钥登录华为云，在页面右上方单击“控制台”，进入华为云管理控制台。图1 控制台入口在控制台右上角的账户名下方，单击“我的凭证”，进入“我的凭证”页面。图2 我的凭证在“我的凭证”页面，选择“访问密钥>新增访问密钥”，如图3所示。图3 单击新增访问密钥

 帮助中心 > AI开发平台ModelArts > 常见问题 > 权限相关
如何查看ModelArts消费详情？ - AI开发平台ModelArts

如何查看ModelArts消费详情？在“费用中心”，您可以根据需求按照账期、产品类型等查询ModelArts的消费详情。本章节以查询“账单详情”为例指导您查看计费情况，如需了解更多的账单情况，请参见查看费用账单。查询方法：单击右上方的“费用中心 > 费用账单”进入费用中心详情页面，在左侧导航栏选择“账单管理

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

基于Socket.IO），地址栏中填入从服务详情页“调用指南”页签中获取“API接口调用公网地址”后面的地址。如果自定义镜像中有更细粒度的地址，则在地址后面追加该URL。如果有queryString，那么在params栏中添加参数。在header中添加认证信息（不同认证方式有不同

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
版本说明和要求 - AI开发平台ModelArts

AscendCloud-6.3.912-xxx.zip 说明：软件包名称中的xxx表示时间戳。包含了本教程中使用到的推理部署代码和推理评测代码、推理依赖的算子包。代码包具体说明请参见软件包结构说明。获取路径：Support-E，在此路径中查找下载ModelArts 6.3.912 版本。说明：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）

总条数： 2033

上一页
1
...
5
6
7
...
102
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练作业卡死检测 - AI开发平台ModelArts

如何调用API - AI开发平台ModelArts

VS Code连接远端Notebook时报错“XHR failed” - AI开发平台ModelArts

导出ModelArts数据集中的数据到AI Gallery - AI开发平台ModelArts

动态shape - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

Standard模型部署 - AI开发平台ModelArts

返回结果 - AI开发平台ModelArts

训练作业访问OBS时，日志提示“stat:403 reason:Forbidden” - AI开发平台ModelArts

查询OS的配置参数 - AI开发平台ModelArts

构造请求 - AI开发平台ModelArts

认证鉴权 - AI开发平台ModelArts

查询OS的配额 - AI开发平台ModelArts

GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

创建在线服务包 - AI开发平台ModelArts

如何获取访问密钥？ - AI开发平台ModelArts

如何查看ModelArts消费详情？ - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

版本说明和要求 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线