搜索_华为云

GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

autoremove --purge *nccl* 删除原nccl-test的编译后文件。由于nccl-test make编译也是基于当前cuda12.0版本的。当cuda版本更换后，需要重新编译，因此删除它。默认该文件在/root/nccl-tests直接删除即可。从内核中卸载nvidia相关的所有进程。

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
删除AppCode - AI开发平台ModelArts
删除AppCode - AI开发平台ModelArts

删除AppCode 功能介绍删除指定API网关应用的指定的AppCode，只有APP的创建用户才可以删除AppCode，且只有共享/专享版APIG的APP才支持AppCode。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
重置AppCode - AI开发平台ModelArts
重置AppCode - AI开发平台ModelArts

重置AppCode 功能介绍重置指定API网关应用的指定的AppCode，只有APP的创建用户才可以重置AppCode，且只有共享/专享版APIG的APP才支持AppCode。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
增加AppCode - AI开发平台ModelArts
增加AppCode - AI开发平台ModelArts

增加AppCode 功能介绍为指定API网关应用创建新的AppCode，只有APP的创建用户才可以创建AppCode，且只有共享/专享版APIG的APP才能创建AppCode。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
Standard资源池节点故障定位 - AI开发平台ModelArts

Standard资源池节点故障定位节点故障定位对于Standard资源池，ModelArts平台在识别到节点故障后，通过给K8S节点增加污点的方式（taint）将节点隔离避免新作业调度到该节点而受到影响，并且使本次作业不受污点影响。当前可识别的故障类型如下，可通过隔离码及对应检测方法定位故障。

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

创建内网域名：保持默认值。确认规格无误后，单击“立即购买”后提交任务，界面自动跳转至终端节点列表页面。创建DNS内网域名新创建的在线服务对接的是专享版APIG，需要使用ModelArts推理的独立公网域名，即infer-modelarts-<regionId>.modelarts-infer

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

法正常使用GPU实例。 nvidia-fabricmanager必须和nvidia driver版本保持一致。以安装515.105.01版本为例。 version=515.105.01 main_version=$(echo $version | awk -F '.' '{print

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
训练作业卡死检测 - AI开发平台ModelArts

查看当前moxing调用的接口版本：file_io._LARGE_FILE_METHOD，如果输出值为1则为V1版本，如果输出值为2，则为V2版本。 V1版本修改：file_io._NUMBER_OF_PROCESSES=1 V2版本修改：可以 file_io._LARGE_FILE_METHOD = 1，将模

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
推理业务迁移评估表 - AI开发平台ModelArts

模型结构，并升级AI框架。 - 是否使用华为MDC产品如果使用华为MDC产品，请填写MDC版本号，如果没有可以不填。例如：使用了C83版本。 - 性能指标与预期例1：模型：YOLOv5 运行环境：Vnt1 单卡性能指标：QPS 100/s （两进程）性能约束：单次请求最大可以接受时延需小于100ms

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
查询预置算法 - AI开发平台ModelArts

查询预置算法功能介绍查看预置模型的详情。 URI GET /v1/{project_id}/built-in-algorithms 参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
CogVideoX模型基于DevServer适配PyTorch NPU全量训练指导（6.3.911） - AI开发平台ModelArts

2409-aarch64-snt9b-20241112192643-c45ac6b 从SWR拉取。约束限制本文档适配昇腾云ModelArts 6.3.911版本，请参考表2获取配套版本的软件包和镜像，请严格遵照版本配套关系使用本文档。确保容器可以访问公网。步骤一：准备环境请参考DevServ

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

如果本地安装SDK时，出现如下图中的报错，需要先安装3.1.1版本的futures依赖包，然后再重新安装SDK。 pip install futures==3.1.1 图1 安装ModelArts SDK报错信息当pip版本>=24.1版本时，会对安装包的名称进行校验，可能会出现如下报错：

帮助中心 > AI开发平台ModelArts > SDK参考
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

模型结构，并升级AI框架。 - 是否使用华为MDC产品如果使用华为MDC产品，请填写MDC版本号，如果没有可以不填。例如：使用了C83版本。 - 性能指标与预期例1：模型：YOLOv5 运行环境：Vnt1 单卡性能指标：QPS 100/s （两进程）性能约束：单次请求最大可以接受时延需小于100ms

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
启动智能任务 - AI开发平台ModelArts

启动智能任务功能介绍启动智能任务，支持启动“智能标注”和“自动分组”两大类智能任务。可通过指定请求体中的“task_type”参数来启动某类任务。数据路径或工作路径位于KMS加密桶的数据集，不支持启动主动学习和自动分组任务，支持预标注任务。 “智能标注”是指基于当前标注阶段的

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
获取智能任务的信息 - AI开发平台ModelArts

获取智能任务的信息功能介绍获取智能任务的详细信息，支持查询“智能标注”和“自动分组”两大类智能任务。可通过指定路径参数“task_id”来查询某个具体任务的详情。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

使用WebSocket协议的方式访问在线服务背景说明 WebSocket是一种网络传输协议，可在单个TCP连接上进行全双工通信，位于OSI模型的应用层。WebSocket协议在2011年由IETF标准化为RFC 6455，后由RFC 7936补充规范。Web IDL中的WebSocket

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
查询数据集版本详情 - AI开发平台ModelArts

查询数据集版本详情功能介绍查询数据集版本详情。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/datasets/{da

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建训练作业版本 - AI开发平台ModelArts

String 训练作业的日志OBS输出路径URL，默认为空。如：“/usr/train/”。 pre_version_id 是 Long 训练作业前一版本的ID。可通过查询训练作业版本列表中查找“version_id”。 user_image_url 否 String 自定义镜像训练作业

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

Lite模型转换的过程，否则迁移昇腾后还是会遇到同样的问题。 AOE的自动性能调优使用上完全没有效果怎么办？在MindSpore Lite Convertor2.1版本之前可能出现的调优不生效的场景，建议您直接使用MindSpore Lite Convertor2.1及以后的版本。配置文件指定选项进行AO

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
Lite Cluster资源开通 - AI开发平台ModelArts

“运行中”状态。当前仅支持CCE集群1.23&1.25&1.28版本。若您没有可用的CCE集群，可先创建CCE集群。CCE 1.28集群版本支持通过控制台、API方式创建，CCE 1.23和CCE 1.25版本支持通过API方式创建。不同版本的CCE集群创建方式请见Kubernetes版本策略。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）

总条数： 59

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

删除AppCode - AI开发平台ModelArts

重置AppCode - AI开发平台ModelArts

增加AppCode - AI开发平台ModelArts

Standard资源池节点故障定位 - AI开发平台ModelArts

通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

训练作业卡死检测 - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

查询预置算法 - AI开发平台ModelArts

CogVideoX模型基于DevServer适配PyTorch NPU全量训练指导（6.3.911） - AI开发平台ModelArts

（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

启动智能任务 - AI开发平台ModelArts

获取智能任务的信息 - AI开发平台ModelArts

使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

查询数据集版本详情 - AI开发平台ModelArts

创建训练作业版本 - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线