搜索_华为云

创建数据集导出任务 - AI开发平台ModelArts

否 String 样本状态。可选样本状态如下： __ALL__：已标注 __NONE__：未标注 __UNCHECK__：待验收 __ACCEPTED__：验收通过 __REJECTED__：已驳回 __UNREVIEWED__：待审核 __REVIEWED__：已审核 __WO

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
msprobe API预检 - AI开发平台ModelArts

recision_compare_result_{timestamp}.csv文件的Forward Test Success和Backward Test Success，判断是否存在未通过测试的API，再查看api_precision_compare_details_{timestamp}

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

unknown error 使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed 华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA

帮助中心 > AI开发平台ModelArts > 故障排除
获取训练作业事件列表 - AI开发平台ModelArts

"message" : "[Pod: modelarts-job-5bd61eea-9de2-4864-a0f7-5fae966171b5-worker-0] SuccessfulCreate: Created container", "source" : "K8S" }, {

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

device 原因分析因为编译的时候需要设置setup.py中编译的参数arch和code和电脑的显卡匹配。解决方法对于GP Vnt1的显卡，GPU算力为-gencode arch=compute_70,code=[sm_70,compute_70]，设置setup.py中的编译参数即可解决。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
创建诊断任务 - AI开发平台ModelArts

Data项中输入性能数据所在的Notebook本地或OBS路径，单击Submit按钮。界面参考下图。图6 对比两份性能数据性能诊断插件支持设置高级参数，当前支持的高级参数列表如下表所示。表1 高级参数介绍序号键默认值是否必填说明 1 cann_version 8.0.RC1

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

py3-none-any.whl ...... Successfully installed Pillow-*.*.0 ... modelarts-*.*.* ... 在安装SDK时会默认同时安装所需的依赖包。当显示“Successfully installed”时，表示ModelArts

帮助中心 > AI开发平台ModelArts > SDK参考
在ModelArts的Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

昇腾多卡训练任务是多进程多卡模式，跑几卡需要起几个python进程。昇腾底层会读取环境变量：RANK_TABLE_FILE，开发环境已经设置，用户无需关注。比如跑八卡，可以如下片段代码： export RANK_SIZE=8 current_exec_path=$(pwd)

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
查询团队标注任务统计信息 - AI开发平台ModelArts

查询指定样本状态下的统计信息。可选样本状态如下： __ALL__：已标注 __NONE__：未标注 __UNCHECK__：待验收 __ACCEPTED__：验收通过 __REJECTED__：已驳回 __UNREVIEWED__：待审核 __REVIEWED__：已审核 __WO

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
更新训练作业参数 - AI开发平台ModelArts

"/usr/log/", "model_id": 1 } 响应示例成功响应示例 { "is_success": true } 失败响应示例 { "is_success": false, "error_message": "Error string",

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
查询单个样本信息 - AI开发平台ModelArts

否 String 样本状态。可选样本状态如下： __ALL__：已标注 __NONE__：未标注 __UNCHECK__：待验收 __ACCEPTED__：验收通过 __REJECTED__：已驳回 __UNREVIEWED__：待审核 __REVIEWED__：已审核 __WO

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

Arts监控服务。设置告警规则有多种方式。您可以根据实际应用场景，选择设置告警规则的方式。对ModelArts服务设置告警规则对单个服务设置告警规则对模型版本设置告警规则对服务或模型版本的单个指标设置告警规则方式一：对整个ModelArts服务设置告警规则登录管理控制台。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
创建DevServer - AI开发平台ModelArts

server_type 否 String 服务器类型。枚举值如下： BMS：裸金属服务 ECS：弹性云服务 HPS：超节点服务 userdata 否 String 创建服务器时，用户自己定义数据。 hps_cluster_id 否 String 超节点集群网络信息，仅创建超节点需要该参数。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

安装Docker。以Linux x86_64架构的操作系统为例，获取Docker安装包。您可以使用以下指令安装Docker。关于安装Docker的更多指导内容参见Docker官方文档。 curl -fsSL get.docker.com -o get-docker.sh sh

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）推理场景介绍准备工作部署推理服务推理性能测试推理精度测试推理模型量化 Eagle投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
切换Lite Server服务器操作系统 - AI开发平台ModelArts

NewCredentialsBuilder(). WithAk(ak). WithSk(sk). Build() client := bms.NewBmsClient( bms.BmsClientBuilder(). WithRegion(region.ValueOf("cn-north-4"))

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）推理场景介绍准备工作部署推理服务推理性能测试推理精度测试推理模型量化 eagle投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）推理场景介绍准备工作部署推理服务推理性能测试推理精度测试推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题附录：工作负载Pod异常问题和解决方法

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
解除API对APP的授权 - AI开发平台ModelArts

auth_id String 授权编号，授权失败时为空。 reason String 授权或者取消授权失败原因，授权成功时为空。 success Boolean 授权或者取消授权是否成功。状态码： 401 表9 响应Header参数参数参数类型描述 X-Request-Id

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

附录：工作负载Pod异常问题和解决方法 Pod状态为Pending 当Pod状态长时间为“Pending”，事件中出现“实例调度失败”的信息时，可根据具体事件信息确定具体问题原因。图1 pod状态pending 通过以下命令打印Pod日志信息。 kubectl describe

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）

总条数： 1219

上一页
1
...
15
16
17
...
61
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建数据集导出任务 - AI开发平台ModelArts

msprobe API预检 - AI开发平台ModelArts

Lite Server - AI开发平台ModelArts

获取训练作业事件列表 - AI开发平台ModelArts

如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

创建诊断任务 - AI开发平台ModelArts

（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

在ModelArts的Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

查询团队标注任务统计信息 - AI开发平台ModelArts

更新训练作业参数 - AI开发平台ModelArts

查询单个样本信息 - AI开发平台ModelArts

在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

创建DevServer - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

切换Lite Server服务器操作系统 - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

解除API对APP的授权 - AI开发平台ModelArts

附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线