搜索_华为云

准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

准备环境资源规格要求本文档中的模型运行环境是ModelArts Lite的Lite k8s Cluster。推荐使用“西南-贵阳一”Region上的资源和Ascend Snt9B。硬盘空间：至少200GB。 Ascend资源规格： Ascend: 1*ascend-snt9b表示Ascend单卡。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 准备工作
查询数据集版本列表 - AI开发平台ModelArts

查询数据集版本列表查询数据集的版本列表。 dataset.list_versions() 示例代码查询数据集版本列表 from modelarts.session import Session from modelarts.dataset import Dataset session

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集版本管理
停止计费 - AI开发平台ModelArts
停止计费 - AI开发平台ModelArts

并输入2中复制的资源ID，查找到该资源。图2 查找资源单击操作列的“更多 > 删除”，对Notebook实例执行删除操作。按需计费资源删除后，可能还会存在账单信息，因为系统通常会在使用后1个小时内对上一个结算周期的费用进行扣款。例如在8:30删除按小时结算的训练作业资源，但

 帮助中心 > AI开发平台ModelArts > 计费说明
Notebook Cache盘告警上报 - AI开发平台ModelArts

单击主题名称“操作”列的“更多 > 设置主题策略”。选择APM，即允许AOM的告警触发SMN服务。图5 设置主题策略单击主题名称“操作”列的“添加订阅”。订阅成功后，一旦满足告警条件，那么就会收到通知。选择合适的协议，如邮件，短信等，并填写终端，如邮件地址，手机号等。单击确认。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
查询团队标注验收任务报告 - AI开发平台ModelArts

历史汇总后的统计信息。表4 CheckTaskStats 参数参数类型描述 accepted_sample_count Integer 通过的样本数目。 checked_sample_count Integer 已验收的样本数目。 pass_rate Double 样本的通过率。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

准备环境资源规格要求本文档中的模型运行环境是ModelArts Lite的Lite k8s Cluster。推荐使用“西南-贵阳一”Region上的资源和Ascend Snt9B。硬盘空间：至少200GB。 Ascend资源规格： Ascend: 1*ascend-snt9b表示Ascend单卡。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

准备环境资源规格要求本文档中的模型运行环境是ModelArts Lite的Lite k8s Cluster。推荐使用“西南-贵阳一”Region上的资源和Ascend Snt9B。硬盘空间：至少200GB。 Ascend资源规格： Ascend: 1*ascend-snt9b表示Ascend单卡。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 准备工作
免费资产和商用资产 - AI开发平台ModelArts

Gallery。发布的免费资产将展示在AI Gallery的公共页签以及“我的Gallery > 我的资产”的各个模块的“我的发布”中。已经订阅的免费资产将展示在AI Gallery的“我的Gallery > 我的资产”的各个模块的“我的订阅”或“我的下载”中。免费资产在ModelArts的AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版）
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 NPU卡数、加速框架、梯度配置取值表模型模型参数量训练类型序列长度cutoff_len 梯度累积值优化工具(Deepspeed)

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
Lite Cluster - AI开发平台ModelArts
Lite Cluster - AI开发平台ModelArts

Lite Cluster Cluster资源池如何进行NCCl Test？

帮助中心 > AI开发平台ModelArts > 常见问题
推理场景介绍 - AI开发平台ModelArts

6。适配的CANN版本是cann_8.0.rc3。资源规格要求本文档中的模型运行环境是ModelArts Lite的Lite k8s Cluster。推荐使用“西南-贵阳一”Region上的资源和Ascend Snt9B。支持的模型列表和权重文件本方案支持vLLM的v0.6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
DevServer权限 - AI开发平台ModelArts

对应API接口授权项依赖的授权项 IAM项目企业项目创建DevServer实例 POST /v1/{project_id}/dev-servers modelarts:devserver:create ecs:serverKeypairs:createecs:*:get iam:users:getUser

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
训练过程中无法找到so文件 - AI开发平台ModelArts

directory 原因分析编译生成so文件的cuda版本与训练作业的cuda版本不一致。处理方法编译环境的cuda版本与训练环境不一致，训练作业运行就会报错。例如：使用cuda版本为10的开发环境tf-1.13中编译生成的so包，在cuda版本为9.0训练环境中tf-1

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
查询工作流定时调度详情 - AI开发平台ModelArts

ies 参数参数类型描述 on_failure String 定时调度策略中的标记，失败时触发。 on_running String 定时调度策略中的标记，running时触发。请求示例查询调度信息 GET https://{endpoint}/v2/{project_i

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

示为“已订阅”。从模型详情页进入ModelArts控制台的订阅列表。在模型详情页，单击“前往控制台”。在弹出的“选择云服务区域”页面选择ModelArts所在的云服务区域，单击“确定”跳转至ModelArts控制台的“模型管理 > 订阅模型”页面。图1 前往控制台在“订阅

 帮助中心 > AI开发平台ModelArts > 快速入门
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 NPU卡数、加速框架、梯度配置取值表模型 Template 模型参数量训练策略类型序列长度cutoff_len 梯度累积值

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
管理Standard专属资源池 - AI开发平台ModelArts

管理Standard专属资源池查看Standard专属资源池详情扩缩容Standard专属资源池升级Standard专属资源池驱动修复Standard专属资源池故障节点修改Standard专属资源池支持的作业类型迁移Standard专属资源池和网络至其他工作空间配置Standard专属资源池可访问公网

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
创建团队标注任务 - AI开发平台ModelArts

描述 auto_sync_dataset 否 Boolean 团队标注任务的标注结果是否自动同步至数据集。可选值如下： true：团队标注任务的标注结果自动同步至数据集（默认值） false：团队标注任务的标注结果不自动同步至数据集 data_sync_type 否 Integer

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Standard资源池节点故障定位 - AI开发平台ModelArts

显存 GPU ECC错误。通过nvidia-smi -a查询到存在Pending Page Blacklist为Yes的记录，或多比特Register File大于0。对于Ampere架构的GPU，存在以下场景：存在不可纠正的SRAM错误。存在Remapping Failure记录。

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
创建API - AI开发平台ModelArts
创建API - AI开发平台ModelArts

-Token的值）。表3 请求Body参数参数是否必选参数类型描述 workspace_id 否 String 工作空间id。 support_app_code 否 Boolean 是否支持APP CODE。 auth_type 否 String API的认证方式。枚举值如下：

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理

总条数： 2048

上一页
1
...
83
84
85
...
103
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备环境 - AI开发平台ModelArts

查询数据集版本列表 - AI开发平台ModelArts

停止计费 - AI开发平台ModelArts

Notebook Cache盘告警上报 - AI开发平台ModelArts

查询团队标注验收任务报告 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

免费资产和商用资产 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

Lite Cluster - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

DevServer权限 - AI开发平台ModelArts

训练过程中无法找到so文件 - AI开发平台ModelArts

查询工作流定时调度详情 - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

管理Standard专属资源池 - AI开发平台ModelArts

创建团队标注任务 - AI开发平台ModelArts

Standard资源池节点故障定位 - AI开发平台ModelArts

创建API - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线