搜索_华为云

从0制作自定义镜像用于创建训练作业（Pytorch+Ascend） - AI开发平台ModelArts

/usr/local/Ascend /usr/local/Ascend # 设置容器镜像预置环境变量 # 请务必设置 CANN 相关环境变量 # 请务必设置 Ascend Driver 相关环境变量 # 请务必设置 PYTHONUNBUFFERED=1, 以免日志丢失 ENV PATH

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

16,32 # 设置动态分档的档位，根据实际情况设置，另外请不要设置档位1(DeepSeek V2 236B W8A8 模型建议最大设置4个档位) export VLLM_ENGINE_ITERATION_TIMEOUT_S=1500 # 设置vllm请求超时时间(DeepSeek

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
ModelArts版本配套关系表 - AI开发平台ModelArts

HCE2.0（推荐）/EulerOS 2.10 Lite模式Cluster节点操作系统 EulerOS 2.10（CCE标准版）/HCE2.0（CCE Turbo） Standard模式集群节点操作系统 EulerOS 2.10（CCE标准版） NPU固件&驱动 7.1.0.9.220-23

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
Lite Server资源开通 - AI开发平台ModelArts

在搜索栏输入“ModelArts FullAccess”，并勾选“ModelArts FullAccess”。图3 ModelArts FullAccess 以相同的方式，依次添加：BMS FullAccess、ECS FullAccess、VPC FullAccess、VPC Administrator、VPCEndpoint

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server）
推理性能测试 - AI开发平台ModelArts

x.x.zip并解压，无需重复执行。执行如下命令进入容器。 kubectl exec -it {pod_name} bash ${pod_name}：pod名，例如图1${pod_name}为yourapp-87d9b5b46-c46bk。进入benchmark_tools目录下，切换conda环境并安装依赖。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
ma-cli configure鉴权命令 - AI开发平台ModelArts

一个变量，用户可以根据实际情况指定对应的值。比如${access key}表示输入用户自己的access key。 ma-cli configure --auth AKSK access key [***]: ${access key} secret key [***]: ${secret

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
Lite Cluster - AI开发平台ModelArts
Lite Cluster - AI开发平台ModelArts

Lite Cluster 资源池创建失败的原因与解决方法？ Cluster资源池节点故障如何定位特权池信息数据显示均为0%如何解决？重置节点后无法正常使用？

帮助中心 > AI开发平台ModelArts > 故障排除
将模型部署为批量推理服务 - AI开发平台ModelArts

例如，模型来源于自动学习项目，则计算资源将自动关联自动学习规格供使用。 “实例数” 设置当前版本模型的实例个数。如果节点个数设置为1，表示后台的计算模式是单机模式；如果节点个数设置大于1，表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。 “环境变量” 设置环境变量，注入环境变量到容器实例。为确保您的数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
推理性能测试 - AI开发平台ModelArts

x.x.zip并解压，无需重复执行。执行如下命令进入容器。 kubectl exec -it {pod_name} bash ${pod_name}：pod名，例如图1${pod_name}为yourapp-87d9b5b46-c46bk。进入benchmark_tools目录下，切换conda环境并安装依赖。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
推理性能测试 - AI开发平台ModelArts

x.x.zip并解压，无需重复执行。执行如下命令进入容器。 kubectl exec -it {pod_name} bash ${pod_name}：pod名，例如图1${pod_name}为yourapp-87d9b5b46-c46bk。进入benchmark_tools目录下，切换conda环境并安装依赖。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
删除节点池 - AI开发平台ModelArts

taints Array of Taint objects 支持给创建出来的节点加taints来设置反亲和性，非特权池不能指定。 labels Map<String,String> k8s标签，格式为key/value键值对。 tags Array of UserTag objects

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
配额与限制 - AI开发平台ModelArts

询您的配额详情。申请扩大配额如需扩大资源配额，请在华为云管理控制台申请扩大配额。配额项说明使用ModelArts Lite Cluster或Lite Server时，所需的ECS实例数、内存大小、CPU核数和EVS硬盘大小等资源会超出华为云默认提供的资源配额，因此需要申请扩大配额。具体配额项如下。

帮助中心 > AI开发平台ModelArts > 产品介绍
Lite Cluster - AI开发平台ModelArts
Lite Cluster - AI开发平台ModelArts

Lite Cluster Cluster资源池如何进行NCCl Test？

帮助中心 > AI开发平台ModelArts > 常见问题
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

表2 操作任务流程说明阶段任务说明准备工作准备环境本教程案例是基于ModelArts Lite k8s Cluster运行的，需要购买并开通k8s Cluster资源。准备代码准备AscendSpeed训练代码、分词器Tokenizer和推理代码。准备数据准备训

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

16,32 # 设置动态分档的档位，根据实际情况设置，另外请不要设置档位1(DeepSeek V2 236B W8A8 模型建议最大设置4个档位) export VLLM_ENGINE_ITERATION_TIMEOUT_S=1500 # 设置vllm请求超时时间(DeepSeek

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
查看训练作业日志 - AI开发平台ModelArts

ASCEND_SLOG_PRINT_TO_STDOUT=1 # 设置plog日志是否在屏幕上显示，1表示默认设置在屏幕上显示日志。 ASCEND_GLOBAL_EVENT_ENABLE=1 # 设置事件级别不开启Event日志级别为0；开启Event日志级别为1。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
非分离部署推理服务 - AI开发平台ModelArts

检查docker是否安装。 docker -v #检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y docker-engine.aarch64 docker-engine-selinux.noarch docker-runc

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
重启可视化作业 - AI开发平台ModelArts

ualization-jobs/10/restart 响应示例成功响应示例 { "is_success": true } 失败响应示例 { "is_success": false, "error_message": "This job can't be resubmit

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
在ModelArts Standard运行GPU训练作业的准备工作 - AI开发平台ModelArts

Admin”。单击“下一步”。 SWR的权限有SWR FullAccess、SWR OperateAccess、SWR ReadOnlyAccess。但SWR FullAccess、SWR OperateAccess、SWR ReadOnlyAccess仅限容器镜像服务企业版使用，目前企业版已暂停

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
查看ModelArts模型事件 - AI开发平台ModelArts

模型导入成功。 Model imported successfully. - 正常模型文件导入成功。 Model file imported successfully. - 正常模型大小计算完成。 Model size calculated successfully. - 异常模型导入失败。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型

总条数： 1220

上一页
1
...
7
8
9
...
61
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

从0制作自定义镜像用于创建训练作业（Pytorch+Ascend） - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

ModelArts版本配套关系表 - AI开发平台ModelArts

Lite Server资源开通 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

ma-cli configure鉴权命令 - AI开发平台ModelArts

Lite Cluster - AI开发平台ModelArts

将模型部署为批量推理服务 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

删除节点池 - AI开发平台ModelArts

配额与限制 - AI开发平台ModelArts

Lite Cluster - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

查看训练作业日志 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

重启可视化作业 - AI开发平台ModelArts

在ModelArts Standard运行GPU训练作业的准备工作 - AI开发平台ModelArts

查看ModelArts模型事件 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线