搜索_华为云

Standard模型训练 - AI开发平台ModelArts

Standard模型训练提供容器化服务和计算资源管理能力，负责建立和管理机器学习训练工作负载所需的基础设施，减轻用户的负担，为用户提供灵活、稳定、易用和极致性能的深度学习训练环境。通过ModelArts Standard模型训练，用户可以专注于开发、训练和微调模型。 ModelArts

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
Ascend-vLLM介绍 - AI开发平台ModelArts

模型：结构实现和社区一致，Huggingface模型开箱即用，同时可以快速适配新模型。调用：提供高性能算子下发和图模式两种方案，兼顾性能和灵活性。特性：服务调度、特性实现和社区一致，针对昇腾硬件做亲和替换和优化。接口：离线SDK、在线OpenAI Server和社区完全一致，无缝迁移。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
创建和保存Manifest文件 - AI开发平台ModelArts

会话对象，初始化方法请参见Session鉴权。当需要操作OBS时必填。 save_mode 否 String 保存模式。默认为w，即重写模式，另外还支持a，为追加模式。父主题： Manifest管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
查看ModelArts模型详情 - AI开发平台ModelArts

事件保存周期为3个月，3个月后自动清理数据。查看模型的事件类型和事件信息，请参见查看ModelArts模型事件使用约束根据创建模型时的设置，显示部署服务的使用约束，如请求模式、启动命令、模型加密等。对于异步请求模式的模型，可显示输入模式、输出模式、服务启动参数和作业配置参数等参数。关联服务展示使

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
创建节点池 - AI开发平台ModelArts

modelarts/billing.mode 否 String 计费模式，可选值如下： 0：按需计费 1：包周期计费 os.modelarts/period.num 否 String 包周期订购周期，比如2。当计费模式为包周期时该参数必传。 os.modelarts/period.type

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
产品优势 - AI开发平台ModelArts
产品优势 - AI开发平台ModelArts

提供机柜、节点、加速卡、任务多场景故障感知和检测。提供节点级、作业级、容器级，多级故障恢复，保障千卡作业稳定训练。多种资源形态集群模式，开箱即提供好Kubernetes集群，直接使用，方便高效。节点模式，客户可采用开源或自研框架，自行构建集群，更强的掌控力和灵活性。零改造迁移提供业

 帮助中心 > AI开发平台ModelArts > 产品介绍
扩缩容Lite Cluster资源池 - AI开发平台ModelArts

修改驱动版本。在“驱动版本”下拉列表中指定驱动版本。指定节点计费模式。用户增加节点数量时，可以打开“节点计费模式”开关，为资源池新扩容的节点设置不同于资源池的计费模式、购买时长和开启自动续费功能。例如用户可以在包周期的资源池中创建按需的节点。若用户不指定该参数，则新扩容的节点计费模式和资源池保持一致。单击“提交”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
Lite Cluster资源开通 - AI开发平台ModelArts

挂载到指定目录：支持设置“数据盘挂载到的指定路径”和“写入模式”，包括线性和条带化。以本地持久卷挂载：支持“持久卷写入模式”设置，包括线性和条带化，此处设置的是所有数据盘的写入模式。以临时存储卷挂载：支持“临时卷写入模式”设置，包括线性和条带化，此处设置的是所有数据盘的写入模式。新增规格 - 支持添加多个规格。限制如下：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

默认使用CANNGraph图模式启动来提升性能，设置该参数后将关闭图模式。CANNGraph图模式目前支持llama和qwen2系列大语言模型单卡场景，包含该系列AWQ量化模型，其他场景(如Multi-lora)暂未支持。小模型如Qwen2-1.5B和Qwen2-0.5B推荐不设置该参数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
计费样例 - AI开发平台ModelArts
计费样例 - AI开发平台ModelArts

32GB的资源池，计划使用时间为1个月（30天）。该公司想要了解采用哪种计费模式才是最具性价比的方式。计费构成分析基于此案例，可详细计算出按需计费和包年/包月两种不同的计费模式的消费情况。此案例中的单价仅为示例，且计算出的费用为估算值。单价的变动和实际场景中计算出来的费用可能会有偏差。请以华为云官网发布的数据为准。

帮助中心 > AI开发平台ModelArts > 计费说明
创建Standard专属资源池 - AI开发平台ModelArts

AI专属集群的参数说明参数名称子参数说明计费模式 - 计费模式可以选择“包年/包月”或“按需计费”。包年/包月是预付费模式，按订单的购买周期计费，适用于可预估资源使用周期的场景，价格比按需计费模式更优惠。按需计费是后付费模式，按云服务器的实际使用时长计费，可以随时开通/删除云服务器。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
在推理生产环境中部署推理服务 - AI开发平台ModelArts

ix-caching特性则不配置该环境变量。若要开启图模式，请配置以下5个环境变量，并且启动服务时不要添加enforce-eager参数。 export INFER_MODE=PTA # 开启PTA模式，若不使用图模式，请关闭该环境变量 export PTA_TORCHAIR

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

IGC SDXL模型： Fine-tuning微调支持Standard及DevServer模式 LoRA微调支持DevServer模式 Open-Sora1.0训练支持DevServer模式 SDXL基于Standard适配PyTorch NPU的Finetune高性能训练指导

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
推理关键特性使用 - AI开发平台ModelArts

推理关键特性使用量化剪枝分离部署 Prefix Caching multi-step 投机推理图模式多模态 Chunked Prefill multi-lora guided-decoding 父主题：主流开源大模型基于Lite Server适配Ascend-vLLM

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
配置ModelArts委托授权 - AI开发平台ModelArts

角色与策略相关介绍请参考权限基本概念。 “新增委托 > 权限配置 > 普通模式” 在服务列表右侧勾选“全选”。图5 普通模式 “新增委托 > 权限配置 >高权限模式 ” 高权限模式下，配置的权限范围较大，适用于有管理员权限需求的用户。图6 高权限模式勾选“我已经详细阅读并同意《ModelArts服

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
启动DevServer实例 - AI开发平台ModelArts

用户项目ID，获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 arch 否 String 服务器架构信息。 ARM； X86。 charging_mode 否 String 服务器规格计费模式。 COMMON：同时支持包周期和按需 POST_PAID：按需

 帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
从AI Gallery订阅模型 - AI开发平台ModelArts

修改配额”窗口，根据需要选择配额后单击“确定”即可跳转至“部署”页面。由于商用模型支持同时购买多种配额模式的资产，所以仅部署商用模型时需要进行配额选择。免费模型仅一种配额模式无需选择。图2 修改配额如果您选择部署的非商业模型，系统自动跳转至“部署”页面。在部署页面中，无需

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
创建AI应用 - AI开发平台ModelArts

镜像复制开关，仅当“model_type”为“Image”时有效。取值范围： true：默认值，复制镜像模式，无法极速创建AI应用，SWR源目录中的镜像更改或删除不影响服务部署。 false：不复制镜像模式，可极速创建AI应用，更改或删除SWR源目录中的镜像会影响服务部署。 initial_config

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
使用Msprobe工具分析偏差 - AI开发平台ModelArts

这里Step指定为0表示只对首个Step进行数据Dump。task指定为statistics表示使用统计量模式，该模式下针对整网训练API输入输出保存最大值、最小值、均值等统计量信息比对，落盘数据量较小。GPU和NPU环境依次进行数据Dump，正常执行结束标识如下图回显Exception: msprobe:

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优 > 精度对齐
如何查看ModelArts消费详情？ - AI开发平台ModelArts

查询方法：单击右上方的“费用中心 > 费用账单”进入费用中心详情页面，在左侧导航栏选择“账单管理 > 流水和明细账单”，在流水和明细账单页面，可切换“账单详情”和“明细账单”页签查看账单信息。在“流水账单”列表页，罗列该账号下各种产品类型，每个任务产生的费用详细。您可以单击“操作

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ

总条数： 1835

上一页
1
2
3
4
5
...
92
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Standard模型训练 - AI开发平台ModelArts

Ascend-vLLM介绍 - AI开发平台ModelArts

创建和保存Manifest文件 - AI开发平台ModelArts

查看ModelArts模型详情 - AI开发平台ModelArts

创建节点池 - AI开发平台ModelArts

产品优势 - AI开发平台ModelArts

扩缩容Lite Cluster资源池 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

计费样例 - AI开发平台ModelArts

创建Standard专属资源池 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

推理关键特性使用 - AI开发平台ModelArts

配置ModelArts委托授权 - AI开发平台ModelArts

启动DevServer实例 - AI开发平台ModelArts

从AI Gallery订阅模型 - AI开发平台ModelArts

创建AI应用 - AI开发平台ModelArts

使用Msprobe工具分析偏差 - AI开发平台ModelArts

如何查看ModelArts消费详情？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线