搜索_华为云

创建Standard专属资源池 - AI开发平台ModelArts

AI专属集群的参数说明参数名称子参数说明计费模式 - 计费模式可以选择“包年/包月”或“按需计费”。包年/包月是预付费模式，按订单的购买周期计费，适用于可预估资源使用周期的场景，价格比按需计费模式更优惠。按需计费是后付费模式，按云服务器的实际使用时长计费，可以随时开通/删除云服务器。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
产品优势 - AI开发平台ModelArts
产品优势 - AI开发平台ModelArts

提供机柜、节点、加速卡、任务多场景故障感知和检测。提供节点级、作业级、容器级，多级故障恢复，保障千卡作业稳定训练。多种资源形态集群模式，开箱即提供好Kubernetes集群，直接使用，方便高效。节点模式，客户可采用开源或自研框架，自行构建集群，更强的掌控力和灵活性。零改造迁移提供业界通用的k8s接口使用资源，业务跨云迁移无压力。

帮助中心 > AI开发平台ModelArts > 产品介绍
在推理生产环境中部署推理服务 - AI开发平台ModelArts

ix-caching特性则不配置该环境变量。若要开启图模式，请配置以下5个环境变量，并且启动服务时不要添加enforce-eager参数。 export INFER_MODE=PTA # 开启PTA模式，若不使用图模式，请关闭该环境变量 export PTA_TORCHAIR

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
部署推理服务 - AI开发平台ModelArts

--enforce-eager：未设置INFER_MODE环境变量时，部分模型会默认使用CANNGraph图模式启动来提升性能，设置该参数后将关闭图模式。CANNGraph图模式目前支持llama和qwen2系列大语言模型单卡场景，包含该系列AWQ量化模型，其他场景(如Multi-l

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
推理关键特性使用 - AI开发平台ModelArts

推理关键特性使用量化剪枝分离部署 Prefix Caching multi-step 投机推理图模式多模态 Chunked Prefill multi-lora guided-decoding 父主题：主流开源大模型基于Lite Server适配Ascend-vLLM

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

x-caching特性则不配置该环境变量。如果要开启图模式，请配置以下5个环境变量，并且启动服务时不要添加enforce-eager参数。 export INFER_MODE=PTA # 开启PTA模式，如果不使用图模式，请关闭该环境变量 export PTA_TORCHAI

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
创建AI应用 - AI开发平台ModelArts

和名称。请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token。通过调用IAM服务获取用户Token接口获取（响应消息头中X-Subject-Token的值）。表3 请求Body参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
从AI Gallery订阅模型 - AI开发平台ModelArts

修改配额”窗口，根据需要选择配额后单击“确定”即可跳转至“部署”页面。由于商用模型支持同时购买多种配额模式的资产，所以仅部署商用模型时需要进行配额选择。免费模型仅一种配额模式无需选择。图2 修改配额如果您选择部署的非商业模型，系统自动跳转至“部署”页面。在部署页面中，无需

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

IGC SDXL模型： Fine-tuning微调支持Standard及DevServer模式 LoRA微调支持DevServer模式 Open-Sora1.0训练支持DevServer模式 SDXL基于Standard适配PyTorch NPU的Finetune高性能训练指导

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
查询DevServer实例详情 - AI开发平台ModelArts

Long 创建时间。 update_at Long 更新时间。 charging_mode String 计费模式。 COMMON：同时支持包周期和按需 POST_PAID：按需模式 PRE_PAID：包周期 cloud_server CloudServer object 云服务信息。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
查询AI应用列表 - AI开发平台ModelArts

e”时有效。 true：表示复制镜像模式，无法极速创建AI应用，SWR源目录中的镜像更改或删除不影响服务部署。 false：表示不复制镜像模式，可极速创建AI应用，更改或删除SWR源目录中的镜像会影响服务部署。不设置值时，默认为复制镜像模式。 tenant String 模型所属租户的账号id。

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
停止DevServer实例 - AI开发平台ModelArts

Long 创建时间。 update_at Long 更新时间。 charging_mode String 计费模式。 COMMON：同时支持包周期和按需 POST_PAID：按需模式 PRE_PAID：包周期 cloud_server CloudServer object 云服务信息。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
删除DevServer实例 - AI开发平台ModelArts

Long 创建时间。 update_at Long 更新时间。 charging_mode String 计费模式。 COMMON：同时支持包周期和按需 POST_PAID：按需模式 PRE_PAID：包周期 cloud_server CloudServer object 云服务信息。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
配置ModelArts委托授权 - AI开发平台ModelArts

角色与策略相关介绍请参考权限基本概念。 “新增委托 > 权限配置 > 普通模式” 在服务列表右侧勾选“全选”。图5 普通模式 “新增委托 > 权限配置 >高权限模式 ” 高权限模式下，配置的权限范围较大，适用于有管理员权限需求的用户。图6 高权限模式勾选“我已经详细阅读并同意《ModelArts服

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” - AI开发平台ModelArts

ve.exe.deleteme ”。原因分析用户使用权限问题导致。处理方法用户电脑切换到管理员角色，键盘快捷键（Windows+R模式）并输入cmd，进入黑色窗口，执行如下命令： python -m pip install --upgrade pip 父主题： API/SDK

帮助中心 > AI开发平台ModelArts > 故障排除 > API/SDK
部署推理服务 - AI开发平台ModelArts

USE_PFA_HIGH_PRECISION_MODE=1 # PFA算子是否使用高精度模式；默认值为0表示不开启。针对Qwen2-7B模型和Qwen2-57b模型，必须开启此配置，否则精度会异常；其他模型不建议开启，因为性能会有损失。若要开启图模式，请配置以下4个环境变量，并且启动服务时不要添加enforce-eager参数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

USE_PFA_HIGH_PRECISION_MODE=1 # PFA算子是否使用高精度模式；默认值为0表示不开启。针对Qwen2-7B模型和Qwen2-57b模型，必须开启此配置，否则精度会异常；其他模型不建议开启，因为性能会有损失。若要开启图模式，请配置以下4个环境变量，并且启动服务时不要添加enforce-eager参数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
创建DevServer - AI开发平台ModelArts

arch 否 String 服务器规格架构类型。 ARM X86 availability_zone 否 String 可用区。 charging_info 否 ChargingInfo object 服务器计费模式信息。 count 否 Integer 单次购买的服务器数量。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

Long 创建时间。 update_at Long 更新时间。 charging_mode String 计费模式。 COMMON：同时支持包周期和按需 POST_PAID：按需模式 PRE_PAID：包周期 cloud_server CloudServer object 云服务信息。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
查询用户所有DevServer实例列表 - AI开发平台ModelArts

Long 创建时间。 update_at Long 更新时间。 charging_mode String 计费模式。 COMMON：同时支持包周期和按需 POST_PAID：按需模式 PRE_PAID：包周期 cloud_server CloudServer object 云服务信息。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理

总条数： 249

上一页
1
2
3
4
5
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建Standard专属资源池 - AI开发平台ModelArts

产品优势 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

推理关键特性使用 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

创建AI应用 - AI开发平台ModelArts

从AI Gallery订阅模型 - AI开发平台ModelArts

昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

查询DevServer实例详情 - AI开发平台ModelArts

查询AI应用列表 - AI开发平台ModelArts

停止DevServer实例 - AI开发平台ModelArts

删除DevServer实例 - AI开发平台ModelArts

配置ModelArts委托授权 - AI开发平台ModelArts

安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

创建DevServer - AI开发平台ModelArts

实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

查询用户所有DevServer实例列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线