搜索_华为云

停止DevServer实例 - AI开发平台ModelArts

Long 创建时间。 update_at Long 更新时间。 charging_mode String 计费模式。 COMMON：同时支持包周期和按需 POST_PAID：按需模式 PRE_PAID：包周期 cloud_server CloudServer object 云服务信息。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
查询AI应用列表 - AI开发平台ModelArts

e”时有效。 true：表示复制镜像模式，无法极速创建AI应用，SWR源目录中的镜像更改或删除不影响服务部署。 false：表示不复制镜像模式，可极速创建AI应用，更改或删除SWR源目录中的镜像会影响服务部署。不设置值时，默认为复制镜像模式。 tenant String 模型所属租户的账号id。

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
查询DevServer实例详情 - AI开发平台ModelArts

Long 创建时间。 update_at Long 更新时间。 charging_mode String 计费模式。 COMMON：同时支持包周期和按需 POST_PAID：按需模式 PRE_PAID：包周期 cloud_server CloudServer object 云服务信息。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
推理关键特性使用 - AI开发平台ModelArts

推理关键特性使用量化剪枝分离部署 Prefix Caching multi-step 投机推理图模式多模态 Chunked Prefill multi-lora guided-decoding 父主题：主流开源大模型基于Lite Server适配Ascend-vLLM

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
创建AI应用 - AI开发平台ModelArts

和名称。请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token。通过调用IAM服务获取用户Token接口获取（响应消息头中X-Subject-Token的值）。表3 请求Body参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
计费样例 - AI开发平台ModelArts
计费样例 - AI开发平台ModelArts

8 核 32GB的资源池，计划使用时间为1个月（30天）。该公司想要了解采用哪种计费模式才是最具性价比的方式。计费构成分析基于此案例，可详细计算出按需计费和包年/包月两种不同的计费模式的消费情况。此案例中的单价仅为示例，且计算出的费用为估算值。单价的变动和实际场景中计算

 帮助中心 > AI开发平台ModelArts > 计费说明
从AI Gallery订阅模型 - AI开发平台ModelArts

修改配额”窗口，根据需要选择配额后单击“确定”即可跳转至“部署”页面。由于商用模型支持同时购买多种配额模式的资产，所以仅部署商用模型时需要进行配额选择。免费模型仅一种配额模式无需选择。图2 修改配额如果您选择部署的非商业模型，系统自动跳转至“部署”页面。在部署页面中，无需

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

IGC SDXL模型： Fine-tuning微调支持Standard及DevServer模式 LoRA微调支持DevServer模式 Open-Sora1.0训练支持DevServer模式 SDXL基于Standard适配PyTorch NPU的Finetune高性能训练指导

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
配置ModelArts委托授权 - AI开发平台ModelArts

角色与策略相关介绍请参考权限基本概念。 “新增委托 > 权限配置 > 普通模式” 在服务列表右侧勾选“全选”。图5 普通模式 “新增委托 > 权限配置 >高权限模式 ” 高权限模式下，配置的权限范围较大，适用于有管理员权限需求的用户。图6 高权限模式勾选“我已经详细阅读并同意《ModelArts服

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

Long 创建时间。 update_at Long 更新时间。 charging_mode String 计费模式。 COMMON：同时支持包周期和按需 POST_PAID：按需模式 PRE_PAID：包周期 cloud_server CloudServer object 云服务信息。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
查询用户所有DevServer实例列表 - AI开发平台ModelArts

Long 创建时间。 update_at Long 更新时间。 charging_mode String 计费模式。 COMMON：同时支持包周期和按需 POST_PAID：按需模式 PRE_PAID：包周期 cloud_server CloudServer object 云服务信息。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
创建DevServer - AI开发平台ModelArts

arch 否 String 服务器规格架构类型。 ARM X86 availability_zone 否 String 可用区。 charging_info 否 ChargingInfo object 服务器计费模式信息。 count 否 Integer 单次购买的服务器数量。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
推理精度测试 - AI开发平台ModelArts

发送请求的服务上传精度测试代码到推理容器中。如果在Step5 进入容器安装推理依赖软件步骤中已经上传过AscendCloud-3rdLLM-x.x.x.zip并解压，无需重复执行。进入benchmark_eval目录下，执行如下命令安装性能测试的关依赖。 pip install -r

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905）
部署推理服务 - AI开发平台ModelArts

减少显存占用，以提升推理吞吐量。 export USE_PFA_HIGH_PRECISION_MODE=1 # PFA算子是否使用高精度模式；默认值为0表示不开启。针对Qwen2-7B模型和Qwen2-57b模型，必须开启此配置，否则精度会异常；其他模型不建议开启，因为性能会有损失。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” - AI开发平台ModelArts

ve.exe.deleteme ”。原因分析用户使用权限问题导致。处理方法用户电脑切换到管理员角色，键盘快捷键（Windows+R模式）并输入cmd，进入黑色窗口，执行如下命令： python -m pip install --upgrade pip 父主题： API/SDK

帮助中心 > AI开发平台ModelArts > 故障排除 > API/SDK
创建资源池 - AI开发平台ModelArts

modelarts/billing.mode 否 String 计费模式，可选值如下： 0：按需计费 1：包周期计费 os.modelarts/period.num 否 String 包周期订购周期，比如2。当计费模式为包周期时该参数必传。 os.modelarts/period.type

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
模型的自定义镜像制作流程 - AI开发平台ModelArts

自定义镜像中不能包含恶意代码。创建模型的自定义镜像大小不超过50GB。对于同步请求模式的模型，如果预测请求时延超过60s，会造成请求失败，甚至会有服务业务中断的风险，预测请求时延超过60s时，建议制作异步请求模式的模型。自定义镜像的配置规范镜像对外接口设置镜像的对外服务接口，推理接口需与config

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
ModelArts CLI命令功能介绍 - AI开发平台ModelArts

modelarts/ma-cli-profile.yaml配置文件； -P表示鉴权文件中的某一组鉴权信息，默认是DEFAULT； -D表示是否开启debug模式（默认关闭），当开启debug模式后，命令的报错堆栈信息将会打印出来，否则只会打印报错信息； -h表示显示命令的帮助提示信息。命令说明表1 ma-cli支持的命令

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
使用Msprobe工具分析偏差 - AI开发平台ModelArts

"statistics" } } 这里Step指定为0表示只对首个Step进行数据Dump。task指定为statistics表示使用统计量模式，该模式下针对整网训练API输入输出保存最大值、最小值、均值等统计量信息比对，落盘数据量较小。GPU和NPU环境依次进行数据Dump，正常执行结束标识如下图回显Exception:

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优 > 精度对齐
ModelArts Standard训练作业和模型部署如何收费？ - AI开发平台ModelArts

ModelArts支持将模型按照业务需求部署为服务。训练类型不同，部署后的计费方式不同。将模型部署为服务时，根据数据集大小评估模型的计算节点个数，根据实际编码情况选择计算模式。具体计费方式请参见ModelArts产品价格详情。父主题：计费FAQ

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ

总条数： 250

上一页
1
2
3
4
5
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

停止DevServer实例 - AI开发平台ModelArts

查询AI应用列表 - AI开发平台ModelArts

查询DevServer实例详情 - AI开发平台ModelArts

推理关键特性使用 - AI开发平台ModelArts

创建AI应用 - AI开发平台ModelArts

计费样例 - AI开发平台ModelArts

从AI Gallery订阅模型 - AI开发平台ModelArts

昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

配置ModelArts委托授权 - AI开发平台ModelArts

实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

查询用户所有DevServer实例列表 - AI开发平台ModelArts

创建DevServer - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” - AI开发平台ModelArts

创建资源池 - AI开发平台ModelArts

模型的自定义镜像制作流程 - AI开发平台ModelArts

ModelArts CLI命令功能介绍 - AI开发平台ModelArts

使用Msprobe工具分析偏差 - AI开发平台ModelArts

ModelArts Standard训练作业和模型部署如何收费？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线