搜索_华为云

从AI Gallery订阅模型 - AI开发平台ModelArts

修改配额”窗口，根据需要选择配额后单击“确定”即可跳转至“部署”页面。由于商用模型支持同时购买多种配额模式的资产，所以仅部署商用模型时需要进行配额选择。免费模型仅一种配额模式无需选择。图2 修改配额如果您选择部署的非商业模型，系统自动跳转至“部署”页面。在部署页面中，无需

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
创建AI应用 - AI开发平台ModelArts

镜像复制开关，仅当“model_type”为“Image”时有效。取值范围： true：默认值，复制镜像模式，无法极速创建AI应用，SWR源目录中的镜像更改或删除不影响服务部署。 false：不复制镜像模式，可极速创建AI应用，更改或删除SWR源目录中的镜像会影响服务部署。 initial_config

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
使用Msprobe工具分析偏差 - AI开发平台ModelArts

这里Step指定为0表示只对首个Step进行数据Dump。task指定为statistics表示使用统计量模式，该模式下针对整网训练API输入输出保存最大值、最小值、均值等统计量信息比对，落盘数据量较小。GPU和NPU环境依次进行数据Dump，正常执行结束标识如下图回显Exception: msprobe:

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优 > 精度对齐
资源购买 - AI开发平台ModelArts
资源购买 - AI开发平台ModelArts

储容量和时长收费。您也可以购买包年包月套餐，提前规划资源的使用额度和时长。在欠费时，您需要及时（15天之内）续费以避免您的文件系统资源被清空。SFS购买指导请参考如何购买弹性文件服务？。购买容器镜像服务SWR 容器镜像服务分为企业版和共享版。共享版计费项包括存储空间和流量费用，目前均免费提供给您。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
ModelArts CLI命令功能介绍 - AI开发平台ModelArts

modelarts/ma-cli-profile.yaml配置文件； -P表示鉴权文件中的某一组鉴权信息，默认是DEFAULT； -D表示是否开启debug模式（默认关闭），当开启debug模式后，命令的报错堆栈信息将会打印出来，否则只会打印报错信息； -h表示显示命令的帮助提示信息。命令说明表1 ma-cli支持的命令

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
如何查看ModelArts消费详情？ - AI开发平台ModelArts

查询方法：单击右上方的“费用中心 > 费用账单”进入费用中心详情页面，在左侧导航栏选择“账单管理 > 流水和明细账单”，在流水和明细账单页面，可切换“账单详情”和“明细账单”页签查看账单信息。在“流水账单”列表页，罗列该账号下各种产品类型，每个任务产生的费用详细。您可以单击“操作

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
部署推理服务 - AI开发平台ModelArts

默认使用CANNGraph图模式启动来提升性能，设置该参数后将关闭图模式。CANNGraph图模式目前支持llama和qwen2系列大语言模型单卡场景，包含该系列AWQ量化模型，其他场景(如Multi-lora)暂未支持。小模型如Qwen2-1.5B和Qwen2-0.5B推荐不设置该参数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
基于MindSpore Lite的模型转换 - AI开发平台ModelArts

对应的模型转换成MindIR格式，通过后端绑定的编译形式来运行以达到更好的性能（类似静态图的运行模式），所以需要提前准备以下几个重点参数。输入的inputShape，包含batch信息。 MSLite涉及到编译优化的过程，不支持完全动态的权重模式，需要在转换时确定对应的inputShape，用于模型的格式的编

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
CUDA和CUDNN - AI开发平台ModelArts
CUDA和CUDNN - AI开发平台ModelArts

CUDA和CUDNN Vnt1机型软件版本建议：gpu driver version : 440.95.01 gpu driver version : 440.95.01（GPU驱动在宿主机中安装，镜像中无需安装） cuda runtime version : 10.2（PyTorch自带，无需关心）

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
依赖和委托 - AI开发平台ModelArts

如图1所示，用户向ModelArts授权后，ModelArts使用委托授权的临时凭证访问和操作用户资源，协助用户自动化一些繁琐和耗时的操作。同时，委托凭证会同步到用户的作业中（Notebook实例和训练作业），用户在作业中可以使用委托凭证自行访问自己的资源。在ModelArts服务中委托授权有两种方式：

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
MoXing常用操作的样例代码 - AI开发平台ModelArts

当被追加的源文件比较大时，例如“obs://bucket_name/obs_file.txt”文件大小超过5MB时，追加一个OBS文件的性能比较低。如果以写入模式或追加模式打开文件，当调用write方法时，待写入内容只是暂时的被存在的缓冲区，直到关闭文件对象（退出with语句时会自动关闭文件对象）或者主动

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

默认使用CANNGraph图模式启动来提升性能，设置该参数后将关闭图模式。CANNGraph图模式目前支持llama和qwen2系列大语言模型单卡场景，包含该系列AWQ量化模型，其他场景(如Multi-lora)暂未支持。小模型如Qwen2-1.5B和Qwen2-0.5B推荐不设置该参数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” - AI开发平台ModelArts

ve.exe.deleteme ”。原因分析用户使用权限问题导致。处理方法用户电脑切换到管理员角色，键盘快捷键（Windows+R模式）并输入cmd，进入黑色窗口，执行如下命令： python -m pip install --upgrade pip 父主题： API/SDK

帮助中心 > AI开发平台ModelArts > 故障排除 > API/SDK
创建资源池 - AI开发平台ModelArts

modelarts/billing.mode 否 String 计费模式，可选值如下： 0：按需计费 1：包周期计费 os.modelarts/period.num 否 String 包周期订购周期，比如2。当计费模式为包周期时该参数必传。 os.modelarts/period.type

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
停止DevServer实例 - AI开发平台ModelArts

用户项目ID，获取方法请参见获取项目ID和名称。请求参数无响应参数状态码：200 表2 响应Body参数参数参数类型描述 create_at Long 创建时间。 update_at Long 更新时间。 charging_mode String 计费模式。 COMMON：同时支持包周期和按需 POST_PAID：按需模式

 帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
删除DevServer实例 - AI开发平台ModelArts

用户项目ID，获取方法请参见获取项目ID和名称。请求参数无响应参数状态码：200 表2 响应Body参数参数参数类型描述 create_at Long 创建时间。 update_at Long 更新时间。 charging_mode String 计费模式。 COMMON：同时支持包周期和按需 POST_PAID：按需模式

 帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
查询AI应用列表 - AI开发平台ModelArts

e”时有效。 true：表示复制镜像模式，无法极速创建AI应用，SWR源目录中的镜像更改或删除不影响服务部署。 false：表示不复制镜像模式，可极速创建AI应用，更改或删除SWR源目录中的镜像会影响服务部署。不设置值时，默认为复制镜像模式。 tenant String 模型所属租户的账号id。

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
查询DevServer实例详情 - AI开发平台ModelArts

用户项目ID，获取方法请参见获取项目ID和名称。请求参数无响应参数状态码：200 表2 响应Body参数参数参数类型描述 create_at Long 创建时间。 update_at Long 更新时间。 charging_mode String 计费模式。 COMMON：同时支持包周期和按需 POST_PAID：按需模式

 帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
如何关闭Mox的warmup - AI开发平台ModelArts

使用warm up的原因。等到训练过程基本稳定之后就可以使用原先设定的初始学习率进行训练。原因分析 Tensorflow分布式有多种执行模式，mox会通过4次执行50 step记录执行时间，选择执行时间最少的模型。处理方法创建训练作业时，在“运行参数”中增加参数“varia

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
权限管理 - AI开发平台ModelArts
权限管理 - AI开发平台ModelArts

仍旧有足够的权限。严格授权模式严格授权模式是指在IAM中创建的子用户必须由账号管理员显式在IAM中授权，才能访问ModelArts服务，管理员用户可以通过授权策略为普通用户精确添加所需使用的ModelArts功能的权限。相对的，在非严格授权模式下，子用户不需要显式授权就可以

 帮助中心 > AI开发平台ModelArts > 产品介绍

总条数： 2019

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

从AI Gallery订阅模型 - AI开发平台ModelArts

创建AI应用 - AI开发平台ModelArts

使用Msprobe工具分析偏差 - AI开发平台ModelArts

资源购买 - AI开发平台ModelArts

ModelArts CLI命令功能介绍 - AI开发平台ModelArts

如何查看ModelArts消费详情？ - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

基于MindSpore Lite的模型转换 - AI开发平台ModelArts

CUDA和CUDNN - AI开发平台ModelArts

依赖和委托 - AI开发平台ModelArts

MoXing常用操作的样例代码 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” - AI开发平台ModelArts

创建资源池 - AI开发平台ModelArts

停止DevServer实例 - AI开发平台ModelArts

删除DevServer实例 - AI开发平台ModelArts

查询AI应用列表 - AI开发平台ModelArts

查询DevServer实例详情 - AI开发平台ModelArts

如何关闭Mox的warmup - AI开发平台ModelArts

权限管理 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线