搜索_华为云

上传算法至SFS - AI开发平台ModelArts

修改lr_scheduler.py文件，把第27行：t_mul=1. 注释掉。修改data文件夹下imagenet22k_dataset.py，把第28行：print("ERROR IMG LOADED: ", path) 注释掉。修改data文件夹下的build.py文件，把第112行：prefix

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
ModelArts Standard资源管理 - AI开发平台ModelArts

ModelArts Standard资源管理 Standard资源池功能介绍创建Standard专属资源池管理Standard专属资源池

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
查询节点列表 - AI开发平台ModelArts

object 节点资源量信息。 availableResources NodeResource object 节点可用资源量信息。表9 NodeResource 参数参数类型描述 cpu String CPU资源量。 memory String 内存资源量。 nvidia.com/gpu

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
专属资源池计费项 - AI开发平台ModelArts

示例：使用按需计费的专属资源池。计费项：计算资源费用假设用户于2023年4月1日10:00:00创建了一个按需计费的专属资源池，并在2023年5月1日10:00:00删除此专属资源池。资源池规格为CPU: 8 核 32GB，计算节点个数为1个，单价为3.50元/小时。按照计算资源费用结算，那么此专属资源池运行期间产生的费用计算如下：

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
批量重启节点 - AI开发平台ModelArts

批量重启节点功能介绍批量重启指定资源池中的节点调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/pools/{pool

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
资源和引擎规格接口 - AI开发平台ModelArts

资源和引擎规格接口查询作业资源规格查询作业引擎规格父主题：训练管理（旧版）

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版）
查询插件模板 - AI开发平台ModelArts

表2 响应Body参数参数参数类型描述 apiVersion String API版本。可选值如下： v1 kind String 资源类型。可选值如下： PluginTemplate：插件模板 metadata PluginTemplateMetadata object 插件模板的metadata信息。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
批量删除节点 - AI开发平台ModelArts

批量删除节点功能介绍批量删除指定资源池中的节点，资源池中至少保留一个节点。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/{project_i

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询事件列表 - AI开发平台ModelArts

String 事件所属资源类型。可选值为pools，表示资源池。 name 是 String 事件所属资源名称。 limit 否 Integer 单页查询最大数量，该值为空或者0时默认返回500条记录，单页最大允许查询500条记录。 continue 否 String 分页查询的上一页标记，

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

使用PyTorch框架创建训练作业的流程如下：调用认证鉴权接口获取用户Token，在后续的请求中需要将Token放到请求消息头中作为认证。调用获取训练作业支持的公共规格接口获取训练作业支持的资源规格。调用获取训练作业支持的AI预置框架接口查看训练作业支持的引擎类型和版本。调用创建算法接口创建一个算法，记录算法id。

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
资源超分对Notebook实例有什么影响？ - AI开发平台ModelArts

2U的CPU，运行Notebook时最大使用到2U的资源；内存同理，最少需要4.8G的内存，运行时最大使用到8U的内存。超分情况下会存在实例终止的风险。如1个8U的节点上同时启动了6个2U的实例，如果其中一个实例CPU使用增大到超过节点的上限（8U）时，k8S会将使用资源最多的实例终止掉。因此超分会带来实例重启的风险，请不要超分使用。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
模型管理计费项 - AI开发平台ModelArts

在ModelArts创建模型不收费，但在通过OBS导入模型时，需要先将模型包文件存放到OBS中，OBS会产生费用。存储资源包括数据存储到OBS的计费。具体内容如表1所示。表1 存储计费项计费项计费项说明适用的计费模式计费公式存储资源对象存储OBS 用于存储训练和推理的输入数据和输出结果数据。具体费用可参见对象存储价格详情。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
在AI Gallery订阅商品失败怎么办？ - AI开发平台ModelArts

在AI Gallery订阅商品失败怎么办？ AI Gallery是在ModelArts的基础上构建的开发者生态社区，提供模型、算法、HiLens技能、数据集等内容的共享。当您订阅商品失败可参照如下方式解决：请检查您是否完成实名认证。账号注册成功后，您需要完成“实名认证”才可以

 帮助中心 > AI开发平台ModelArts > 常见问题 > AI Gallery
查询OS的配置参数 - AI开发平台ModelArts

Integer 用户可创建网络个数配额。 poolQuota Integer 用户可创建资源池个数配额。 pooHighAvailable Boolean 当前环境/局点是否支持创建高可用资源池。状态码： 404 表3 响应Body参数参数参数类型描述 error_code

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
步骤总览 - AI开发平台ModelArts
步骤总览 - AI开发平台ModelArts

使用Notebook进行代码调试创建训练任务单机多卡资源购买：购买虚拟私有云VPC 购买弹性文件服务SFS 购买容器镜像服务SWR 创建网络购买ModelArts专属资源池购买弹性云服务器ECS 基本配置：权限配置专属资源池VPC打通 ECS服务器挂载SFS Turbo存储

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
限制用户使用公共资源池 - AI开发平台ModelArts

限制用户使用公共资源池本章节介绍如何控制ModelArts用户权限，限制用户使用ModelArts公共资源池的资源创建训练作业、创建开发环境实例，部署推理服务等。场景介绍对于ModelArts专属资源池的用户，不允许使用公共资源池创建训练作业、创建Notebook实例或者部

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
使用kv-cache-int8量化 - AI开发平台ModelArts

tensor静态量化和per-tensor+per-head静态量化，支持kv-cache-int8量化和FP16、BF16、AWQ、smoothquant的组合。 kv-cache-int8量化支持的模型请参见表3。 per-tensor静态量化场景在GPU机器上使用tensorRT

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用kv-cache-int8量化 - AI开发平台ModelArts

tensor静态量化、per-tensor+per-head静态量化以及per-token，支持kv-cache-int8量化和FP16、BF16、AWQ、smoothquant的组合。 kv-cache-int8量化支持的模型请参见表3。 per-tensor静态量化场景在GPU机器上使用tensorRT

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

rank的使用不一致会导致训练异常。操作步骤开启ModelArts Lite资源池对应的CCE集群的cabinet插件。在ModelArts Lite专属资源池列表，单击资源池名称，进入专属资源池详情页面。在基本信息页面单击CCE集群，跳转到CCE集群详情页面。在左侧导

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
训练任务的排队逻辑是什么？ - AI开发平台ModelArts

饿死指的是前面的任务被一个大的任务堵着（例如是64卡），需要等空闲64卡这个任务才能运行，64卡的任务后面跟着1卡的。即使现在空出来30卡，这个1卡的任务也排不上。父主题： Standard资源池

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard资源池

总条数： 978

上一页
1
...
6
7
8
...
49
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

上传算法至SFS - AI开发平台ModelArts

ModelArts Standard资源管理 - AI开发平台ModelArts

查询节点列表 - AI开发平台ModelArts

专属资源池计费项 - AI开发平台ModelArts

批量重启节点 - AI开发平台ModelArts

资源和引擎规格接口 - AI开发平台ModelArts

查询插件模板 - AI开发平台ModelArts

批量删除节点 - AI开发平台ModelArts

查询事件列表 - AI开发平台ModelArts

以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

资源超分对Notebook实例有什么影响？ - AI开发平台ModelArts

模型管理计费项 - AI开发平台ModelArts

在AI Gallery订阅商品失败怎么办？ - AI开发平台ModelArts

查询OS的配置参数 - AI开发平台ModelArts

步骤总览 - AI开发平台ModelArts

限制用户使用公共资源池 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

训练任务的排队逻辑是什么？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线