搜索_华为云

创建模型不同方式的场景介绍 - AI开发平台ModelArts

创建模型、管理模型版本等功能目前是免费开放给所有用户，使用此功能不会产生费用。创建模型的几种场景从训练作业中导入模型文件创建模型：在ModelArts中创建训练作业，并完成模型训练，在得到满意的模型后，可以将训练后得到的模型创建为模型，用于部署服务。从OBS中导入模型文件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

-p 8080:8080 -v model:/home/mind/model custom_engine:v1 该指令无法完全模拟线上，主要是由于-v挂载进去的目录是root权限。在线上，模型文件从OBS下载到/home/mind/model目录之后，文件owner将统一修改为ma-user。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
infiniband驱动的安装 - AI开发平台ModelArts

可能部分区域的网卡较新，会出现更高版本的infiniband驱动版本，如果您遇到了infiniband驱动安装后，仍然无法使能infiniband网卡的问题，可以咨询相关运维人员以确认宿主机的实际infiniband驱动版本。图1 下载驱动参考如下Dockerfile中，以在容器镜像中安装infiniband驱动。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
Standard资源池节点故障定位 - AI开发平台ModelArts

“/mnt/paas/kubernetes/kubelet”目录为只读状态。 A050801 节点管理节点运维资源预留。节点被标记为备机，并具有备机污点。 A050802 节点管理节点运维未知错误。节点被标记为具有未知故障污点。 A200001 节点管理驱动升级 GPU升级。节点正在执行GPU驱动升级。

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

ModelArts网络关联SFS Turbo SFS Turbo模式下执行流程 SFS Turbo作为完全托管的共享文件存储系统，在本方案中作为主要的存储介质应用于训练作业。因此，后续需要准备的原始数据集、原始Hugging Face权重文件以及训练代码都需要上传至SFS Turbo中。而基于SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作
ModelArts权限管理基本概念 - AI开发平台ModelArts

需要阅读此文档您是企业用户，且存在多个部门，且需要限定不同部门的用户只能访问其专属资源、功能存在多种角色（如管理员、算法开发者、应用运维），希望限制不同角色只能使用特定功能逻辑上存在多套“环境”且相互隔离（如开发环境、预生产环境、生产环境），并限定不同用户在不同环境上的操作权限

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理
自定义引擎创建模型规范 - AI开发平台ModelArts

-p 8080:8080 -v model:/home/mind/model custom_engine:v1 该指令无法完全模拟线上，主要是由于-v挂载进去的目录是root权限。在线上，模型文件从OBS下载到/home/mind/model目录之后，文件owner将统一修改为ma-user。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
数据管理权限 - AI开发平台ModelArts

{dataset_id}/data-annotations/stats modelarts:dataset:get - √ √ 查询数据集监控数据 GET /v2/{project_id}/datasets/{dataset_id}/metrics modelarts:dataset:get

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
管理Lite Cluster节点 - AI开发平台ModelArts

若选择了重部署修复方式，实例会立即关机并迁移到新服务器，本地盘数据会被清空，请提前做好业务迁移和数据备份。图2 修复节点授权运维华为云技术支持在故障定位和性能诊断时，部分运维操作需要用户授权才可进行。您可在资源池详情页的节点页签下，找到对应节点，在操作列单击“更多 > 授权”，在弹出的提示框中单击“确认”即可完成授权。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

pnt004(需申请)/modelarts.vm.ai1.snt3(需申请)/custom(仅支持在部署到专属资源池时使用)，需申请的规格请提交工单，由ModelArts运维工程师添加权限。若配置为custom，需同时指定custom_spec参数。 weight 否 Integer real-time类型必选

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

ModelArts网络关联SFS Turbo SFS Turbo模式下执行流程 SFS Turbo作为完全托管的共享文件存储系统，在本方案中作为主要的存储介质应用于训练作业。因此，后续需要准备的原始数据集、原始Hugging Face权重文件以及训练代码都需要上传至SFS Turbo中。而基于SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.911） > 准备工作
使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

“PretrainedConfig”之间的交互。 “PretrainedConfig”：预训练模型的配置基类提供模型配置的通用属性和两个主要方法，用于序列化和反序列化配置文件。 PretrainedConfig.from_pretrained(dir) # 从目录中加载序列化对

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
测试用户权限 - AI开发平台ModelArts

在左上角的服务列表中，选择ModelArts服务，进入ModelArts管理控制台。在ModelArts管理控制台，可正常创建Notebook、训练作业、注册镜像。验证SFS权限。在左上角的服务列表中，选择SFS服务，进入SFS管理控制台。在SFS管理控制台，在SFS Turbo中单

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
修复Standard专属资源池故障节点 - AI开发平台ModelArts

华为云技术支持在故障定位和性能诊断时，部分运维操作需要用户授权才可进行。您可在资源池详情页的节点页签下，找到对应节点，在操作列单击“更多 > 授权”，在弹出的提示框中单击“确认”即可完成授权。正常情况下，该授权按钮为置灰状态。当华为云技术支持发起运维申请后，按钮会变为可点状态。在完成运维操作后，华为云技

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
开发用于自定义镜像训练的代码 - AI开发平台ModelArts

备注 /xxx 否专属池使用SFS盘挂载的目录，路径由客户自己指定。 /home/ma-user/modelarts 否空文件夹，建议用户主要用这个目录。 /cache 否裸机规格支持，挂载宿主机NVMe的硬盘。 /dev/shm 否用于PyTorch引擎加速。 /usr/local/nvidia

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
Lite Server资源开通 - AI开发平台ModelArts

服务器。弹性云服务器是一种可随时自助获取、可弹性伸缩的云服务器，可帮助您打造可靠、安全、灵活、高效的应用环境，确保服务持久稳定运行，提升运维效率。计费模式选择“按需计费”或“包年/包月”模式。包年/包月包年/包月是预付费模式，按订单的购买周期计费，适用于可预估资源使用周期的场景，价格比按需计费模式更优惠。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server）
配置IAM权限 - AI开发平台ModelArts

精细化授权管理如果您需要进行精细的权限管理，可参考《ModelArts API参考》中的权限策略和授权项。数据管理权限开发环境权限训练作业权限模型管理权限服务管理权限工作空间管理权限精细化授权案例可参考管理员和开发者权限分离。父主题：权限配置

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
增量模型训练 - AI开发平台ModelArts

在ModelArts训练中实现增量训练，建议使用“训练输出”功能。在创建训练作业时，设置训练“输出”参数为“train_url”，在指定的训练输出的数据存储位置中保存Checkpoint，且“预下载至本地目录”选择“下载”。选择预下载至本地目录时，系统在训练作业启动前，自动将数据存储位置中的Checkpoint文件下载到训练容器的本地目录。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
创建ModelArts数据校验任务 - AI开发平台ModelArts

的图片，在data文件夹中不会展示，图片的位置信息显示该图片在输入目录中。 output.manifest存放的是数据处理之后的图片信息（主要是指图片的位置和标注信息等），可以直接使用这个output.manifest文件创建数据集，或者把output.manifest文件导入到已经存在的数据集中。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

为云版Volcano插件支持开启路由加速特性。训练使用的Python版本是3.7或3.9，否则无法实现ranktable路由加速。训练作业的任务节点数要大于或等于3，否则会跳过ranktable路由加速。建议在大模型场景（512卡及以上）使用ranktable路由加速。脚本

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用

总条数： 517

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建模型不同方式的场景介绍 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

infiniband驱动的安装 - AI开发平台ModelArts

Standard资源池节点故障定位 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

ModelArts权限管理基本概念 - AI开发平台ModelArts

自定义引擎创建模型规范 - AI开发平台ModelArts

数据管理权限 - AI开发平台ModelArts

管理Lite Cluster节点 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

测试用户权限 - AI开发平台ModelArts

修复Standard专属资源池故障节点 - AI开发平台ModelArts

开发用于自定义镜像训练的代码 - AI开发平台ModelArts

Lite Server资源开通 - AI开发平台ModelArts

配置IAM权限 - AI开发平台ModelArts

增量模型训练 - AI开发平台ModelArts

创建ModelArts数据校验任务 - AI开发平台ModelArts

在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线