搜索_华为云

准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

准备环境资源规格要求本文档中的模型运行环境是ModelArts Lite的Lite k8s Cluster。推荐使用“西南-贵阳一”Region上的资源和Ascend Snt9B。硬盘空间：至少200GB。 Ascend资源规格： Ascend: 1*ascend-snt9b表示Ascend单卡。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
在推理生产环境中部署推理服务 - AI开发平台ModelArts

模型来源选择“从对象存储服务（OBS）中选择”，元模型选择转换后模型的存储路径，AI引擎选择“Custom”，引擎包选择准备镜像中上传的推理镜像。系统运行架构选择“ARM”。图3 设置AI应用单击“立即创建”开始AI应用创建，待应用状态显示“正常”即完成AI应用创建。首次创建AI应

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
查询数据集的版本列表 - AI开发平台ModelArts

根据版本切分比例筛选版本。根据逗号分隔最小和最大切分比例，筛选出切分比例在此范围内的版本，例如：“0.0,1.0”。说明：如果参数值为空或无该参数，系统默认不根据版本切分比例筛选数据集。 version_format 否 Integer 数据集版本格式。可选值如下： 0：默认格式 1：Carbon格式（仅表格数据集支持）

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
故障恢复 - AI开发平台ModelArts
故障恢复 - AI开发平台ModelArts

故障恢复 ModelArts全球基础设施围绕华为云区域和可用区构建。华为云区域提供多个在物理上独立且隔离的可用区，这些可用区通过延迟低、吞吐量高且冗余性高的网络连接在一起。利用可用区，您可以设计和操作在可用区之间无中断地自动实现故障转移的应用程序和数据库。与传统的单个或多个数据中

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
查询资源实时利用率 - AI开发平台ModelArts

请求参数无响应参数状态码：200 表2 响应Body参数参数参数类型描述 apiVersion String 资源版本。可选值如下： os.modelarts.xxxxx/v2 kind String 资源类型。可选值如下： PoolMetricsList items Array

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
在MaaS中创建模型 - AI开发平台ModelArts

单击模型名称，进入模型详情页面。在“我的版本”区域，单击“新增版本”。在“新增版本”页面，配置模型新版本的参数。表3 新增模型版本参数说明新版本号系统自动编号，不可修改。版本描述模型简介。支持100字符。选择基础模型版本选择基础模型的版本。选择权重路径选择存放模型权重文件的OBS路径，必须选择到模型文件夹。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
Wav2Lip训练基于DevServer适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

参数说明： -v ${work_dir}:${container_work_dir}：代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。work_dir为宿主机中工作目录，目录下存放着训练所需代码、数据等文件。container_work_dir为要挂载到的容器中的目录。为方便两个地址可以相同。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
MiniCPM-V2.6基于Lite Server适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

参数说明： -v ${work_dir}:${container_work_dir}：代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。work_dir为宿主机中工作目录，目录下存放着训练所需代码、数据等文件。container_work_dir为要挂载到的容器中的目录。为方便两个地址可以相同。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
使用MoXing复制数据报错 - AI开发平台ModelArts

径。检查使用的资源是否为CPU，CPU的“/cache”与代码目录共用10G，可能是空间不足导致，可在代码中使用如下命令查看磁盘大小。 os.system('df -hT') 磁盘空间满足，请执行5。磁盘空间不足，请您使用GPU资源。如果是在Notebook使用MoXing

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
获取项目ID和名称 - AI开发平台ModelArts

获取项目ID和名称操作场景在调用接口的时候，部分请求中需要填入项目ID或项目名称，所以需要获取到项目ID和名称。有如下两种获取方式：从控制台获取项目ID和名称调用API获取项目ID 从控制台获取项目ID和名称从控制台获取项目ID（project_id）和名称（project

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
套餐包 - AI开发平台ModelArts
套餐包 - AI开发平台ModelArts

套餐包购买方式登录ModelArts管理控制台，在“总览”页中，单击“购买套餐包”，进入“购买套餐包”页面。可根据需要，自行购买适用规格的套餐包。适用场景 ModelArts服务支持购买套餐包，根据用户选择使用的资源不同进行收费。您可以根据业务需求选择使用不同规格的套餐包。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
MiniCPM-V2.0推理及LoRA微调基于DevServer适配PyTorch NPU指导（6.3.910） - AI开发平台ModelArts

参数说明： -v ${work_dir}:${container_work_dir}：代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。work_dir为宿主机中工作目录，目录下可存放项目所需代码、数据等文件。container_work_dir为要挂载到的容器中的目录。为方便两个地址可以相同。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

py并将此脚本作为“启动文件”。这样启动的作业将会持续运行60分钟。您可通过Cloud Shell进入容器进行调试。 sleep.py示例： import os os.system('sleep 60m') 图4 预置框架启动方式如果训练作业使用的是自定义镜像在创建训练作业时，“创建方式”选择“自

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

def get_rank_table(): rank_table_file_path = os.getenv("RANK_TABLE_FILE") env_ip = os.getenv("ip") # Lite Cluster中的RANK_TABLE_FILE实际名称为

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

def get_rank_table(): rank_table_file_path = os.getenv("RANK_TABLE_FILE") env_ip = os.getenv("ip") # Lite Cluster中的RANK_TABLE_FILE实际名称为

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
昇腾云服务6.3.909版本说明 - AI开发平台ModelArts

0910150953-6faa0ed 镜像发布到SWR，从SWR拉取固件驱动：23.0.6 CANN：cann_8.0.rc3 容器镜像OS：hce_2.0 PyTorch：pytorch_2.1.0、pytorch_2.2.0 MindSpore：MindSpore 2.3.0

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
变更计费模式 - AI开发平台ModelArts

变更计费模式在购买专属资源池后，如果发现当前计费模式无法满足业务需求，您可以变更计费模式。如果您需要长期使用当前按需购买的ModelArts专属资源池，可以将该专属资源池转为包年/包月计费模式，以节省开支。按需计费变更为包年/包月会生成新的订单，用户支付订单后，包年/包月资源将立即生效。

帮助中心 > AI开发平台ModelArts > 计费说明
在推理生产环境中部署推理服务 - AI开发平台ModelArts

模型来源选择“从对象存储服务（OBS）中选择”，元模型选择转换后模型的存储路径，AI引擎选择“Custom”，引擎包选择准备镜像中上传的推理镜像。系统运行架构选择“ARM”。图3 设置AI应用单击“立即创建”开始AI应用创建，待应用状态显示“正常”即完成AI应用创建。首次创建AI应

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

cn-southwest-2.myhuaweicloud.com/os-public-repo/bert_pretrain_mindspore:v1 docker tag swr.cn-southwest-2.myhuaweicloud.com/os-public-repo/bert_pretrain_mindspore:v1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

重要排查是否符合业务资源使用预期，如果业务无问题，无需处理。 CPU IO等待时间 ma_node_cpu_iowait_counter 从系统启动开始累计到当前时刻，硬盘IO等待时间 jiffies ≥0 NA NA NA 内存物理内存使用率 ma_node_memory_util

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源

总条数： 1105

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备环境 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

查询数据集的版本列表 - AI开发平台ModelArts

故障恢复 - AI开发平台ModelArts

查询资源实时利用率 - AI开发平台ModelArts

在MaaS中创建模型 - AI开发平台ModelArts

Wav2Lip训练基于DevServer适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

MiniCPM-V2.6基于Lite Server适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

使用MoXing复制数据报错 - AI开发平台ModelArts

获取项目ID和名称 - AI开发平台ModelArts

套餐包 - AI开发平台ModelArts

MiniCPM-V2.0推理及LoRA微调基于DevServer适配PyTorch NPU指导（6.3.910） - AI开发平台ModelArts

使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

昇腾云服务6.3.909版本说明 - AI开发平台ModelArts

变更计费模式 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线