搜索_华为云

训练的数据集预处理说明 - AI开发平台ModelArts

PretrainedFromHF 。 SEQ_LEN 4096 要处理的最大seq length。脚本会检测超出SEQ_LEN长度的数据，并打印log。父主题：训练脚本说明参考

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明参考
ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

--framework-version String 否训练作业选择的引擎版本。 -q / --quiet Bool 否提交训练作业成功后直接退出，不再同步打印作业状态。 --workspace-id String 否作业所处的工作空间，默认值为“0”。 --policy String 否训练

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

准备工作注册华为账号并开通华为云、实名认证注册华为账号并开通华为云进行实名认证配置委托访问授权 ModelArts使用过程中涉及到OBS、SWR、IEF等服务交互，首次使用ModelArts需要用户配置委托授权，允许访问这些依赖服务。使用华为云账号登录ModelArts管理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
部署推理服务 - AI开发平台ModelArts

SpaceManger来管理KVCache索引，如果不使用该功能，则无需配置。注意：如果使用投机推理功能，必须开启此参数。服务启动后，会打印如下类似信息。 server launch time cost: 15.443044185638428 s INFO: Started

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

则无需配置。注意：如果使用投机推理功能，必须开启此参数。 --served-model-name：vllm服务后台id。服务启动后，会打印如下类似信息。 server launch time cost: 15.443044185638428 s INFO: Started

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

上传镜像完成后，返回容器镜像服务控制台，在“我的镜像”页面，执行刷新操作后可查看到对应的镜像信息。上传数据至OBS 已经在OBS上创建好普通OBS桶，请参见创建普通OBS桶。已经安装obsutil，请参考安装和配置OBS命令行工具。 OBS和训练容器间的数据传输原理可以参考基于ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

${container_draft_model_path}同时使用。 --served-model-name：vllm服务后台id。服务启动后，会打印如下类似信息。 server launch time cost: 15.443044185638428 s INFO: Started

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
部署推理服务 - AI开发平台ModelArts

“1/1 running”状态代表启动成功。 kubectl get pod -A 图1 启动pod成功执行如下命令查看pod日志，如果打印类似下图信息表示服务启动成功。 kubectl logs -f ${pod_name} 参数说明： ${pod_name}：pod名，例如

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
部署推理服务 - AI开发平台ModelArts

“1/1 running”状态代表启动成功。 kubectl get pod -A 图1 启动pod成功执行如下命令查看pod日志，如果打印类似下图信息表示服务启动成功。 kubectl logs -f ${pod_name} 参数说明： ${pod_name}：pod名，例如

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
委托授权ModelArts云服务使用SFS Turbo - AI开发平台ModelArts

“授权对象类型”：根据需要选择"IAM子用户"、"联邦用户"、"委托用户"、"所有用户" “授权对象”：选择授权对象 “委托选择”：新增委托 “权限配置”：普通模式，选中弹性文件服务(SFSTurbo)下的"sfsturbo:shares:addShareNic"、"sfsturbo:shares

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
查询资源规格列表 - AI开发平台ModelArts

String 磁盘类型，具体内容可参考磁盘类型及性能介绍。可选值如下： SSD：超高IO硬盘 GPSSD：通用型SSD SAS：高IO硬盘 SATA：普通硬盘 size String 磁盘大小，单位为Gi。表12 ResourceFlavorStatus 参数参数类型描述 phase Map<String

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

采用自定义引擎，开启动态加载并配置健康检查示例图部署在线服务部署服务时，需满足以下参数配置：自定义部署超时时间大模型加载启动的时间一般大于普通的模型创建的服务，请配置合理的“部署超时时间”，避免尚未启动完成被认为超时而导致部署失败。添加环境变量部署服务时，增加如下环境变量，会

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
Lite Cluster资源开通 - AI开发平台ModelArts

由于AI机型规格相对较大，资源池所需的ECS实例数、内存大小、CPU核数和EVS硬盘大小很可能会超出华为云默认提供的资源配额，因此需要申请扩大配额。请先联系客户经理确认资源配额提升具体方案，再参考本章节申请扩大配额。登录华为云管理控制台。在顶部导航栏单击“资源 > 我的配额”，进入服务配额页面。图6

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

使用自定义引擎创建模型，用户的SWR镜像、OBS模型包和文件大小需要满足以下规范： SWR镜像规范：镜像必须内置一个用户名为“ma-user”，组名为“ma-group”的普通用户，且必须确保该用户的uid=1000、gid=100。内置用户的dockerfile指令如下： groupadd -g 100 ma-group

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
查询数据集导入任务的详情 - AI开发平台ModelArts

cluster_id String MRS集群ID。可登录MRS控制台查看。 cluster_mode String MRS集群运行模式。可选值如下： 0：普通集群 1：安全集群 cluster_name String MRS集群名称。可登录MRS控制台查看。 database_name String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
训练迁移快速入门案例 - AI开发平台ModelArts

orch Issues中查看是否有类似的问题找到相关线索。如果还无法解决，可以通过提交工单的形式从华为云ModelArts入口进行咨询以及求助对应的专业服务。自动迁移似乎还要改很多脚本才能运行起来？因为自动迁移其实是对于torch运行环境中常用的GPU上的接口进行和昇腾设备的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
查询数据集导入任务列表 - AI开发平台ModelArts

cluster_id String MRS集群ID。可登录MRS控制台查看。 cluster_mode String MRS集群运行模式。可选值如下： 0：普通集群 1：安全集群 cluster_name String MRS集群名称。可登录MRS控制台查看。 database_name String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
自定义引擎创建模型规范 - AI开发平台ModelArts

使用自定义引擎创建模型，用户的SWR镜像、OBS模型包和文件大小需要满足以下规范： SWR镜像规范：镜像必须内置一个用户名为“ma-user”，组名为“ma-group”的普通用户，且必须确保该用户的uid=1000、gid=100。内置用户的dockerfile指令如下： groupadd -g 100 ma-group

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
查看诊断报告 - AI开发平台ModelArts

attention算子耗时最长且降频比率最高，因此降频严重影响了整体的训练性能。对于降频问题，用户通常无法自行解决，需要联系服务方如华为云技术支持排查机器的温度和功耗。图11 降频分析 AICPU Issues 下图展示了高优先级的AICPU问题，AICPU算子单步计算耗时3

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
创建导入任务 - AI开发平台ModelArts

String MRS集群ID。可登录MRS控制台查看。 cluster_mode 否 String MRS集群运行模式。可选值如下： 0：普通集群 1：安全集群 cluster_name 否 String MRS集群名称。可登录MRS控制台查看。 database_name 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）

总条数： 210

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练的数据集预处理说明 - AI开发平台ModelArts

ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

委托授权ModelArts云服务使用SFS Turbo - AI开发平台ModelArts

查询资源规格列表 - AI开发平台ModelArts

使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

查询数据集导入任务的详情 - AI开发平台ModelArts

训练迁移快速入门案例 - AI开发平台ModelArts

查询数据集导入任务列表 - AI开发平台ModelArts

自定义引擎创建模型规范 - AI开发平台ModelArts

查看诊断报告 - AI开发平台ModelArts

创建导入任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线