搜索_华为云

推理场景介绍 - AI开发平台ModelArts

28。版本使用的容器引擎为Containerd。推理部署使用的服务框架是vLLM。vLLM支持v0.6.3版本。支持FP16和BF16数据类型推理。 Lite k8s Cluster驱动版本推荐为23.0.6。适配的CANN版本是cann_8.0.rc3。资源规格要求本文档中的模型运行环境是ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
重建、停止或删除训练作业 - AI开发平台ModelArts

能帮助用户快速查找训练作业。操作一：单击“只显示自己”按钮，训练作业列表仅显示当前子账号下创建的训练作业。操作二：按照名称、ID、作业类型、状态、创建时间、算法、资源池等条件筛选的高级搜索。操作三：单击作业列表右上角“刷新”图标，刷新作业列表。操作四：自定义列功能设置。图1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
推理场景介绍 - AI开发平台ModelArts

28。版本使用的容器引擎为Containerd。推理部署使用的服务框架是vLLM。vLLM支持v0.6.0版本。支持FP16和BF16数据类型推理。 Lite k8s Cluster驱动版本推荐为23.0.6。适配的CANN版本是cann_8.0.rc3。资源规格要求本文档中的模型运行环境是ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
变更计费模式 - AI开发平台ModelArts

假设用户于2023/04/18 15:29:16购买了一台按需计费的专属资源池，由于业务需要，于2023/04/18 16:30:30执行按需转包年/包月操作，生成类型为“按需转包年/包月”的订单。用户支付订单后，按需转包年/包月的专属资源池立即生效。在“费用中心 > 账单管理”页面将生成如下三条账单信息：

帮助中心 > AI开发平台ModelArts > 计费说明
在JupyterLab中创建定时任务 - AI开发平台ModelArts

name：定时任务名称。 Environment：要运行该Notebook的python环境。 Output formats：执行结果的输出文件类型。 Parameter：单击+，手动设置运行Notebook的python变量。 Schedule：任务执行策略，可以立即运行；也可以设置定时策略运行，支持cron表达式。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
训练性能测试 - AI开发平台ModelArts

rmance_cfgs.yaml相对或绝对路径。 <model_name>：训练模型名，如qwen2-7b <run_type>：训练策略类型及数据序列长度：【lora：4096-lora、full：4096-full、lora-8k：8192-lora、full-8k：8192-full】

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
（可选）Session鉴权 - AI开发平台ModelArts

（可选）Session鉴权 Session鉴权概述 Session模块的主要作用是实现与公有云资源的鉴权，并初始化ModelArts SDK Client、OBS Client。当成功建立Session后，您可以直接调用ModelArts的SDK接口。 ModelArts开发环境

 帮助中心 > AI开发平台ModelArts > SDK参考 > Session鉴权
训练性能测试 - AI开发平台ModelArts

rmance_cfgs.yaml相对或绝对路径。 <model_name>：训练模型名，如qwen2-7b <run_type>：训练策略类型及数据序列长度：【lora：4096-lora、full：4096-full、lora-8k：8192-lora、full-8k：8192-full】

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练benchmark工具
管理Lite Cluster节点池 - AI开发平台ModelArts

每个资源池至少需要有一个节点池，当只有一个节点池时不支持删除。查看节点池的存储配置在节点池管理的更新页面，可以查看该节点池配置的系统盘、容器盘或数据盘的磁盘类型、大小、数量、写入模式、容器引擎空间大小、挂载路径磁盘配置等参数。在Lite资源池的扩缩容页面，也可以查看节点池的存储配置信息。查找搜索节点池

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
使用ma-cli obs-copy命令复制OBS数据 - AI开发平台ModelArts

-H, -h, --help Show this message and exit. 表1 参数说明参数名参数类型是否必选参数说明 -d / --drop-last-dir Bool 否如果指定，在复制文件夹时不会将源文件夹最后一级目录复制至目的文件夹下，仅对文件夹复制有效。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
在MaaS中创建模型 - AI开发平台ModelArts

情况及其处理建议请参见权重校验。当关闭权重校验时，则不进行校验，创建模型可能会因为权重文件不合规而失败。表2 模型介绍模型系列模型类型应用场景支持语言 GLM-4 文本生成对话问答、长文本推理、代码生成中文、英文 ChatGLM3 文本生成对话问答、数学推理、代码生成

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
升级Lite Cluster资源池驱动 - AI开发平台ModelArts

列表。在资源池列表中，选择需要进行驱动升级的资源池“ > 驱动升级”。图1 驱动升级在“驱动升级”弹窗中，会显示当前专属资源池的驱动类型、实例数、当前版本、目标版本、升级方式、升级范围和开启滚动开关。目标版本：在目标版本下拉框中，选择一个目标驱动版本。升级方式：可选择安全升级或强制升级。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
发布Workflow到AI Gallery - AI开发平台ModelArts

您可以单击工作流名称，查看发布的工作流详情。其中release_to_gallery()方法包含以下入参：参数名称描述是否必填参数类型 content_id Workflow资产ID 否 str version Workflow资产的版本号，格式为x.x.x 否 str desc

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 发布Workflow
yaml配置文件参数配置说明 - AI开发平台ModelArts

训练效率和性能 stage sft 表示训练类型。可选择值：[pt、sf、rm、ppo]，pt代表预训练，sft代表指令监督微调，rm代表奖励模型训练，ppo代表PPO训练。 finetuning_type full 用于指定微调的类型，可选择值【full、lora】如果设置为"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
模型NPU卡数取值表 - AI开发平台ModelArts

与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推表1 模型NPU卡数取值表支持模型支持模型参数量文本序列长度训练类型 Zero并行规格与节点数 llama3 70B cutoff_len=4096 lora per_device_train_batch_size=1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
推理精度测试 - AI开发平台ModelArts

--output_path ${output_path} 参数说明: model_args：标志向模型构造函数提供额外参数，比如指定运行模型的数据类型； vllm_path是模型权重路径； max_model_len 是最大模型长度，默认设置为4096； gpu_memory_utili

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

单击右上角的“购买终端节点”，进入购买页面。区域：终端节点所在区域。不同区域的资源之间内网不互通，请确保与ModelArts所在区域保持一致。服务类别：请选择“按名称查找服务”。服务名称：填入步骤1中获取的“终端节点服务地址”。单击右侧验证按钮，系统将为您自动填入虚拟私有云、子网和节点IP。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
升级Standard专属资源池驱动 - AI开发平台ModelArts

在资源池列表中，选择需要进行驱动升级的资源池，在右侧的操作列，单击“ > 驱动升级”。在“驱动升级”弹窗中，会显示当前专属资源池的驱动类型、实例数量、当前版本、目标版本、升级方式、升级范围和开启滚动开关。目标版本：在目标版本下拉框中，选择一个目标驱动版本。对于资源池新增加的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
在ModelArts上如何创建引用第三方依赖包的训练作业？ - AI开发平台ModelArts

”必须选择“预置框架”。需要在创建训练作业前将相关文件上传至OBS路径下，文件打包要求请参见安装文件规范。安装文件规范请根据依赖包的类型，在代码目录下放置对应文件：依赖包为开源安装包时暂时不支持直接从github的源码中安装。在“代码目录”中创建一个命名为“pip-requirements

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
推理精度测试 - AI开发平台ModelArts

--output_path ${output_path} 参数说明: model_args：标志向模型构造函数提供额外参数，比如指定运行模型的数据类型； vllm_path是模型权重路径； max_model_len 是最大模型长度，默认设置为4096； gpu_memory_utili

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）

总条数： 1922

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理场景介绍 - AI开发平台ModelArts

重建、停止或删除训练作业 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

变更计费模式 - AI开发平台ModelArts

在JupyterLab中创建定时任务 - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

（可选）Session鉴权 - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

管理Lite Cluster节点池 - AI开发平台ModelArts

使用ma-cli obs-copy命令复制OBS数据 - AI开发平台ModelArts

在MaaS中创建模型 - AI开发平台ModelArts

升级Lite Cluster资源池驱动 - AI开发平台ModelArts

发布Workflow到AI Gallery - AI开发平台ModelArts

yaml配置文件参数配置说明 - AI开发平台ModelArts

模型NPU卡数取值表 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

升级Standard专属资源池驱动 - AI开发平台ModelArts

在ModelArts上如何创建引用第三方依赖包的训练作业？ - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线