搜索_华为云

推理场景介绍 - AI开发平台ModelArts

推理场景介绍方案概览本方案介绍了在ModelArts的Lite Server上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910）
Yaml配置文件参数配置说明 - AI开发平台ModelArts

文本处理时的最大长度，此处为4096，用户可根据自己要求适配。 packing true 可选项。当选用静态数据长度时，可将不足于文本处理时的最大长度数据弥补到文本处理时的最大长度;当选用动态数据长度则去掉此参数。 deepspeed examples/deepspeed/ds_z3_config.json

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
Yaml配置文件参数配置说明 - AI开发平台ModelArts

文本处理时的最大长度，此处为4096，用户可根据自己要求适配。 packing true 可选项。当选用静态数据长度时，可将不足于文本处理时的最大长度数据弥补到文本处理时的最大长度;当选用动态数据长度则去掉此参数。 deepspeed examples/deepspeed/ds_z3_config.json

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
按需计费 - AI开发平台ModelArts
按需计费 - AI开发平台ModelArts

为准），结算完毕后进入新的计费周期。对于专属资源池：计费的起点以资源池创建成功的时间点为准，终点以资源池删除时间为准。专属资源池从创建到启用需要一定时长，计费的起点是创建成功的时间点，而非创建时间。您可以在专属资源池详情页“基本信息”页签查看创建时间，在“事件”页签查看“事件

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
配置Workflow的输入输出目录 - AI开发平台ModelArts

要求用户输入已存在的路径，否则会报错，路径格式要求为：/桶名称/文件夹路径/。运行态配置调用工作流对象的release方法将工作流发布到运行态，在ModelArts管理控制台，单击Workflow找到相应的工作流进行根路径配置，如下所示：图2 根目录配置父主题：开发Workflow命令参考

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
Yaml配置文件参数配置说明 - AI开发平台ModelArts

文本处理时的最大长度，此处为4096，用户可根据自己要求适配。 packing true 可选项。当选用静态数据长度时，可将不足于文本处理时的最大长度数据弥补到文本处理时的最大长度;当选用动态数据长度则去掉此参数。 deepspeed examples/deepspeed/ds_z3_config.json

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练脚本说明
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

IAM 介绍ModelArts所有功能涉及到的IAM权限配置。 IAM权限简介如果您需要为企业中的员工设置不同的权限访问ModelArts资源，以达到不同员工之间的权限隔离，您可以使用统一身份认证服务（Identity and Access Management，简称IAM）进

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
查看诊断报告 - AI开发平台ModelArts

analysis中对应维度的各项分析及其优先级。红色为高优先级，黄色为中等优先级，绿色为低优先级。参考html进行分析调优时，请按照优先级从高到低依次进行并测试调优后性能，快速解决重点问题。图1 html报告总览-三大模块当前advisor的performance problem

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
推理场景介绍 - AI开发平台ModelArts

推理场景介绍方案概览本方案介绍了在ModelArts的Lite DevServer上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
推理场景介绍 - AI开发平台ModelArts

推理场景介绍方案概览本方案介绍了在ModelArts的Lite k8s Cluster上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
SD3 Diffusers框架基于Lite Server适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

--device=/dev/davinci0：挂载NPU设备，该推理示例中挂载了1张卡davinci0。 driver及npu-smi需同时挂载至容器。不要将多个容器绑到同一个NPU上，会导致后续的容器无法正常使用NPU功能。 Step4进入容器通过容器名称进入容器中。默认使用ma-user用户执行后续命令。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
创建Workflow服务部署节点 - AI开发平台ModelArts

put"].get_output_variable("access_address")} # 获取子服务输出的推理地址，并通过envs传递到主服务中 ) main_service_step = wf.steps.ServiceStep( name="main_service_step"

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
推理场景介绍 - AI开发平台ModelArts

推理场景介绍方案概览本方案介绍了在ModelArts的Lite k8s Cluster上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
SD3 Diffusers框架基于Lite Server适配PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

--device=/dev/davinci0：挂载NPU设备，该推理示例中挂载了1张卡davinci0。 driver及npu-smi需同时挂载至容器。不要将多个容器绑到同一个NPU上，会导致后续的容器无法正常使用NPU功能。步骤五：进入容器通过容器名称进入容器中。默认使用ma-user用户执行后续命令。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

4b" mox.file.copy_parallel(obs_dir, local_dir) 实际操作如下图所示。图1 上传OBS文件到Notebook的代码示例构建推理代码。解压AscendCloud-3rdLLM-6.3.905-xxx.zip代码包。 unzip AscendCloud-3rdLLM-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
查询服务列表 - AI开发平台ModelArts

t、limit查询参数时，count与total相同。 services Array of ListServices objects 查询到的服务集合。表5 ListServices 参数参数类型描述 failed_times Long 服务调用失败次数。 owner String

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
从OBS中导入模型文件创建模型 - AI开发平台ModelArts

s。就绪探针：用于检测应用实例是否已经准备好接收流量。如果就绪探针失败，即实例未准备好，会从服务负载均衡的池中剔除该实例，不会将流量路由到该实例，直到探测成功。存活探针：用于检测应用实例内应用程序的健康状态。如果存活探针失败，即应用程序不健康，将会自动重启实例。 3种探针的配置参数均为：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
Lite Cluster资源配置流程 - AI开发平台ModelArts

/Ascend资源能够正常使用，需要配置好对应的驱动。如果在购买资源池时，没配置自定义驱动，默认驱动不满足业务要求，可通过本章节将驱动升级到指定版本。 5 （可选）配置镜像预热 Lite Cluster资源池支持镜像预热功能，镜像预热可实现将镜像提前在资源池节点上拉取好，在推理及

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

4b" mox.file.copy_parallel(obs_dir, local_dir) 实际操作如下图所示。图1 上传OBS文件到Notebook的代码示例 Step3 启动推理服务配置需要使用的NPU卡编号。例如：实际使用的是第1张卡，此处填写“0”。 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

4b" mox.file.copy_parallel(obs_dir, local_dir) 实际操作如下图所示。图1 上传OBS文件到Notebook的代码示例 Step3 启动推理服务配置需要使用的NPU卡为容器中的第几张卡。例如：实际使用的是容器中第1张卡，此处填写“0”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）

总条数： 1245

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理场景介绍 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

按需计费 - AI开发平台ModelArts

配置Workflow的输入输出目录 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

查看诊断报告 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

SD3 Diffusers框架基于Lite Server适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

创建Workflow服务部署节点 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

SD3 Diffusers框架基于Lite Server适配PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

从OBS中导入模型文件创建模型 - AI开发平台ModelArts

Lite Cluster资源配置流程 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线