搜索_华为云

PD分离部署使用说明 - AI开发平台ModelArts

间结果写入KVCache并推出第1个token，属于计算密集型。 Decode阶段（增量推理）将请求的前1个token传入大模型，从显存读取前文产生的KVCache再进行计算，属于访存密集型。 PD分离部署场景下，大模型推理的Prefill阶段（全量推理）和Decode阶段（全

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 分离部署
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。如果需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。在推理生产环境中部署推理服务介绍如何在创建AI应用，部署并启动推理服务，在线预测在线服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
精度问题概述 - AI开发平台ModelArts

验证准确度与CPU/GPU差异不符合预期。在迁移到NPU环境下训练发现以上问题时，说明精度可能存在偏差，需要进一步做精度调优。下文将分别阐述精度诊断的整体思路和如何借助精度工具进行精度问题的定位。父主题： PyTorch迁移精度调优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
使用SDK调测单机训练作业 - AI开发平台ModelArts

据文件位置；如果用户没有填写，则不会进行压缩上传。 local_path：必选参数，Notebook中的路径。用户的训练脚本需要从该目录中读取数据，完成训练任务。根据is_local_source值的变化，有不同的含义。 is_local_source=True，此时代表训练数据位置，仅支持文件夹。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
编排Workflow - AI开发平台ModelArts

PlaceholderType.STR, default="True", description="是否使用jpeg预处理加速算子(仅支持jpeg格式数据)，可加速数据读取，提升性能，默认启用。如果数据格式不是jpeg格式，开启数据清洗功能即可使用")) ] ), inputs=[wf

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
ModelArts中提示OBS相关错误 - AI开发平台ModelArts

如果在使用Notebook时，需要访问其他账号的OBS桶，请查看您的账号是否有该OBS桶的访问权限。如没有权限，请参见在Notebook中，如何访问其他账号的OBS桶？。检查委托授权请前往权限管理，查看是否具有OBS访问授权。如果没有，请参考配置访问授权（全局配置）。检查OBS桶是否为非加密桶

 帮助中心 > AI开发平台ModelArts > 故障排除 > 通用问题
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。如果需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。在推理生产环境中部署推理服务介绍如何在创建AI应用，部署并启动推理服务，在线预测在线服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
moondream2基于DevServer适配PyTorch NPU推理指导 - AI开发平台ModelArts

was shot, such as close-ups. Do not appear 'seems', 'may' and other words, need to be sure of the description, do not need to be ambiguous description

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
在Workflow中使用大数据能力（DLI/MRS） - AI开发平台ModelArts

description=cluster_id_description, placeholder_format="cluster") ) 在控制台上如何使用MRS节点 Workflow发布后，在Workflow配置页，配置节点的数据输入，输出，启动脚本，集群ID等参数。父主题： Workflow高阶能力

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > Workflow高阶能力
更新服务配置 - AI开发平台ModelArts

vpc_id参数不生效，使用专属资源池部署服务时需确保集群状态正常，该参数优先级高于cluster_id，配置该参数时需要同时配置服务层级的cluster_id或pool_name参数，且该参数优先级高于服务层级的cluster_id及pool_name，当config内的clu

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
模型包结构介绍 - AI开发平台ModelArts

customize_service.py依赖的其他文件可以直接放model目录下，需要采用绝对路径方式访问。绝对路径获取请参考绝对路径如何获取。 ModelArts针对多种引擎提供了样例及其示例代码，您可以参考样例编写您的配置文件和推理代码，详情请参见ModelArts样例列

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
ma-cli configure鉴权命令 - AI开发平台ModelArts

modelarts/ma-cli-profile.yaml。配置用户名密码鉴权以在虚拟机上使用ma-cli configure为例，介绍如何配置用户名密码进行鉴权。以下样例中所有以${}装饰的字符串都代表一个变量，用户可以根据实际情况指定对应的值。比如${your_password}表示输入用户自己的密码信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。如果需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。在推理生产环境中部署推理服务介绍如何在创建AI应用，部署并启动推理服务，在线预测在线服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
推理性能测试 - AI开发平台ModelArts

├── requirements.txt # 第三方依赖目前性能测试已经支持投机推理能力。静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在Step3 制作推理镜像步骤中已经上传过AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。如果需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。在推理生产环境中部署推理服务介绍如何在创建AI应用，部署并启动推理服务，在线预测在线服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
从Manifest文件导入规范说明 - AI开发平台ModelArts

<filename>image_0006.jpg</filename> <source> <database>Unknown</database> </source> <size> <width>230</width>

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
推理性能测试 - AI开发平台ModelArts

├── requirements.txt # 第三方依赖目前性能测试已经支持投机推理能力。静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在Step3 制作推理镜像步骤中已经上传过AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

通过专属资源池详情页面，规格页签，查看专属资源池磁盘信息。当服务部署失败，提示磁盘空间不足时，请参考服务部署、启动、升级和修改时，资源不足如何处理？图2 查看专属资源池磁盘信息创建模型使用大模型创建模型，选择从对象存储服务（OBS）中导入，需满足以下参数配置：采用自定义引擎，开启动态加载

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
语言模型推理性能测试 - AI开发平台ModelArts

# 执行静态、动态性能评测脚本 ├── requirements.txt # 第三方依赖静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在步骤三：上传代码包和权重文件中已经上传过AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务性能评测
语言模型推理性能测试 - AI开发平台ModelArts

├── requirements.txt # 第三方依赖目前性能测试已经支持投机推理能力。静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在步骤四制作推理镜像步骤中已经上传过AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理性能测试

总条数： 1208

上一页
1
...
56
57
58
...
61
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

PD分离部署使用说明 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

精度问题概述 - AI开发平台ModelArts

使用SDK调测单机训练作业 - AI开发平台ModelArts

编排Workflow - AI开发平台ModelArts

ModelArts中提示OBS相关错误 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

moondream2基于DevServer适配PyTorch NPU推理指导 - AI开发平台ModelArts

在Workflow中使用大数据能力（DLI/MRS） - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

模型包结构介绍 - AI开发平台ModelArts

ma-cli configure鉴权命令 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

从Manifest文件导入规范说明 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线