搜索_华为云

推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
语言模型推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理性能测试
准备Notebook - AI开发平台ModelArts

Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS Turbo中的数据执行编辑操作。创建Notebook 创建开发环境Notebook实例，具体操作步骤请参考创建Notebook实例。镜像选择已注册的自定义镜像，资源类型选择创建好的专属资源池，规格推荐选择“Ascend:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

llery下载的数据集。单击图标选择您的OBS桶下的任意一处目录，但不能与输出位置为同一目录。数据集输出位置：用来存放输出的数据标注的相关信息，或版本发布生成的Manifest文件等。单击图标选择OBS桶下的空目录，且此目录不能与输入位置一致，也不能为输入位置的子目录。图1 下载详情

 帮助中心 > AI开发平台ModelArts > 快速入门
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

llery下载的数据集。单击图标选择您的OBS桶下的任意一处目录，但不能与输出位置为同一目录。数据集输出位置：用来存放输出的数据标注的相关信息，或版本发布生成的Manifest文件等。单击图标选择OBS桶下的空目录，且此目录不能与输入位置一致，也不能为输入位置的子目录。图1 下载详情

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard自动学习
在Workflow中更新已部署的服务 - AI开发平台ModelArts

个是在线服务对象，此时在运行态通过开关的方式来控制部署/更新服务，如下图所示：在线服务开关默认关闭，节点走部署服务的流程；如果需要更新服务，则手动打开开关，选择相应的在线服务即可。进行服务更新时，需要保证被更新的服务所使用的模型与配置的模型名称相同。父主题：开发Workflow命令参考

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
语言模型推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
推理精度测试 - AI开发平台ModelArts

ss使用humaneval数据集时，需要执行模型生成的代码。请仔细阅读human_eval/execution.py文件第48-57行的注释，内容参考如下。了解执行模型生成代码可能存在的风险，如果接受这些风险，请取消第58行的注释，执行下面步骤5进行评测。 # WARNING #

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910）
Lite Server资源开通 - AI开发平台ModelArts

域，查看对应的资源。可用区可用区是同一服务区内，电力和网络互相独立的地理区域，一般是一个独立的物理机房，这样可以保证可用区的独立性。是否将资源放在同一可用区内，主要取决于您对容灾能力和网络时延的要求。如果您的应用需要较高的容灾能力，建议您将资源部署在同一区域的不同可用区内。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server）
创建AI应用 - AI开发平台ModelArts

执行代码、模型需先上传至OBS（训练作业生成的模型已默认存储到OBS）。接口约束使用模板导入模型与不使用模板导入这两类导入方式的Body参数要求不一样。以下Body参数说明中以模板参数表示适合使用模板导入模型时填写的参数，非模板参数表示适合不使用模板导入时填写的参数，公共参数表示与导入方式无关的参数。使用

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
将模型部署为批量推理服务 - AI开发平台ModelArts

index必须是从0开始的正整数，当index设置不规则不符时，最终的请求将忽略此参数。配置映射规则后，其对应的csv数据必须以英文半角逗号分隔。 “输出数据目录位置” 选择批量预测结果的保存位置，可以选择您创建的空文件夹。 “实例规格” 系统将根据您的模型匹配提供可用的计算资源。请在下

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
编排Workflow - AI开发平台ModelArts

编排Workflow Workflow的编排主要在于每个节点的定义，您可以参考创建Workflow节点章节，按照自己的场景需求选择相应的代码示例模板进行修改。编排过程主要分为以下几个步骤。梳理场景，了解预置Step的功能，确定最终的DAG结构。单节点功能，如训练、推理等在ModelArts相应服务中调试通过。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
在ModelArts Studio基于Llama3-8B模型实现新闻自动分类 - AI开发平台ModelArts

系统能够准确识别新闻内容的主题和关键词，实现高准确率的自动分类。快速响应：系统能够实时处理新闻内容，快速完成分类，满足新闻时效性的要求。可扩展性：随着模型的不断训练和优化，系统能够适应不断变化的新闻内容和分类需求。降低人力成本：减少人工分类的工作量，降低人力成本，提高工作效率。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
SDXL WebUI基于DevServer适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

Lite的DevServer环境中部署Stable Diffusion的WebUI套件，使用NPU卡进行推理。方案概览本方案介绍了在ModelArts的DevServer上使用昇腾计算资源部署Stable Diffusion WebUI套件用于推理的详细过程。完成本方案的部署，

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
MiniCPM-V2.6基于DevServer适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

zip软件包中的AscendCloud-AIGC-6.3.909-xxx.zip 说明：包名中的xxx表示具体的时间戳，以包名的实际时间为准。获取路径：Support-E 说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
自定义引擎创建模型规范 - AI开发平台ModelArts

镜像中相同的启动命令。提供的服务可使用HTTPS/HTTP协议和监听的容器端口，使用的协议和端口号请根据模型实际定义的推理接口进行配置。HTTPS协议的示例可参考https示例。（可选）服务对外提供的端口，提供URL路径为“/health”的健康检查服务（健康检查的URL路径必须为“/health”）。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
创建ModelArts数据集 - AI开发平台ModelArts

以及数据标注要求，选择创建表格类型的数据集。填写数据集基本信息。图5 表格类型的参数名称：数据集的名称，可自定义您的数据集。描述：该数据集的详情信息。数据类型：根据实际需求，选择对应的数据类型。更多参数填写请参考表3。表3 数据集的详细参数参数名称说明数据源（“OBS”）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
Notebook专属预置镜像列表 - AI开发平台ModelArts

ModelArts开发环境提供的预置镜像主要包含：常用预置包：基于标准的Conda环境，预置了常用的AI引擎，常用的数据分析软件包，例如Pandas，Numpy等，常用的工具软件，例如cuda，cudnn等，满足AI开发常用需求。预置Conda环境：每个预置镜像都会创建一个相对应的Conda环

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > ModelArts支持的预置镜像列表

总条数： 414

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理性能测试 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

在Workflow中更新已部署的服务 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

Lite Server资源开通 - AI开发平台ModelArts

创建AI应用 - AI开发平台ModelArts

将模型部署为批量推理服务 - AI开发平台ModelArts

编排Workflow - AI开发平台ModelArts

在ModelArts Studio基于Llama3-8B模型实现新闻自动分类 - AI开发平台ModelArts

SDXL WebUI基于DevServer适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

MiniCPM-V2.6基于DevServer适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

自定义引擎创建模型规范 - AI开发平台ModelArts

创建ModelArts数据集 - AI开发平台ModelArts

Notebook专属预置镜像列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线