搜索_华为云

多模态模型推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-xxx.zip的llm_tools/llm_evaluation目录下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
多模态模型推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-xxx.zip的llm_tools/llm_evaluation目录下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理性能测试
更新资源池 - AI开发平台ModelArts

object 资源池的metadata信息。 spec PoolSpecModel object 资源池的期望信息。 status PoolStatus object 资源池的状态信息。表11 PoolMetadata 参数参数类型描述 name String 系统自动生成的pool名称，相当于pool

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询资源池上的标签 - AI开发平台ModelArts

String 资源池名称。取自资源池详情的metadata字段中的name的值。请求参数无响应参数状态码：204 表2 响应Body参数参数参数类型描述 tags Array of PoolTag objects 资源标签的列表。表3 PoolTag 参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 资源标签管理
查询APP详情 - AI开发平台ModelArts

认值为“0”，存在创建并使用的工作空间，以实际取值为准。 iphertext_enabled 否 Boolean 是否明文展示。请求参数表3 请求Header参数参数是否必选参数类型描述 Content-Type 否 String 消息体的类型。设置为text/pla

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
多模态模型推理性能测试 - AI开发平台ModelArts

多模态模型推理性能测试多模态模型推理的性能测试目前仅支持静态性能测试。静态性能测试是指评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务性能评测
精度校验 - AI开发平台ModelArts
精度校验 - AI开发平台ModelArts

以通过指定模型输出进行可对比的误差分析（精度）。精度测试 benchmark工具用于精度验证，主要工作原理是：固定模型的输入，通过benchmark工具进行推理，并将推理得到的输出与标杆数据进行相似度度量（余弦相似度和平均相对误差），得到模型转换后的精度偏差信息。使用benchmark进行精度比对的基本流程如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
返回结果 - AI开发平台ModelArts
返回结果 - AI开发平台ModelArts

返回结果请求发送以后，您会收到响应，包含：状态码、响应消息头和响应消息体。状态码状态码是一组从1xx到5xx的数字代码，状态码表示了请求响应的状态，完整的状态码列表请参见状态码。对于获取用户Token接口，如果调用后返回状态码为“201”，则表示请求成功。响应消息头对

 帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
迁移效果校验 - AI开发平台ModelArts

在pipeline适配完成后，需要验证适配后的效果是否满足要求，通过对比原始onnx pipeline的最终输出结果确认迁移效果。如果精度和性能都没有问题，则代表迁移完成。对比图片生成效果在CPU上推理onnx，将原始onnx和适配完成的MindSpore Lite pipeline输出的结果图片进行对比

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

返回此错误信息。如果您使用的是自定义镜像导入的模型，请增大自定义镜像中所使用的web server的keep-alive的参数值，尽量避免由服务端发起关闭连接。如您使用的Gunicorn来作为web server，可以通过Gunicorn命令的--keep-alive参数来设

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
删除资源池 - AI开发平台ModelArts

Integer 资源规格的弹性使用量，物理池该值和count相同。 azs Array of azs objects 资源所在的AZ的数量。 nodePool String 节点池名称。比如：nodePool-1。表15 azs 参数参数类型描述 az String AZ的名称。 count

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询API和APP - AI开发平台ModelArts

object API已授权的APP的基本信息。表5 AppAuthApiAuthInfo 参数参数类型描述 api_id String API编号。 authed_apps Array of ApigAppDetailInfo objects API已授权的APP的基本信息。表6 ApigAppDetailInfo

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

ascendfactory-cli方式启动（推荐）相对于之前demo.sh方式启动（历史版本）的启动方式，本章节新增了通过benchmark工具启动训练的方式。此方式训练完成后json日志或打屏日志直接打印性能结果，免于计算，方便用户验证发布模型的质量。并且新的训练方式将统一管理训练日志、训练结果和训练配置，使用ya

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 执行训练任务
获取用户绑定APP的api列表 - AI开发平台ModelArts

获取用户绑定APP的api列表功能介绍获取用户绑定app的API列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
查询网络资源 - AI开发平台ModelArts

Turbo的ID。 name String SFS Turbo的名称。 status String 与SFS Turbo的连接状态信息。可选值如下： Active：SFS连通状态正常 Abnormal：SFS连通状态异常 ipAddr String SFS Turbo的访问地址。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
资源池监控 - AI开发平台ModelArts

startTimeInMillis: 查询的开始时间，格式为UTC毫秒，如果指定为-1，服务端将按(endTimeInMillis - durationInMinutes * 60 * 1000)计算开始时间 endTimeInMillis: 查询的结束时间，格式为UTC毫秒，如果指定

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
日志提示“root: XXX valid number is 0” - AI开发平台ModelArts

INFO: root: Predict valid number is 0. 原因分析该日志表示数据集中的有效样本量为0，可能有如下原因：数据未标注。标注的数据是不符合规格的（如目标检测算法要求标注为矩形框，但是提供数据标注为非矩形框）。处理方法请您检查数据是否已标注，或检查数据标注是否符合算法要求。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
ModelArts入门指引 - AI开发平台ModelArts

本文旨在帮助您了解ModelArts的基本使用流程以及相关的常见问题，帮助您快速上手ModelArts服务。面向不同AI基础的开发者，本文档提供了相应的入门教程，帮助用户更快速地了解ModelArts的功能，您可以根据经验选择相应的教程。面向AI开发零基础的用户，您可以使用ModelArts在AI

帮助中心 > AI开发平台ModelArts > 快速入门
资源池统计 - AI开发平台ModelArts

Integer 创建成功的资源池数量。 failed Integer 最近三天内创建失败的资源池数量，最大值为500。 pending Integer 等待中的资源池数量，通常是未支付的包周期资源池。状态码：500 表6 响应Body参数参数参数类型描述 error_code

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
获取APP列表 - AI开发平台ModelArts

String 分页展示时，从第几页开始。默认为0。 order 否 String 返回的APP列表排序方式，可选值包括asc、desc。默认为asc。 sort_by 否 String 返回的APP列表按何属性排序，可选值包括app_name、created_at、updated_at。默认为name。

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理

总条数： 510

上一页
1
2
3
4
5
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

多模态模型推理性能测试 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

更新资源池 - AI开发平台ModelArts

查询资源池上的标签 - AI开发平台ModelArts

查询APP详情 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

精度校验 - AI开发平台ModelArts

返回结果 - AI开发平台ModelArts

迁移效果校验 - AI开发平台ModelArts

在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

删除资源池 - AI开发平台ModelArts

查询API和APP - AI开发平台ModelArts

ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

获取用户绑定APP的api列表 - AI开发平台ModelArts

查询网络资源 - AI开发平台ModelArts

资源池监控 - AI开发平台ModelArts

日志提示“root: XXX valid number is 0” - AI开发平台ModelArts

ModelArts入门指引 - AI开发平台ModelArts

资源池统计 - AI开发平台ModelArts

获取APP列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线