搜索_华为云

推理性能测试 - AI开发平台ModelArts

--backend：服务类型，支持tgi、vllm、mindspore、openai等。本文档使用的推理接口是vllm。 --host：服务IP地址，如127.0.0.1。 --port：服务端口，和推理服务端口8080。 --url：如果以vllm接口方式启动服务，API接口公网地

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

序列说明基于vLLM（v0.6.0）部署推理服务时，不同模型推理支持的最小昇腾卡数和对应卡数下的max-model-len长度说明，如下面的表格所示。以下值是在gpu-memory-utilization为0.9时测试得出，为服务部署所需的最小昇腾卡数及该卡数下推荐的最大ma

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910）
附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

序列说明基于vLLM（v0.6.0）部署推理服务时，不同模型推理支持的最小昇腾卡数和对应卡数下的max-model-len长度说明，如下面的表格所示。以下值是在gpu-memory-utilization为0.9时测试得出，为服务部署所需的最小昇腾卡数及该卡数下推荐的最大ma

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

序列说明基于vLLM（v0.6.0）部署推理服务时，不同模型推理支持的最小昇腾卡数和对应卡数下的max-model-len长度说明，如下面的表格所示。以下值是在gpu-memory-utilization为0.9时测试得出，为服务部署所需的最小昇腾卡数及该卡数下推荐的最大ma

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
推理性能测试 - AI开发平台ModelArts

--backend：服务类型，支持tgi、vllm、mindspore、openai等。本文档使用的推理接口是vllm。 --host：服务IP地址，如127.0.0.1。 --port：服务端口，和推理服务端口8080。 --url：如果以vllm接口方式启动服务，API接口公网地

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

序列说明基于vLLM（v0.6.3）部署推理服务时，不同模型推理支持的最小昇腾卡数和对应卡数下的max-model-len长度说明，如下面的表格所示。以下值是在gpu-memory-utilization为0.9时测试得出，为服务部署所需的最小昇腾卡数及该卡数下推荐的最大ma

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
Bert基于Lite Server适配MindSpore Lite推理指导(6.3.910) - AI开发平台ModelArts

过SSH登录，不同机器之间网络互通。购买Lite Server资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 内容审核模型训练推理
批量更新团队标注样本的标签 - AI开发平台ModelArts

SampleLabel objects 样本标签列表，为空表示删除样本的所有标签。 metadata 否 SampleMetadata object 样本metadata属性键值对。 sample_id 否 String 样本ID。 sample_type 否 Integer 样本类型。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
增加AppCode - AI开发平台ModelArts
增加AppCode - AI开发平台ModelArts

以实际取值为准。响应参数状态码：200 表4 响应Body参数参数参数类型描述 app ApigAppDetailInfo object 创建的APP基础信息。表5 ApigAppDetailInfo 参数参数类型描述 app_codes Array of strings

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
创建API - AI开发平台ModelArts
创建API - AI开发平台ModelArts

API描述。字符长度不超过255。响应参数状态码：200 表4 响应Body参数参数参数类型描述 api AuthTypeApiBasicInfo object API认证详情。表5 AuthTypeApiBasicInfo 参数参数类型描述 api_id String API编号。 api_method

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
创建数据集标签 - AI开发平台ModelArts

标签的多维度属性，如标签为“音乐”，可能包含属性“风格”、“歌手”等。 name 否 String 标签名称。 property 否 LabelProperty object 标签基本属性键值对，如颜色、快捷键等。 type 否 Integer 标签类型。可选值如下： 0：图像分类 1：物体检测 3: 图像分割

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
重置AppCode - AI开发平台ModelArts
重置AppCode - AI开发平台ModelArts

以实际取值为准。响应参数状态码：200 表4 响应Body参数参数参数类型描述 app ApigAppDetailInfo object 创建的APP基础信息。表5 ApigAppDetailInfo 参数参数类型描述 app_codes Array of strings

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
获取训练作业支持的AI预置框架 - AI开发平台ModelArts

Boolean 是否为v1兼容模式。 run_user String 引擎默认启动用户uid。 image_info image_info object 引擎具体信息。表4 image_info 参数参数类型描述 cpu_image_url String cpu规格下对应镜像。 gpu_image_url

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
自定义镜像规范 - AI开发平台ModelArts

Gallery在线推理服务部署模型。如果使用自定义镜像进行训练，操作步骤可以参考使用AI Gallery微调大师训练模型，其中“训练任务类型”默认选择“自定义”，且不支持修改。如果使用自定义镜像进行部署推理服务，操作步骤可以参考使用AI Gallery在线推理服务部署模型，其中“推

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
ModelArts计费模式概述 - AI开发平台ModelArts

ModelArts计费模式概述 ModelArts服务提供包年/包月和按需计费两种计费模式，以满足不同场景下的用户需求。如您需要快速了解ModelArts服务不同计费模式的具体价格，请参见ModelArts价格详情。包年/包月：一种预付费模式，即先付费再使用，按照订单的购买周期

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
如何登录并上传镜像到SWR？ - AI开发平台ModelArts

如何登录并上传镜像到SWR？本章节介绍如何上传镜像到容器镜像服务SWR。 Step1 登录SWR 登录容器镜像服务控制台，选择区域。单击右上角“创建组织”，输入组织名称完成组织创建。您可以自定义组织名称，本示例使用“deep-learning”，实际操作时请重新命名一个组织名

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
从0-1制作自定义镜像并创建模型 - AI开发平台ModelArts

"application/json" } } ] 将模型部署为在线服务参考部署为在线服务将模型部署为在线服务。在线服务创建成功后，您可以在服务详情页查看服务详情。您可以通过“预测”页签访问在线服务。图5 访问在线服务父主题： Standard推理部署

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
批量删除标签 - AI开发平台ModelArts

标签的多维度属性，如标签为“音乐”，可能包含属性“风格”、“歌手”等。 name 否 String 标签名称。 property 否 LabelProperty object 标签基本属性键值对，如颜色、快捷键等。 type 否 Integer 标签类型。可选值如下： 0：图像分类 1：物体检测 3: 图像分割

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询API和APP - AI开发平台ModelArts

描述 enable_app_auth Boolean APP是否已授权。 app_auth_api AppAuthApiAuthInfo object API已授权的APP的基本信息。表5 AppAuthApiAuthInfo 参数参数类型描述 api_id String API编号。

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
重置AppSecret - AI开发平台ModelArts

以实际取值为准。响应参数状态码：200 表4 响应Body参数参数参数类型描述 app ApigAppDetailInfo object 创建的APP基础信息。表5 ApigAppDetailInfo 参数参数类型描述 app_codes Array of strings

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理

总条数： 1576

上一页
1
...
62
63
64
...
79
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理性能测试 - AI开发平台ModelArts

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

Bert基于Lite Server适配MindSpore Lite推理指导(6.3.910) - AI开发平台ModelArts

批量更新团队标注样本的标签 - AI开发平台ModelArts

增加AppCode - AI开发平台ModelArts

创建API - AI开发平台ModelArts

创建数据集标签 - AI开发平台ModelArts

重置AppCode - AI开发平台ModelArts

获取训练作业支持的AI预置框架 - AI开发平台ModelArts

自定义镜像规范 - AI开发平台ModelArts

ModelArts计费模式概述 - AI开发平台ModelArts

如何登录并上传镜像到SWR？ - AI开发平台ModelArts

从0-1制作自定义镜像并创建模型 - AI开发平台ModelArts

批量删除标签 - AI开发平台ModelArts

查询API和APP - AI开发平台ModelArts

重置AppSecret - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线