搜索_华为云

更新模型服务的单个属性 - AI开发平台ModelArts

ce_id}/property 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 service_id 是 String 服务ID。请求参数表2 请求Header参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
多模态模型推理性能测试 - AI开发平台ModelArts

多模态模型推理性能测试 benchmark方法介绍静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理性能测试
多模态模型推理性能测试 - AI开发平台ModelArts

多模态模型推理性能测试 benchmark方法介绍静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
多模态模型推理性能测试 - AI开发平台ModelArts

多模态模型推理性能测试 benchmark方法介绍静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理性能测试
权限配置 - AI开发平台ModelArts
权限配置 - AI开发平台ModelArts

权限配置权限列表为了便于理解权限相关内容，建议先阅读ModelArts权限管理基本概念。表1 服务授权列表待授权的服务适用场景 ModelArts 授予子用户使用ModelArts服务的权限。 ModelArts CommonOperations没有任何专属资源池的创建

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
查看训练作业资源占用情况 - AI开发平台ModelArts

图2 作业列表显示作业资源利用率情况此处的作业资源利用率只涉及GPU和NPU资源。作业worker-0实例的GPU/NPU平均利用率计算方法：将作业worker-0实例的各个GPU/NPU加速卡每个时间点的利用率汇总取平均值。如何提高训练作业资源利用率适当增大batch_s

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
查询所有团队的标注成员列表 - AI开发平台ModelArts

kforces/workers 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 limit 否 Integer 指定每一页返回的最大条目数，取值范围[1

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询Notebook支持的有效规格列表 - AI开发平台ModelArts

/v1/{project_id}/notebooks/flavors 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 category 否 String 规格处理器类型。 CPU

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
Lite Server算力资源和镜像版本配套关系 - AI开发平台ModelArts

Lite Server算力资源和镜像版本配套关系 Lite Server提供多种NPU、GPU镜像，您可在购买前了解当前支持的镜像及对应详情。 NPU Snt9裸金属服务器支持的镜像详情镜像名称：ModelArts-Euler2.8_Aarch64_Snt9_C78 表1 镜像详情

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server使用前必读
MoXing常用操作的样例代码 - AI开发平台ModelArts

比较低。如果以写入模式或追加模式打开文件，当调用write方法时，待写入内容只是暂时的被存在的缓冲区，直到关闭文件对象（退出with语句时会自动关闭文件对象）或者主动调用文件对象的close()方法或flush()方法时，文件内容才会被写入。列举操作列举一个OBS目录，只返回顶层结果（相对路径），不做递归列举。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
推理场景介绍 - AI开发平台ModelArts

支持的rope scaling类型本方案支持的rope scaling类型包括linear、dynamic和yarn，其中linear方法只支持传入一个固定的scaling factor值，暂不支持传入列表。模型软件包结构说明本教程需要使用到的AscendCloud-6.3

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909）
自定义镜像使用场景 - AI开发平台ModelArts

自定义镜像使用场景在AI业务开发以及运行的过程中，一般都会有复杂的环境依赖需要进行调测并固化。面对开发中的开发环境的脆弱和多轨切换问题，在ModelArts的AI开发最佳实践中，通过容器镜像的方式将运行环境进行固化，以这种方式不仅能够进行依赖管理，而且可以方便的完成工作环境切换

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard
查询开发环境实例列表 - AI开发平台ModelArts

Path参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 query请求参数参数是否必选参数类型说明 de_type 是 String 开发环境类型，当前

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
基本配置 - AI开发平台ModelArts
基本配置 - AI开发平台ModelArts

基本配置权限配置创建网络专属资源池VPC打通 ECS服务器挂载SFS Turbo存储在ECS中创建ma-user和ma-group obsutil安装和配置（可选）工作空间配置父主题：专属资源池训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
解析Pascal VOC文件 - AI开发平台ModelArts

是否必选参数类型描述 xml_file_path 是 String xml文件路径。 session 否 Object 会话对象，初始化方法请参见Session鉴权。当需要操作OBS时必填。表2 pascal_voc 返回参数参数参数类型描述 folder String

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
查询标注团队的成员列表 - AI开发平台ModelArts

rce_id}/workers 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workforce_id 是 String 标注团队ID。表2 Query参数参数是否必选参数类型描述

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
通过patch操作对服务进行更新 - AI开发平台ModelArts

es/{service_id} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 service_id 是 String 服务ID。请求参数表2 请求Header参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
获取训练作业支持的公共规格 - AI开发平台ModelArts

ing-job-flavors 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 flavor_type 否 String 查询训练作业规格的类型，不填为查询所有。枚举值：

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
获取样本搜索条件 - AI开发平台ModelArts

是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数无响应参数状态码： 200 表2 响应Body参数参数参数类型描述 labelers Array

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

行推理业务，2张卡运行的情况下，推荐的最大序列max-model-len长度最大是16K，此处的单位K是1024，即16*1024。测试方法：gpu-memory-utilization为0.9下，以4k、8k、16k递增max-model-len，直至达到能执行静态bench

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）

总条数： 1511

上一页
1
...
66
67
68
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

更新模型服务的单个属性 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

权限配置 - AI开发平台ModelArts

查看训练作业资源占用情况 - AI开发平台ModelArts

查询所有团队的标注成员列表 - AI开发平台ModelArts

查询Notebook支持的有效规格列表 - AI开发平台ModelArts

Lite Server算力资源和镜像版本配套关系 - AI开发平台ModelArts

MoXing常用操作的样例代码 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

自定义镜像使用场景 - AI开发平台ModelArts

查询开发环境实例列表 - AI开发平台ModelArts

基本配置 - AI开发平台ModelArts

解析Pascal VOC文件 - AI开发平台ModelArts

查询标注团队的成员列表 - AI开发平台ModelArts

通过patch操作对服务进行更新 - AI开发平台ModelArts

获取训练作业支持的公共规格 - AI开发平台ModelArts

获取样本搜索条件 - AI开发平台ModelArts

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线