搜索_华为云

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

行推理业务，2张卡运行的情况下，推荐的最大序列max-model-len长度最大是16K，此处的单位K是1024，即16*1024。测试方法：gpu-memory-utilization为0.9下，以4k、8k、16k递增max-model-len，直至达到能执行静态bench

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909）
删除镜像 - AI开发平台ModelArts
删除镜像 - AI开发平台ModelArts

表1 路径参数参数是否必选参数类型描述 id 是 String 镜像ID。 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 force 否 Boolean 删除在SWR的镜像内容，仅对于个人私有镜像有效。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
批量删除标签 - AI开发平台ModelArts

是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 delete_policy 否 Integer 是否删除标签及包含标签的样本。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询工作空间列表 - AI开发平台ModelArts

/v1/{project_id}/workspaces 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 offset 否 Integer 分页列表的起始页，默认为'0'。

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
批量修改标签 - AI开发平台ModelArts

是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 labels 否 Array of Label

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
推理性能测试 - AI开发平台ModelArts

0秒。例如输出数据比较大的调用请求（例如输出大于1k），请求预测会超过60秒导致调用失败，可提交工单设置请求超时时间。 benchmark方法介绍性能benchmark包括两部分。静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
查询镜像详情 - AI开发平台ModelArts

表1 路径参数参数是否必选参数类型描述 id 是 String 镜像ID。 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。请求参数无响应参数状态码： 200 表2 响应Body参数参数参数类型描述 arch String

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
日志提示"Permission denied" - AI开发平台ModelArts

sh，脚本里面有某些环境变量在新版本下发的作业中并不存在这些环境变量导致。可能原因是使用Python file接口并发读写同一文件。处理方法对挂载盘的数据加权限，可以改为与训练容器内相同的用户组（1000），假如/nas盘是挂载路径，执行如下代码。 chown -R 1000：1000

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 权限问题
更新数据集 - AI开发平台ModelArts

是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 add_labels 否 Array of Label

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用kv-cache-int8量化 - AI开发平台ModelArts

如果只测试推理功能和性能，不需要此json文件，此时scale系数默认为1，但是可能会造成精度下降。 per-tensor+per-head静态量化场景如需使用该场景量化方法，请自行准备kv-cache量化系数，格式和per-tensor静态量化所需的2. 抽取kv-cache量化系数生成的json文件一致，只

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
创建API - AI开发平台ModelArts
创建API - AI开发平台ModelArts

参数类型描述 service_id 是 String API所属的服务ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
推理性能测试 - AI开发平台ModelArts

0秒。例如输出数据比较大的调用请求（例如输出大于1k），请求预测会超过60秒导致调用失败，可提交工单设置请求超时时间。 benchmark方法介绍性能benchmark包括两部分。静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
查询节点池的节点列表 - AI开发平台ModelArts

ool_name}/nodes 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 资源池名称。 nodepool_name 是 String 节点池名称。

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
查询节点列表 - AI开发平台ModelArts

ool_name}/nodes 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 资源池名称。表2 Query参数参数是否必选参数类型描述 continue

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询资源规格列表 - AI开发平台ModelArts

/v1/{project_id}/resourceflavors 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 continue 否 String 分页查询时上一页位置。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询Notebook支持的可切换规格列表 - AI开发平台ModelArts

String Notebook实例ID，可通过调用查询Notebook实例列表接口获取。 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 limit 否 Integer 每一页的数量，默认不限制。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

Turbo的VPC网段的安全组是否被限制了。在所选专属资源池中新建一个未挂载的SFS Turbo的训练作业，当训练作业处于“运行中”时，通过Cloud Shell功能登录训练作业worker-0实例，使用curl {sfs-turbo-endpoint}:{port}命令检查port是否正常打开，SFS

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 专属资源池创建训练作业
费用账单 - AI开发平台ModelArts
费用账单 - AI开发平台ModelArts

ModelArts训练作业查询资源账单首先需要获取作业ID，而ModelArts控制台展示作业ID与账单中上报的资源ID不一致，您需要先了解作业ID的查询方法，以及作业ID与账单中上报的资源ID二者的对应关系。详细操作如下所述：查询资源ID。登录ModelArts管理控制台，选择“训练管理 >

帮助中心 > AI开发平台ModelArts > 计费说明
查询事件列表 - AI开发平台ModelArts

/v1/{project_id}/events 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 resource 是 String 事件所属资源类型。可选值为pools，表示资源池。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

本地路径$MA_JOB_DIR/{training-project}/。如果报错路径为训练数据路径，需要在以下两个地方完成适配，具体适配方法请参考自定义算法适配章节的输入输出配置部分：在创建算法时，您需要在输入路径配置中设置代码路径参数，默认为“data_url”。您需要在

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障

总条数： 961

上一页
1
...
42
43
44
...
49
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

删除镜像 - AI开发平台ModelArts

批量删除标签 - AI开发平台ModelArts

查询工作空间列表 - AI开发平台ModelArts

批量修改标签 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

查询镜像详情 - AI开发平台ModelArts

日志提示"Permission denied" - AI开发平台ModelArts

更新数据集 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

创建API - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

查询节点池的节点列表 - AI开发平台ModelArts

查询节点列表 - AI开发平台ModelArts

查询资源规格列表 - AI开发平台ModelArts

查询Notebook支持的可切换规格列表 - AI开发平台ModelArts

创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

费用账单 - AI开发平台ModelArts

查询事件列表 - AI开发平台ModelArts

训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线