搜索_华为云

查询事件列表 - AI开发平台ModelArts

查询事件列表功能介绍查询事件列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/events 表1 路径参数参数是否必选

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询节点列表 - AI开发平台ModelArts

查询节点列表功能介绍查询资源池中的节点列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/pools/{pool_name}/nodes

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询资源实时利用率 - AI开发平台ModelArts

查询资源实时利用率功能介绍查询当前项目下所有资源池的实时利用率。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/metrics/runtime/pools

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询资源池上的标签 - AI开发平台ModelArts

查询资源池上的标签功能介绍查询指定资源池的标签。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/pools/{pool_name}/tags

帮助中心 > AI开发平台ModelArts > API参考 > 资源标签管理
获取账号名和账号ID - AI开发平台ModelArts

name）和账号ID（domain_id）。获取步骤如下：注册并登录管理控制台。鼠标移动至用户名，在下拉列表中单击“我的凭证”。在“API凭证”页面的查看“账号名”和“账号ID”。图1 获取账号名和ID 父主题：公共参数

 帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
推理精度测试 - AI开发平台ModelArts

├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字 ├──vllm_ppl.py #ppl精度测试脚本精度评测切换conda环境，确保之前启动服务为vllm接

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909）
使用CES监控Lite Server资源 - AI开发平台ModelArts

当前账户需要给CES授权委托，请参考创建用户并授权使用云监控服务。当前还不支持在CES界面直接一键安装监控，需要登录到服务器上执行以下命令安装配置Agent。其它region的安装请参考单台主机下安装Agent。 cd /usr/local && curl -k -O https://obs.cn-north-4.myhuaweicloud

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
推理精度测试 - AI开发平台ModelArts

├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字 ├──vllm_ppl.py #ppl精度测试脚本精度评测切换conda环境，确保之前启动服务为vllm

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.912） - AI开发平台ModelArts

本文档。确保容器可以访问公网。步骤一：准备环境请参考Lite Server资源开通，购买Server资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
获取支持的超参搜索算法 - AI开发平台ModelArts

获取支持的超参搜索算法功能介绍获取支持的超参搜索算法。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/search-algorithms

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询资源规格列表 - AI开发平台ModelArts

查询资源规格列表功能介绍查询资源规格列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/resourceflavors

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询指定节点池详情 - AI开发平台ModelArts

查询指定节点池详情功能介绍查询指定节点池详情。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/pools/{pool_

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
获取训练作业支持的公共规格 - AI开发平台ModelArts

获取训练作业支持的公共规格功能介绍获取训练作业支持的公共规格。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/training-job-flavors

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
删除Workflow工作流 - AI开发平台ModelArts

删除Workflow工作流功能介绍通过ID删除Workflow工作流。接口约束无调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI DELETE /v2/{pr

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
查询Workflow待办事项 - AI开发平台ModelArts

查询Workflow待办事项功能介绍获取Workflow待办列表。接口约束无调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
服务部署、启动、升级和修改时，容器健康检查失败如何处理？ - AI开发平台ModelArts

服务部署、启动、升级和修改时，容器健康检查失败如何处理？问题现象服务部署、启动、升级和修改时，容器健康检查失败。原因分析容器提供的健康检查接口调用失败。容器健康检查接口调用失败，原因可能有两种：镜像健康检查配置问题模型健康检查配置问题解决方法根据容器日志进行排查，查看健康检查接口失败的具体原因。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
推理精度测试 - AI开发平台ModelArts

vllm_path：构造vllm评测配置脚本名字，默认为vllm。 host：与起服务的host保持一致，比如起服务为0.0.0.0,host设置也为0.0.0.0。 service_port：服务端口，与启动服务时的端口保持，比如8080。 max_out_len：在运行类似mmlu、

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题问题1：在推理预测过程中遇到NPU out of memory 解决方法：调整推理服务启动时的显存利用率，将--gpu-memory-utilization的值调小。问题2：在推理预测过程中遇到ValueError:User-specified max_model_len

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906）
管理批量服务生命周期 - AI开发平台ModelArts

“模型部署>批量服务”，进入批量服务管理页面。单击目标服务名称，进入服务详情页面。您可以单击页面右上角“停止”，停止正在运行中服务。部署方式为ModelArts边缘节点和ModelArts边缘资源池的服务不支持停止。删除服务如果服务不再使用，您可以删除服务释放资源。登录M

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
Prefix Caching - AI开发平台ModelArts

--enable-prefix-caching 执行推理参考配置服务化参数。Ascend vllm使用该特性需参考表1和表2，其它参数请启动推理服务。启动服务。具体请参考启动推理服务。精度评测和性能评测。具体请参考推理服务精度评测和推理服务性能评测。父主题：推理关键特性使用

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用

总条数： 2320

上一页
1
...
91
92
93
...
116
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询事件列表 - AI开发平台ModelArts

查询节点列表 - AI开发平台ModelArts

查询资源实时利用率 - AI开发平台ModelArts

查询资源池上的标签 - AI开发平台ModelArts

获取账号名和账号ID - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

使用CES监控Lite Server资源 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.912） - AI开发平台ModelArts

获取支持的超参搜索算法 - AI开发平台ModelArts

查询资源规格列表 - AI开发平台ModelArts

查询指定节点池详情 - AI开发平台ModelArts

获取训练作业支持的公共规格 - AI开发平台ModelArts

删除Workflow工作流 - AI开发平台ModelArts

查询Workflow待办事项 - AI开发平台ModelArts

服务部署、启动、升级和修改时，容器健康检查失败如何处理？ - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

管理批量服务生命周期 - AI开发平台ModelArts

Prefix Caching - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线