搜索_华为云

查询API和APP - AI开发平台ModelArts

查询API和APP 功能介绍查询服务授权的API、APP信息。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/servi

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
解除API对APP的授权 - AI开发平台ModelArts

解除API对APP的授权功能介绍解除指定的API对APP的授权，请求用户对API所属服务必须有更新权限。同URL：/v1/{project_id}/app-auth/{service_id}/apis/{api_id}/auths 调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
查询用户所有DevServer实例列表 - AI开发平台ModelArts

EndpointsRes objects 服务器的私有IP信息。 image ServerImageResponse object 服务器镜像信息。 category String 服务器归属类型。 HPS：超节点服务器 SPOD：整柜服务器 SERVER：单台服务器 server_hps ServerHpsInfo

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

EndpointsRes objects 服务器的私有IP信息。 image ServerImageResponse object 服务器镜像信息。 category String 服务器归属类型。 HPS：超节点服务器 SPOD：整柜服务器 SERVER：单台服务器 server_hps ServerHpsInfo

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
不同机型的对应的软件配套版本 - AI开发平台ModelArts

由于弹性集群资源池可选择弹性裸金属或弹性云服务器作为节点资源，不同机型的节点对应的操作系统、适用的CCE集群版本等不相同，为了便于您制作镜像、升级软件等操作，本文对不同机型对应的软件配套版本做了详细介绍。裸金属服务器的对应的软件配套版本表1 裸金属服务器类型卡类型 RDMA网络协议

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
删除API - AI开发平台ModelArts
删除API - AI开发平台ModelArts

删除API 功能介绍删除指定的API，只有对API所属服务有删除权限的用户才可以删除API。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI DELETE /v1/

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
注册API并授权给APP - AI开发平台ModelArts

project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 service_id 是 String 服务编号，可通过查询服务列表获取。请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户token。

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
准备Notebook - AI开发平台ModelArts

Notebook云上云下，无缝协同，更多关于ModelArts Notebook的详细资料请查看开发环境介绍。本案例中使用ModelArts的开发环境Notebook部署推理服务进行调试，请按照以下步骤完成Notebook的创建。登录ModelArts控制台，在贵阳一区域，进入开发环境的Notebook界面，单击

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
guided-decoding - AI开发平台ModelArts

print(outputs[0].outputs[0].text) MODEL_NAME表示对应模型路径。在线推理使用Guided Decoding 启动推理服务请参考启动推理服务章节。在线推理使用Guided Decoding时，在发送的请求中包含上述guided_json架构，具体示例可参考以下代码。 curl

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
查询OS的配置参数 - AI开发平台ModelArts

查询OS的配置参数功能介绍获取ModelArts OS服务的配置参数，如网络网段，用户资源配额等。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
管理ModelArts模型版本 - AI开发平台ModelArts

除对应的版本。如果模型的版本已经部署服务，需先删除关联的服务后再执行删除操作。版本删除后不可恢复，请谨慎操作。删除模型在“模型管理”页面，单击模型“操作”列的“删除”，即可删除对应的模型。如果模型的版本已经部署服务，需先删除关联的服务后再执行删除操作。模型删除后不可恢复，请谨慎操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
查询OS的配额 - AI开发平台ModelArts

查询OS的配额功能介绍获取ModelArts OS服务中部分资源的配额，如资源池配额、网络配额等。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
推理精度测试 - AI开发平台ModelArts

默认为1。 service_name：服务名称，保存评测结果时创建目录，示例为：qwen-14b-test。 eval_dataset：评测使用的评测集（枚举值），目前仅支持mmlu、ceval。 service_url：服务接口地址，若服务部署在notebook中，该地址为"http://127

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
应用场景 - AI开发平台ModelArts
应用场景 - AI开发平台ModelArts

的方案，高效解决业务内容审核的算力/国产化需求，助力企业业务稳健发展。政府提高公共服务的效率和质量，加强公共安全，优化政策方案和决策过程等。金融为金融机构带来更加高效、智能、精准的服务。矿山提供端到端AI生产线能力和高性能AI算力，提升大模型推理效率，为矿山行业带来更高效、智能、安全和可持续的生产方案。

帮助中心 > AI开发平台ModelArts > 产品介绍
投机推理使用说明 - AI开发平台ModelArts

"stream": false }' 执行推理参考配置服务化参数。Ascend vllm使用该特性需参考表1，其它参数请参考启动推理服务。启动服务。具体请参考启动推理服务。精度评测和性能评测。具体请参考推理服务精度评测和推理服务性能评测。父主题：投机推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
Standard资源池功能介绍 - AI开发平台ModelArts

Standard资源池，提供了在使用ModelArts进行AI开发（包括自动学习、创建Workflow工作流、创建Notebook实例、创建训练作业和创建推理服务）所需的计算资源，您可根据需要购买使用Standard资源池。图1 在AI开发时使用Standard资源池 ModelArts Standard资源池说明

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
在ModelArts控制台查看监控指标 - AI开发平台ModelArts

节点的CPU、GPU、NPU资源使用情况。具体请参见训练资源监控章节。在线服务：用户将模型部署为在线服务后，可以通过监控功能查看CPU、内存、GPU等资源使用统计信息和模型调用次数统计，具体参见查看服务详情章节。父主题： ModelArts Standard资源监控

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
使用前必读 - AI开发平台ModelArts

址，不同服务不同区域的终端节点不同，您可以从地区和终端节点中查询所有服务的终端节点。约束与限制您能创建的ModelArts资源的数量与配额有关系，具体请参见服务配额。更详细的限制请参见具体API的说明。基本概念账号用户注册时的账号，账号对其所拥有的资源及云服务具有完全

 帮助中心 > AI开发平台ModelArts > API参考
ModelArts Standard资源监控概述 - AI开发平台ModelArts

PU资源使用情况。具体请参见训练资源监控章节。 Standard在线服务：用户将模型部署为在线服务后，可以通过监控功能查看该推理服务的CPU、内存或GPU等资源使用统计信息和模型调用次数统计，具体参见查看推理服务详情章节。方式二：通过AOM查看所有监控指标 ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
费用账单 - AI开发平台ModelArts
费用账单 - AI开发平台ModelArts

署 > 在线服务”，在“在线服务”列表页，复制实例名称。单击服务名称进入服务详情页，在“配置更新记录”页签中，单击模型名称，进入模型详情页。在“基本信息”中，复制模型的ID。图3 获取模型ID 根据查询到的资源名称拼接账单中上报的资源名称。拼接规则：在线服务名称-模型的ID

帮助中心 > AI开发平台ModelArts > 计费说明

总条数： 2226

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询API和APP - AI开发平台ModelArts

解除API对APP的授权 - AI开发平台ModelArts

查询用户所有DevServer实例列表 - AI开发平台ModelArts

实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

不同机型的对应的软件配套版本 - AI开发平台ModelArts

删除API - AI开发平台ModelArts

注册API并授权给APP - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

guided-decoding - AI开发平台ModelArts

查询OS的配置参数 - AI开发平台ModelArts

管理ModelArts模型版本 - AI开发平台ModelArts

查询OS的配额 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

应用场景 - AI开发平台ModelArts

投机推理使用说明 - AI开发平台ModelArts

Standard资源池功能介绍 - AI开发平台ModelArts

在ModelArts控制台查看监控指标 - AI开发平台ModelArts

使用前必读 - AI开发平台ModelArts

ModelArts Standard资源监控概述 - AI开发平台ModelArts

费用账单 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线