搜索_华为云

查询服务列表 - AI开发平台ModelArts

表2 Query参数参数是否必选参数类型描述 service_id 否 String 服务ID，在创建服务时即可在返回体中获取，也可通过查询服务列表接口获取当前用户拥有的服务，其中service_id字段即为服务ID。默认不过滤服务ID。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
获取API授权关系列表 - AI开发平台ModelArts

枚举值如下： APIC：该APP注册在roma connect网关上 APIG：该APP注册在共享API网关上 DEDICATE_APIG：该APP注册在专享API网关上 bounded_api_count Integer APP绑定API数量。

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
创建模型成功后，部署服务报错，如何排查代码问题 - AI开发平台ModelArts

处理方法服务部署失败后，进入服务详情界面，查看服务部署日志，明确服务部署失败原因（用户代码输出需要使用标准输入输出函数，否则输出的内容不会呈现到前端页面日志）。根据日志中提示的报错信息找到对应的代码进行定位。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
使用MaaS部署模型服务 - AI开发平台ModelArts

在ModelArts Studio左侧导航栏中，选择“模型部署”进入服务列表。选择“我的服务”页签。单击服务名称，进入部署模型服务详情页面，可以查看服务信息。 “详情”：可以查看服务的基本信息，包括服务、模型、资源等设置信息。 “监控”：可以查看服务监控和资源监控信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
查看批量服务详情 - AI开发平台ModelArts

查看批量服务详情当模型部署为批量服务成功后，您可以进入“批量服务”页面，来查看服务详情。登录ModelArts管理控制台，在左侧菜单栏中选择“模型部署>批量服务”，进入“批量服务”管理页面。单击目标服务名称，进入服务详情页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
修改批量服务配置 - AI开发平台ModelArts

您可以通过如下两种方式修改服务的基本信息：方式一：通过服务管理页面修改服务信息方式二：通过服务详情页面修改服务信息前提条件服务已部署成功，“部署中”的服务不支持修改服务信息进行升级。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
在MaaS体验模型服务 - AI开发平台ModelArts

在MaaS体验模型服务在ModelArts Studio大模型即服务平台，运行中的模型服务可以在“模型体验”页面在线体验模型服务的推理效果。前提条件在“模型部署”的服务列表存在“运行中”的模型服务。操作步骤登录ModelArts管理控制台。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
免费体验MaaS预置服务 - AI开发平台ModelArts

在预置服务列表，选择所需的服务，单击操作列的“领取”。当领取置灰时，表示该服务的免费额度已领取。有以下两种方式免费体验预置服务。在“模型体验”页面进行推理。在预置服务列表，选择所需的服务，单击操作列的“体验”，跳转到“模型体验”页面，进行参数设置后，即可开始问答体验。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
非分离部署推理服务 - AI开发平台ModelArts

方式一：通过OpenAI服务API接口启动服务【推荐，在vllm-0.6.0之后的版本性能更好】在llm_inference/ascend_vllm/目录下通OpenAI服务API接口启动服务，具体操作命令如下，可以根据参数说明修改配置。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
非分离部署推理服务 - AI开发平台ModelArts

如果需要增加模型量化功能，启动推理服务前，先参考使用AWQ量化、使用SmoothQuant量化或使用GPTQ量化章节对模型做量化处理启动服务与请求。此处提供vLLM服务API接口启动和OpenAI服务API接口启动2种方式。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
使用CTS审计ModelArts服务 - AI开发平台ModelArts

使用CTS审计ModelArts服务 ModelArts支持云审计的关键操作查看ModelArts相关审计日志

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
非分离部署推理服务 - AI开发平台ModelArts

方式一：通过OpenAI服务API接口启动服务在llm_inference/ascend_vllm/目录下通OpenAI服务API接口启动服务，具体操作命令如下，可以根据参数说明修改配置。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
查询服务列表 - AI开发平台ModelArts

invocation_times Number 服务的总调用次数。 failed_times Number 服务调用失败次数。 is_shared Boolean 是否是订阅的服务。 shared_count Number 订阅的服务数。父主题：服务管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

图1 调用接口当部署推理服务的“安全认证”选择了“AppCode认证”，则需要将复制的接口代码中headers中的X-Apig-AppCode的参数值修改为真实的AppCode值。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
查询支持的服务部署规格 - AI开发平台ModelArts

父主题：服务管理

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
API/SDK - AI开发平台ModelArts
API/SDK - AI开发平台ModelArts

API/SDK 安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” ModelArts SDK下载文件目标路径设置为文件名，部署服务时报错调用API创建训练作业，训练作业异常用户执行huaweicloud.com

帮助中心 > AI开发平台ModelArts > 故障排除
非分离部署推理服务 - AI开发平台ModelArts

方式一：通过OpenAI服务API接口启动服务【推荐，在vllm-0.6.0之后的版本性能更好】在llm_inference/ascend_vllm/目录下通OpenAI服务API接口启动服务，具体操作命令如下，可以根据参数说明修改配置。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。准备工作使用专属资源池部署在线服务，服务状态为“运行中”。只有专属资源池部署的服务才支持VPC直连的高速访问通道。 VPC直连的高速访问通道，目前只支持访问在线服务。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
边缘服务 - AI开发平台ModelArts
边缘服务 - AI开发平台ModelArts

边缘服务什么是边缘节点？更新AI应用版本时，边缘服务预测功能不可用？使用边缘节点部署边缘服务能否使用http接口协议？父主题：部署上线

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线
设置在线服务故障自动重启 - AI开发平台ModelArts

设置在线服务故障自动重启场景描述当系统检测到Snt9b硬件故障时，自动复位Snt9B芯片并重启推理在线服务，提升了推理在线服务的恢复速度。约束限制仅支持使用Snt9b资源的同步在线服务。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务

总条数： 1647

上一页
1
...
4
5
6
...
83
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询服务列表 - AI开发平台ModelArts

获取API授权关系列表 - AI开发平台ModelArts

创建模型成功后，部署服务报错，如何排查代码问题 - AI开发平台ModelArts

使用MaaS部署模型服务 - AI开发平台ModelArts

查看批量服务详情 - AI开发平台ModelArts

修改批量服务配置 - AI开发平台ModelArts

在MaaS体验模型服务 - AI开发平台ModelArts

免费体验MaaS预置服务 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

使用CTS审计ModelArts服务 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

查询支持的服务部署规格 - AI开发平台ModelArts

API/SDK - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

边缘服务 - AI开发平台ModelArts

设置在线服务故障自动重启 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线