搜索_华为云

添加资源标签 - AI开发平台ModelArts

添加资源标签功能介绍给指定服务添加标签（目前只支持在线服务），当添加的标签key已存在，则覆盖该标签的value。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
使用AWQ量化工具转换权重 - AI开发平台ModelArts

详细说明可以参考vLLM官网：https://docs.vllm.ai/en/latest/quantization/auto_awq.html。 Step2 权重格式转换 AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，需要进行权重转换。进入llm_tools代码目录下执行以下脚本：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
查询服务详情 - AI开发平台ModelArts

服务当前运行所用配置的更新时间，距“1970.1.1 0:0:0 UTC”的毫秒数。 debug_url String 在线服务在线调试地址，只有当模型支持在线调试且只有一个实例的时候会存在。 due_time Number 在线服务自动停止时间，距“1970.1.1 0:0:0 UTC”的毫秒数，未配置自动停止则不返回。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
服务预测失败 - AI开发平台ModelArts

出现ModelArts.XXXX类型的报错，表示请求在Dispatcher出现问题而被拦截。常见报错：在线服务预测报错ModelArts.4302 在线服务预测报错ModelArts.4206 在线服务预测报错ModelArts.4503 当使用推理的镜像并且出现MR.XXXX类型的错误时

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
在MaaS体验模型服务 - AI开发平台ModelArts

在左侧导航栏中，选择“模型部署”。在“模型部署”页面，任选以下方式进入模型体验页面。在“预置服务”页签，单击操作列“在线体验”，进入“模型体验”页面。在“我的服务”页签，单击操作列“更多 > 在线体验”，进入“模型体验”页面。在“模型体验”右上角，单击“参数设置”，拖动或直接输入数值配置推理参

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

示模型可以使用。步骤三：使用订阅模型部署在线服务模型订阅成功后，可将此模型部署为在线服务在展开的版本列表中，单击“部署 > 在线服务”跳转至部署页面。图2 部署模型在部署页面，参考如下说明填写关键参数。 “名称”：自定义一个在线服务的名称，也可以使用默认值，此处以“商超商品识别服务”为例。

帮助中心 > AI开发平台ModelArts > 快速入门
ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

VPC直连的高速访问通道，目前只支持访问在线服务。因流量限控，获取在线服务的IP和端口号次数有限制，每个主账号租户调用次数不超过2000次/分钟，每个子账号租户不超过20次/分钟。目前仅支持自定义镜像导入模型，部署的服务支持高速访问通道。操作步骤使用VPC直连的高速访问通道访问在线服务，基本操作步骤如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

SDK，则需要在本地环境中安装ModelArts SDK，安装后可直接调用ModelArts SDK轻松管理数据集、创建ModelArts训练作业及创建AI应用，并将其部署为在线服务。 ModelArts SDK使用限制本地ModelArts SDK不支持进行训练作业调测、模型调试和在开发环境中部署本地服务进行调

 帮助中心 > AI开发平台ModelArts > SDK参考
更新模型服务的单个属性 - AI开发平台ModelArts

更新模型服务的单个属性功能介绍更新模型服务的单个属性，目前只支持instance_count(更新模型服务实例数量)，仅运行中、告警、异常状态下的在线服务可以执行该操作。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
使用MaaS调优模型 - AI开发平台ModelArts

模型。模型创建成功后，单击模型名称，在“我的版本”区域，单击版本号。在“任务记录”区域，可以看到“作业类型”为“权重格式转换”的任务。图1 权重格式转换场景二：将Checkpoint添加为调优后模型版本。在“Checkpoint列表”页面的“操作”列，单击“添加为调优后模型版本”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

模型镜像。服务运维阶段，先利用镜像构建模型，接着部署模型为在线服务，然后可在云监控服务（CES）中获得ModelArts推理在线服务的监控数据，最后可配置告警规则实现实时告警通知。业务运行阶段，先将业务系统对接在线服务请求，然后进行业务逻辑处理和监控设置。图1 推理服务的端到端运维流程图

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
ModelArts Standard使用流程 - AI开发平台ModelArts

部署模型部署服务 ModelArts支持将模型部署为在线服务、批量服务和边缘服务。部署为在线服务部署为批量服务访问服务服务部署完成后，针对在线服务和边缘服务，您可以访问并使用服务，针对批量服务，您可以查看其预测结果。访问在线服务查看批量服务预测结果

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
Wav2Lip训练基于Lite Server适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

in certificate chain 图1 报错SSL certificate problem 可采取忽略SSL证书验证：使用以下命令来克隆仓库，它将忽略SSL证书验证。 git clone -c http.sslVerify=false https://github.com/Rudrabha/Wav2Lip

帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
在ModelArts中调整模型后，部署新版本模型能否保持原API接口不变？ - AI开发平台ModelArts

已存在部署完成的服务。已完成模型调整，创建模型。操作步骤登录ModelArts管理控制台，在左侧导航栏中选择“部署上线 > 在线服务”，默认进入“在线服务”列表。在部署完成的目标服务中，单击操作列的“修改”，进入“修改服务”页面。在选择模型及配置中，单击“增加模型版本进行灰度发布”添加新版本。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

将AI Gallery中的模型部署为AI应用 AI Gallery支持将模型部署为AI应用，在线共享给其他用户使用。前提条件选择的模型必须是支持部署为AI应用的模型，否则模型详情页没有“部署 > AI应用”选项。部署AI应用登录AI Gallery。单击“模型”进入模型列表。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
为什么项目删除完了，仍然还在计费？ - AI开发平台ModelArts

为什么项目删除完了，仍然还在计费？如果ModelArts的自动学习项目、Notebook实例、训练作业或在线服务，都已经处于停止状态，即总览页面没看到收费项目，仍然发现账号还在计费。有以下几种可能情况：因为您在使用ModelArts过程中，将数据上传至OBS进行存储，OBS

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
推理性能测试 - AI开发平台ModelArts

约束限制创建在线服务时，每秒服务流量限制默认为100次，若静态benchmark的并发数（parallel-num参数）或动态benchmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
通过OBS导入模型时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志 - AI开发平台ModelArts

用户通过OBS导入模型时，选择使用基础镜像，用户自己编写了部分推理代码实现自己的推理逻辑，出现故障后希望通过故障日志排查定位故障原因，但是通过logger打印日志无法在“在线服务”的日志中查看到部分内容。原因分析推理服务的日志如果需要显示出来，需要代码中将日志打印到Console控制台。当前推理基础镜像使用

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
推理性能测试 - AI开发平台ModelArts

约束限制创建在线服务时，每秒服务流量限制默认为100次，如果静态benchmark的并发数（parallel-num参数）或动态benchmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
推理性能测试 - AI开发平台ModelArts

约束限制创建在线服务时，每秒服务流量限制默认为100次，如果静态benchmark的并发数（parallel-num参数）或动态benchmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）

总条数： 478

上一页
1
...
6
7
8
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

添加资源标签 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

服务预测失败 - AI开发平台ModelArts

在MaaS体验模型服务 - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

更新模型服务的单个属性 - AI开发平台ModelArts

使用MaaS调优模型 - AI开发平台ModelArts

端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

ModelArts Standard使用流程 - AI开发平台ModelArts

Wav2Lip训练基于Lite Server适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

在ModelArts中调整模型后，部署新版本模型能否保持原API接口不变？ - AI开发平台ModelArts

将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

为什么项目删除完了，仍然还在计费？ - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

通过OBS导入模型时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线