搜索_华为云

通过APP认证的方式访问在线服务 - AI开发平台ModelArts

开启支持APP认证功能在部署为在线服务时，您可以开启支持APP认证功能。或者针对已部署完成的在线服务，您可以修改服务，开启支持APP认证功能。登录ModelArts管理控制台，在左侧菜单栏中选择“模型部署 > 在线服务”，进入在线服务管理页面。开启支持APP认证功能。在部署为在线服务时，即“

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将AI应用部署为实时推理作业 > 访问在线服务支持的认证方式
简介 - AI开发平台ModelArts
简介 - AI开发平台ModelArts

调测需要的运行环境与工具链。模型适配：针对昇腾迁移模型必要的转换和改造。模型准备，导出和保存确定格式的模型。转换参数准备，准备模型业务相关的关键参数。模型转换，包含模型转换、优化和量化等。应用集成。针对转换的模型运行时应用层适配。数据预处理。模型编排。模型裁剪。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

据传输。前提条件在线服务部署时需选择“升级为WebSocket”。在线服务中的AI应用导入选择的镜像需支持WebSocket协议。约束与限制 WebSocket协议只支持部署在线服务。只支持自定义镜像导入AI应用部署的在线服务。调用API访问在线服务时，对预测请求体大小和预测时间有限制：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将AI应用部署为实时推理作业 > 访问在线服务支持的传输协议
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

加载模型，执行预处理，完成推理，拼装响应体等。操作步骤 WebSocket在线服务开发操作步骤如下：上传镜像至容器镜像服务使用镜像创建AI应用使用AI应用部署在线服务 WebSocket在线服务调用上传镜像至容器镜像服务将准备好的本地镜像上传到容器镜像服务（SWR）。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

VPC直连的高速访问通道，目前只支持访问在线服务。因流量限控，获取在线服务的IP和端口号次数有限制，每个主账号租户调用次数不超过2000次/分钟，每个子账号租户不超过20次/分钟。目前仅支持自定义镜像导入模型，部署的服务支持高速访问通道。操作步骤使用VPC直连的高速访问通道访问在线服务，基本操作步骤如下：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将AI应用部署为实时推理作业 > 访问在线服务支持的访问通道
使用AI市场物体检测YOLOv3 - AI开发平台ModelArts

使用AI市场物体检测YOLOv3_Darknet53算法训练后部署在线服务报错问题现象使用AI市场物体检测YOLOv3_Darknet53算法进行训练，将数据集切分后进行部署在线服务报错，日志如下：TypeError: Cannot interpret feed_dict key

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
服务管理概述 - AI开发平台ModelArts

服务管理概述服务管理，包括将已创建成功的模型部署为在线服务或本地服务。可以实现在线预测、本地预测、服务详情查询、查看服务日志等功能。这里的在线服务包括“predictor”和“transformer”两类，都包括下文描述的功能，本章节以“predictor”服务为例进行说明。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
精度问题处理 - AI开发平台ModelArts

精度问题处理设置高精度并重新转换模型在转换模型时，默认采用的精度模式是fp16，如果转换得到的模型和标杆数据的精度差异比较大，可以使用fp32精度模式提升模型的精度（精度模式并不总是需要使用fp32，因为相对于fp16，fp32的性能较差。因此，通常只在检测到某个模型精度存在

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 模型精度调优
单模型性能调优AOE - AI开发平台ModelArts

对text_encoder等模型提升效果不大，性能主要瓶颈点在unet模型中，主要对unet模型做调优，整体的操作步骤如下：转换前先清理缓存，避免转换时的影响。 #shell # 删除已有的aoe知识库，或者备份一份 rm -rf /root/Ascend/latest/data/aoe

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 性能调优
Wav2Lip基于DevServer适配PyTorch NPU训练指导（6.3.902） - AI开发平台ModelArts

图2 报错SSL certificate problem 可采取忽略SSL证书验证：使用以下命令来克隆仓库，它将忽略SSL证书验证。 git clone -c http.sslVerify=false https://github.com/Rudrabha/Wav2Lip.git

帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

在线服务预测时，如何提高预测速度？部署在线服务时，您可以选择性能更好的“计算节点规格”提高预测速度。例如使用GPU资源代替CPU资源。部署在线服务时，您可以增加“计算节点个数”。如果节点个数设置为1，表示后台的计算模式是单机模式；如果节点个数设置大于1，表示后台的计算模式为分布式的。您可以根据实际需求进行选择。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
SD1.5基于DevServer适配PyTorch NPU Finetune训练指导（6.3.904） - AI开发平台ModelArts

Diffusion（简称SD）是一种基于Latent Diffusion（潜在扩散）模型，应用于文生图场景。对于输入的文字，它将会通过一个文本编码器将其转换为文本嵌入，然后和一个随机高斯噪声，一起输入到U-Net网络中进行不断去噪。在经过多次迭代后，最终模型将输出和文字相关的图像。 SD1.5

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
AIGC工具tailor使用指导 - AI开发平台ModelArts

tailor支持动态分档转换功能，需要指定配置文件路径，需要注意即便有配置文件，只要是动态模型就需要指定--input_shape参数。 --input_shape 指定模型转换的shape。 string 否 - 固定shape模型转换可以不填，动态模型转换必填。 --output_path

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

6-gpu"。修改完成后，重新执行导入模型和部署为在线服务的操作。参数设置完成后，单击“下一步”，确认规格参数，单击“提交”，完成在线服务的部署。您可以进入“模型部署 > 在线服务”页面，等待服务部署完成，当服务状态变为“运行中”时，表示服务部署成功。预计时长2分钟左右。在线服务部署完成后，您可以单

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
迁移过程使用工具概览 - AI开发平台ModelArts

模型转换工具离线转换模型功能的工具MSLite Convertor，支持onnx、pth、tensorflowLite多种类型的模型转换，转换后的模型可直接运行在MindSpore运行时后端，用于昇腾推理。精度性能检查工具 Benchmark精度检查工具，可以转换模型后执行推理前，使用其对MindSpore

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

infer_type 是 String 推理方式，取值为real-time/batch/edge。 real-time代表在线服务，将模型部署为一个Web Service，并且提供在线的测试UI与监控能力，服务一直保持运行。 batch为批量服务，批量服务可对批量数据进行推理，完成数据处理后自动停止。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
使用AWQ量化 - AI开发平台ModelArts

详细说明可以参考vLLM官网：https://docs.vllm.ai/en/latest/quantization/auto_awq.html。 Step2 权重格式转换 AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，需要进行权重转换。进入l

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
变更计费模式概述 - AI开发平台ModelArts

变更计费模式概述在购买专属资源池后，如果发现当前计费模式无法满足业务需求，您可以变更计费模式。支持变更计费模式的计费项如表1所示。公共资源池不能单独购买，不支持变更计费模式。表1 支持变更计费模式的计费项计费项变更说明相关文档计算资源变更专属资源池的计费模式会同时变更计算资源的计费模式。

帮助中心 > AI开发平台ModelArts > 计费说明 > 变更计费模式
使用AppCode认证鉴权方式进行在线预测 - AI开发平台ModelArts

ppCode认证（部署模型为在线服务中的“支持APP认证”参数）。对于已部署的在线服务，ModelArts支持修改其配置开启AppCode认证。本文主要介绍如何修改一个已有的在线服务，使其支持AppCode认证并进行在线预测。前提条件提前部署在线服务，具体操作可以参考案例：使用ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
精度校验 - AI开发平台ModelArts
精度校验 - AI开发平台ModelArts

精度校验转换模型后执行推理前，可以使用benchmark工具对MindSpore Lite云侧推理模型进行基准测试。它不仅可以对MindSpore Lite云侧推理模型前向推理执行耗时进行定量分析（性能），还可以通过指定模型输出进行可对比的误差分析（精度）。精度测试 benc

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导

总条数： 738

上一页
1
...
6
7
8
...
37
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

通过APP认证的方式访问在线服务 - AI开发平台ModelArts

简介 - AI开发平台ModelArts

使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

使用AI市场物体检测YOLOv3 - AI开发平台ModelArts

服务管理概述 - AI开发平台ModelArts

精度问题处理 - AI开发平台ModelArts

单模型性能调优AOE - AI开发平台ModelArts

Wav2Lip基于DevServer适配PyTorch NPU训练指导（6.3.902） - AI开发平台ModelArts

在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

SD1.5基于DevServer适配PyTorch NPU Finetune训练指导（6.3.904） - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

迁移过程使用工具概览 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

变更计费模式概述 - AI开发平台ModelArts

使用AppCode认证鉴权方式进行在线预测 - AI开发平台ModelArts

精度校验 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线