搜索_华为云

端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

模型镜像。服务运维阶段，先利用镜像构建模型，接着部署模型为在线服务，然后可在云监控服务（CES）中获得ModelArts推理在线服务的监控数据，最后可配置告警规则实现实时告警通知。业务运行阶段，先将业务系统对接在线服务请求，然后进行业务逻辑处理和监控设置。图1 推理服务的端到端运维流程图

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
功能咨询 - AI开发平台ModelArts
功能咨询 - AI开发平台ModelArts

ModelArts支持将模型部署为哪些类型的服务？在线服务和批量服务有什么区别？在线服务和边缘服务有什么区别？为什么选择不了Ascend Snt3资源？线上训练得到的模型是否支持离线部署在本地？服务预测请求体大小限制是多少？在线服务部署是否支持包周期？部署服务如何选择计算节点规格？

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线
配置授权 - AI开发平台ModelArts
配置授权 - AI开发平台ModelArts

配置授权功能介绍配置ModelArts授权。若没有授权，ModelArts训练管理、开发环境、数据管理、在线服务等功能将不能正常使用。该API支持管理员给IAM子用户设置委托，支持设置当前用户的访问密钥。调用该API需要在IAM系统里配置Security Administrator权限。

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
Open-Sora-Plan1.0基于DevServer适配PyTorch NPU训练推理指导（6.3.907） - AI开发平台ModelArts

在/home/ma-user/Open-Sora-Plan1.0/目录下进行操作训练至少需要单机8卡。命令启动训练脚本。例如：训练65帧的视频，拼接4张图片，则执行如下命令： bash train_videoae_65x512x512.sh 正常训练过程如下图所示。训练完成后，关注loss值，

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
SDK简介 - AI开发平台ModelArts
SDK简介 - AI开发平台ModelArts

API进行的Python封装，以简化用户的开发工作。用户直接调用ModelArts SDK即可轻松管理数据集、启动AI训练以及生成模型并将其部署为在线服务。 ModelArts SDK目前只提供Python语言的SDK，同时支持大于3.7.x版本且小于3.10.x版本的Python版本，推荐使用3

帮助中心 > AI开发平台ModelArts > SDK参考
添加资源标签 - AI开发平台ModelArts

添加资源标签功能介绍给指定服务添加标签（目前只支持在线服务），当添加的标签key已存在，则覆盖该标签的value。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
更新模型服务的单个属性 - AI开发平台ModelArts

更新模型服务的单个属性功能介绍更新模型服务的单个属性，目前只支持instance_count(更新模型服务实例数量)，仅运行中、告警、异常状态下的在线服务可以执行该操作。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
在推理生产环境中部署推理服务 - AI开发平台ModelArts

若权重文件大于60G，创建AI应用会报错，提示模型大于60G，请提工单扩容。 Step3 部署在线服务将Step2 部署模型中创建的AI应用部署为一个在线服务，用于推理调用。在ModelArts控制台，单击“模型部署 > 在线服务 > 部署”，开始部署在线服务。设置部署服务名称，选择Step2 部署模型中创建的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

rch NPU推理指导（6.3.909）混元DiT，一个基于Diffusion transformer的文本到图像生成模型，此模型具有中英文细粒度理解能力。方案概览本方案介绍了在ModelArts Lite DevServer上使用昇腾计算资源Ascend Snt9B开展H

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
Llama 3.2-Vision基于DevServer适配Pytorch NPU训练微调指导（6.3.911） - AI开发平台ModelArts

coco_karpathy_train_567k.jsonl 对于coco_karpathy_train_567k.jsonl文件进行过滤，过滤出train2014目录下图片对应的数据，并按如下格式重新构建json文件（coco2014_train.json）： [ { "id": "0",

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

SDK，则需要在本地环境中安装ModelArts SDK，安装后可直接调用ModelArts SDK轻松管理数据集、创建ModelArts训练作业及创建AI应用，并将其部署为在线服务。 ModelArts SDK使用限制本地ModelArts SDK不支持进行训练作业调测、模型调试和在开发环境中部署本地服务进行调

 帮助中心 > AI开发平台ModelArts > SDK参考
通过OBS导入模型时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志 - AI开发平台ModelArts

用户通过OBS导入模型时，选择使用基础镜像，用户自己编写了部分推理代码实现自己的推理逻辑，出现故障后希望通过故障日志排查定位故障原因，但是通过logger打印日志无法在“在线服务”的日志中查看到部分内容。原因分析推理服务的日志如果需要显示出来，需要代码中将日志打印到Console控制台。当前推理基础镜像使用

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
Wav2Lip训练基于DevServer适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

与目标语音匹配的唇形同步视频，还可以直接将动态的视频进行唇形转换，输出与输入语音匹配的视频，俗称“对口型”。该技术的主要作用就是在将音频与图片、音频与视频进行合成时，口型能够自然。 Wav2Lip模型的输入为任意的一段视频和一段语音，输出为一段唇音同步的视频。 Wav2Lip的网

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
推理部署计费项 - AI开发平台ModelArts

规则。综上，在线服务的运行费用 = 计算资源费用（3.50 元） + 存储费用示例：使用专属资源池。计费项：存储费用假设用户于2023年4月1日10:00:00创建了一个使用专属资源池的在线服务，并在11:00:00停止运行。按照存储费用结算，那么运行这个在线服务的费用计算过程如下：

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
支持哪些型号的Ascend芯片？ - AI开发平台ModelArts

cend应用样例。模型训练：ModelArts中支持使用Snt9、Snt9B训练模型。模型推理：在ModelArts中将模型部署上线为在线服务时，支持使用Snt3、Snt3P、Snt9、Snt9B规格资源进行模型推理。父主题：一般性问题

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
在MaaS体验模型服务 - AI开发平台ModelArts

在MaaS体验模型服务在ModelArts Studio大模型即服务平台，运行中的模型服务可以在“模型体验”页面在线体验模型服务的推理效果。前提条件在“模型部署”的服务列表存在“运行中”的模型服务。操作步骤登录ModelArts管理控制台。在左侧导航栏中，选择“ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
ModelArts Standard使用流程 - AI开发平台ModelArts

部署模型部署服务 ModelArts支持将模型部署为在线服务、批量服务和边缘服务。部署为在线服务部署为批量服务访问服务服务部署完成后，针对在线服务和边缘服务，您可以访问并使用服务，针对批量服务，您可以查看其预测结果。访问在线服务查看批量服务预测结果

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
内存不足如何处理？ - AI开发平台ModelArts

存需求增多。处理方法在部署或升级在线服务时，选择更大内存规格的计算节点。图3 选择计算节点规格运行中服务出现告警时，需要分析是您的代码是否出现漏洞导致内存溢出、是否因为业务使用量太大需要更多的内存。如果因业务原因需要更多内存，请升级在线服务选择更大内存规格的计算节点。父主题：

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
训练作业容错检查 - AI开发平台ModelArts

动退出。该现象表明资源池规格任务紧张，训练作业无法正常启动，推荐您购买专属资源池补充计算节点。如果您使用专属资源池创建训练作业，容错检查识别的故障节点会被剔除。系统自动补充健康的计算节点至专属资源池。（该功能即将上线）容错检查详细介绍请参考：开启容错检查检测项目与执行条件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
推理性能测试 - AI开发平台ModelArts

约束限制创建在线服务时，每秒服务流量限制默认为100次，如果静态benchmark的并发数（parallel-num参数）或动态benchmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）

总条数： 554

上一页
1
...
18
19
20
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

功能咨询 - AI开发平台ModelArts

配置授权 - AI开发平台ModelArts

Open-Sora-Plan1.0基于DevServer适配PyTorch NPU训练推理指导（6.3.907） - AI开发平台ModelArts

SDK简介 - AI开发平台ModelArts

添加资源标签 - AI开发平台ModelArts

更新模型服务的单个属性 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

Llama 3.2-Vision基于DevServer适配Pytorch NPU训练微调指导（6.3.911） - AI开发平台ModelArts

（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

通过OBS导入模型时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志 - AI开发平台ModelArts

Wav2Lip训练基于DevServer适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

推理部署计费项 - AI开发平台ModelArts

支持哪些型号的Ascend芯片？ - AI开发平台ModelArts

在MaaS体验模型服务 - AI开发平台ModelArts

ModelArts Standard使用流程 - AI开发平台ModelArts

内存不足如何处理？ - AI开发平台ModelArts

训练作业容错检查 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线