搜索_华为云

分离部署推理服务 - AI开发平台ModelArts

将用户请求的prompt传入大模型，进行计算，中间结果写入KVCache并推出第1个token，属于计算密集型。 Decode阶段（增量推理）将请求的前1个token传入大模型，从显存读取前文产生的KVCache再进行计算，属于访存密集型。分离部署场景下，全量推理和增量推理在不同的容器上进行，用于提高资源利用效率。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
分离部署推理服务 - AI开发平台ModelArts

将用户请求的prompt传入大模型，进行计算，中间结果写入KVCache并推出第1个token，属于计算密集型。 Decode阶段（增量推理）将请求的前1个token传入大模型，从显存读取前文产生的KVCache再进行计算，属于访存密集型。分离部署场景下，全量推理和增量推理在不同的容器上进行，用于提高资源利用效率。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
分离部署推理服务 - AI开发平台ModelArts

将用户请求的prompt传入大模型，进行计算，中间结果写入KVCache并推出第1个token，属于计算密集型。 Decode阶段（增量推理）将请求的前1个token传入大模型，从显存读取前文产生的KVCache再进行计算，属于访存密集型。分离部署场景下，全量推理和增量推理在不同的容器上进行，用于提高资源利用效率。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

通过ModelArts的Notebook，在JupyterLab中使用OBS上传下载数据。建议配置。开发环境监控功能 AOM aom:alarm:put 调用AOM的接口，获取Notebook相关的监控数据和事件，展示在ModelArts的Notebook中。建议配置。 VPC接入 VPC vpc:ports:create

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
自动学习简介 - AI开发平台ModelArts

性维护，根据设备实时数据的分析，进行故障识别。声音分类声音分类项目，是识别一段音频中是否包含某种声音。可应用于生产或安防场景的异常声音监控。文本分类文本分类项目，识别一段文本的类别。可应用于情感分析或新闻分类等场景。父主题：使用自动学习实现零代码AI开发

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发
ma-cli configure鉴权命令 - AI开发平台ModelArts

时需要指定，属于PWD鉴权的一部分。 -u / --username String 否用户名，在使用账号认证时表示账号名，IAM认证时表示IAM用户名，在云星账号场景不需要指定，属于PWD鉴权的一部分。 -p / --password String 否密码，属于PWD鉴权的一部分。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
JupyterLab常用功能介绍 - AI开发平台ModelArts

图20 创建“dropdown”类型的表单图21 删除表单资源监控在使用过程中，如果想了解资源使用情况，可在右侧区域选择“Resource Monitor”，展示“CPU使用率”和“内存使用率”。图22 资源监控父主题：通过JupyterLab在线使用Notebook实例进行AI开发

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
在ModelArts镜像管理注册镜像报错ModelArts.6787怎么处理？ - AI开发平台ModelArts

WR镜像地址，否则该镜像子账号不可使用。该镜像不属于该租户（包括主账号和子账号），是其他人共享的public镜像，而这个镜像又被镜像所有者删除，导致不可使用，用户需要联系对应的SWR镜像负责人，确认镜像是否存在。该镜像不属于该租户（包括主账号和子账号），是其他人共享的publ

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
配置Lite Server存储 - AI开发平台ModelArts

高性能计算：主要是高带宽的需求，用于共享文件存储，比如基因测序、图片渲染这些。如大数据分析、静态网站托管、在线视频点播、基因测序和智能视频监控等。如高性能计算、企业核心集群应用、企业应用系统和开发测试等。说明：高性能计算：主要是高速率、高IOPS的需求，用于作为高性能存储，比如工业设计、能源勘探这些。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
API/SDK - AI开发平台ModelArts
API/SDK - AI开发平台ModelArts

SDK和MoXing的区别是什么？ ModelArts的API或SDK支持模型下载到本地吗？ ModelArts通过OBS的API访问OBS中的文件，属于内网还是公网访问？调用ModelArts API接口创建训练作业和部署服务时，如何填写资源池的参数？

帮助中心 > AI开发平台ModelArts > 常见问题
数据管理权限 - AI开发平台ModelArts

{dataset_id}/data-annotations/stats modelarts:dataset:get - √ √ 查询数据集监控数据 GET /v2/{project_id}/datasets/{dataset_id}/metrics modelarts:dataset:get

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

接经VPC对等连接发送到实例处理，访问速度更快。由于请求不经过推理平台，所以会丢失以下功能：认证鉴权流量按配置分发负载均衡告警、监控和统计图1 VPC直连的高速访问通道示意图约束限制调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
给子账号配置部署上线基本使用权限 - AI开发平台ModelArts

obs:bucket:ListAllMyBuckets 创建批量服务。按需配置。边缘服务 CES ces:metricData:list 查看服务的监控指标。按需配置。 IEF IEF Administrator 管理边缘服务。按需配置。创建自定义策略时，建议将项目级云服务和全局级云

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

、精度比对，进而定位训练场景下的精度问题支持溢出检测功能，判断是否存在输入正常但输出存在溢出的API，从而判断是否为正常溢出。梯度状态监控，用于采集梯度数据并进行梯度相似度比对，可以精准定位出现问题的step。执行pip install mindstudio-probe msprobe使用手册

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理
ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

接经VPC对等连接发送到实例处理，访问速度更快。由于请求不经过推理平台，所以会丢失以下功能：认证鉴权流量按配置分发负载均衡告警、监控和统计图1 VPC直连的高速访问通道示意图约束限制调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

NODE_RANK=0 执行以下命令，开始预训练。 nohup sh ./pretrain_gpt2.sh & 图3 开始预训练实时查看训练日志，监控程序。 tail -f nohup.out 如果显示如下信息，表示模型训练完成。图4 模型训练完成在训练过程中观察单GPU卡的利用率，如下：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

（可选）工作空间配置模型训练本地构建镜像及调试上传镜像上传数据和算法到OBS 使用Notebook进行代码调试创建单机单卡训练作业监控资源本地构建镜像及调试本节通过打包conda env来构建环境，也可以通过pip install、conda install等方式安装conda环境依赖。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
错误码 - AI开发平台ModelArts
错误码 - AI开发平台ModelArts

检查资源规范编码是否设置正确，并确认其是否属于对应的项目下。 400 ModelArts.3837 Resource ID {id} of project {id} does not exist. 项目{1}资源ID {0}不存在。检查资源ID是否设置正确，并确认其是否属于对应的项目下。 400 ModelArts

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
推理业务迁移评估表 - AI开发平台ModelArts

Backbone类型 ResNet/DarkNet/Transformer等。例如： 5个模型使用ResNet Backbone，应用与监控。 3个模型使用Transformer，应用于自然语言处理xxx。使用stable-diffusion的典型模型：TextEncoder

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
数据处理场景介绍 - AI开发平台ModelArts

数据选择：数据选择一般是指从全量数据中选择数据子集的过程。数据可以通过相似度或者深度学习算法进行选择。数据选择可以避免人工采集图片过程中引入的重复图片、相似图片等问题；在一批输入旧模型的推理数据中，通过内置规则的数据选择可以进一步提升旧模型精度。数据增强：数据扩增通过简单的数据扩增例如缩放、裁剪、变换、合成等操作直接或间接的方式增加数据量。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据

总条数： 139

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

分离部署推理服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

自动学习简介 - AI开发平台ModelArts

ma-cli configure鉴权命令 - AI开发平台ModelArts

JupyterLab常用功能介绍 - AI开发平台ModelArts

在ModelArts镜像管理注册镜像报错ModelArts.6787怎么处理？ - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

API/SDK - AI开发平台ModelArts

数据管理权限 - AI开发平台ModelArts

通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

给子账号配置部署上线基本使用权限 - AI开发平台ModelArts

ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

错误码 - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

数据处理场景介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线