搜索_华为云

扩缩容模型服务实例数 - AI开发平台ModelArts

型服务的实例数，该操作不会影响部署服务的正常运行。约束限制仅当模型服务处于这几个状态下才能扩缩容实例数：运行中、告警。扩缩容实例数登录ModelArts管理控制台。在左侧导航栏中，选择“ModelArts Studio”进入ModelArts Studio大模型即服务平台。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

VPC访问在线服务提交工单，提供账号ID给华为云技术支持，用于获取ModelArts终端节点服务地址。购买连接ModelArts终端节点登录虚拟私有云（VPC）管理控制台，单击左侧导航栏中的“VPC 终端节点>终端节点”，进入“终端节点”页面。单击右上角的“购买终端节点”，进入购买页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
升级Lite Cluster资源池单个节点驱动 - AI开发平台ModelArts

约束限制 Lite Cluster资源池节点驱动状态处于运行中，且专属池中的节点需要含有GPU/Ascend资源。节点驱动升级操作登录ModelArts管理控制台，在左侧菜单栏中选择“AI专属资源池 > 弹性集群 Cluster”，在“弹性集群”页面，选择“Lite资源池”页签，查看资源池列表。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
通过自定义镜像创建模型失败 - AI开发平台ModelArts

认证服务给对应委托中加上对应权限。图1 权限管理图2 查看权限详情和去IAM修改委托权限图3 给委托添加授权将镜像设置成私有镜像登录容器镜像服务（SWR），左侧导航栏选择“我的镜像”，查看镜像详情，单击右上角“编辑”按钮，把镜像类型修改为“私有”。图4 修改镜像类型为私有

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
在Notebook中通过Dockerfile从0制作自定义镜像 - AI开发平台ModelArts

注册镜像方式二：在ModelArts Console上注册镜像登录ModelArts控制台，在左侧导航栏选择“镜像管理”，进入镜像管理页面。单击“注册镜像”。请将完整的SWR地址复制到这里即可，或单击可直接从SWR选择自有镜像进行注册。 “架构”和“类型”根据实际情况选择，与镜像源保持一致。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

出现该问题的可能原因如下：新安装的包与镜像中带的CUDA版本不匹配。处理方法必现的问题，使用本地Pycharm远程连接Notebook调试安装。先远程登录到所选的镜像，使用“nvcc -V”查看目前镜像自带的CUDA版本。重装torch等，需要注意选择与上一步版本相匹配的版本。建议与总结

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
修改模型服务QPS - AI开发平台ModelArts

实例流量限制QPS，该操作不会影响部署服务的正常运行。约束限制仅当模型服务处于这几个状态下才能修改QPS：运行中、异常。修改QPS 登录ModelArts管理控制台。在左侧导航栏中，选择“ModelArts Studio”进入ModelArts Studio大模型即服务平台。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

--tensor-parallel-size：并行卡数。 --gpu-memory-utilization：0~1之间的float，实际使用的显存是系统读取的最大显存*gpu-memory-utilization。 --max-model-len：最大数据输入+输出长度，不能超过模型配置文件config

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。若需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。在推理生产环境中部署推理服务介绍如何在创建AI应用，部署并启动推理服务，在线预测在线服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
多模态模型推理性能测试 - AI开发平台ModelArts

下。工具相关介绍在benchmark代码目录。约束限制当前版本仅支持语言+图片多模态性能测试。静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在步骤三：上传代码包和权重文件中已经上传过AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务性能评测
SD3 Diffusers框架基于Lite Server适配PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

pytorch_2.1.0 驱动23.0.6 从SWR拉取不同软件版本对应的基础镜像地址不同，请严格按照软件版本和镜像配套关系获取基础镜像。步骤一：检查环境请参考Lite Server资源开通，购买Server资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
使用Notebook进行代码调试 - AI开发平台ModelArts

注册镜像。登录ModelArts控制台，在左侧导航栏选择“镜像管理”，进入镜像管理页面。单击“注册镜像”，镜像源即为推送到SWR中的镜像。请将完整的SWR地址复制到这里即可，或单击可直接从SWR选择自有镜像进行注册，类型加上“GPU”，如图1所示。图1 注册镜像登录Model

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
使用AppCode认证鉴权方式进行在线预测 - AI开发平台ModelArts

署模型为在线服务中的“支持APP认证”参数）。对于已部署的在线服务，ModelArts支持修改其配置开启AppCode认证。本文主要介绍如何修改一个已有的在线服务，使其支持AppCode认证并进行在线预测。前提条件提前部署在线服务，具体操作可以参考案例：使用ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
动态shape - AI开发平台ModelArts
动态shape - AI开发平台ModelArts

注意：推理应用开发时，需要使用模型的Resize功能，改变输入的shape。而且Resize操作需要在数据从host端复制到device端之前执行，下面是一个简单的示例，展示如何在推理应用时使用动态Shape。 import mindspore_lite as mslite import

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
个人用户快速配置ModelArts访问权限 - AI开发平台ModelArts

如果未获得委托授权，当打开“访问授权”页面时，ModelArts会提醒您当前用户未配置授权，需联系此IAM用户的管理员账号进行委托授权。添加授权登录ModelArts管理控制台，在左侧导航栏选择“权限管理”，进入“权限管理”页面。单击“添加授权”，进入“访问授权”配置页面，根据参数说明进行配置。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
从本地上传数据到ModelArts数据集 - AI开发平台ModelArts

从本地上传数据到ModelArts数据集前提条件已存在创建完成的数据集。创建一个空的OBS桶，OBS桶与ModelArts在同一区域，并确保用户具有OBS桶的操作权限。本地上传文件型和表格型数据均支持从本地上传。从本地上传的数据存储在OBS目录中，请先提前创建OBS桶。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集
在MaaS应用实践中心查看应用解决方案 - AI开发平台ModelArts

I，升级智能对话解决方案，含智能客服、数字人。 Dify：支持自部署的应用构建开源解决方案，用于Agent编排、自定义工作流。操作步骤登录ModelArts管理控制台。在左侧导航栏中，选择“ModelArts Studio”进入ModelArts Studio大模型即服务平台。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
释放Lite Cluster资源 - AI开发平台ModelArts

Cluster资源，可以释放资源，停止计费相关介绍请见停止计费。 Lite Cluster资源池资源释放后不可恢复，请谨慎操作。退订包年/包月的Lite Cluster资源登录ModelArts管理控制台，在左侧菜单栏中选择“AI专属资源池 > 弹性集群 Cluster”，在“弹性集群”页面，选择“Lite资源池”页签，查看资源池列表。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
IEF节点边缘服务部署失败 - AI开发平台ModelArts

否，执行下一步，给用户添加委托权限。添加委托权限。如果是IAM子账号，没有修改委托权限，请联系管理员添加Tenant Administrator委托权限。登录统一身份认证服务IAM管理控制台。单击导航栏的“委托”，进入委托页面。搜索ModelArts使用的委托，例如“modelarts_ag

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
解析Manifest文件 - AI开发平台ModelArts

用途，可选值为TRAIN、EVAL、TEST、INFERENCE。指明该对象用于训练、评估、测试、推理，如果没有给出该字段，则使用者自行决定如何使用该对象。 inference_loc String 当此Manifest文件由推理服务生成时会有该字段，表示推理输出的结果文件位置。 id

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理

总条数： 1176

上一页
1
...
49
50
51
...
59
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

扩缩容模型服务实例数 - AI开发平台ModelArts

通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

升级Lite Cluster资源池单个节点驱动 - AI开发平台ModelArts

通过自定义镜像创建模型失败 - AI开发平台ModelArts

在Notebook中通过Dockerfile从0制作自定义镜像 - AI开发平台ModelArts

重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

修改模型服务QPS - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

SD3 Diffusers框架基于Lite Server适配PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

使用Notebook进行代码调试 - AI开发平台ModelArts

使用AppCode认证鉴权方式进行在线预测 - AI开发平台ModelArts

动态shape - AI开发平台ModelArts

个人用户快速配置ModelArts访问权限 - AI开发平台ModelArts

从本地上传数据到ModelArts数据集 - AI开发平台ModelArts

在MaaS应用实践中心查看应用解决方案 - AI开发平台ModelArts

释放Lite Cluster资源 - AI开发平台ModelArts

IEF节点边缘服务部署失败 - AI开发平台ModelArts

解析Manifest文件 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线