搜索_华为云

部署推理服务 - AI开发平台ModelArts

部署推理服务本章节介绍如何使用vLLM 0.3.2框架部署并启动推理服务。前提条件已准备好DevServer环境，具体参考资源规格要求。推荐使用“西南-贵阳一”Region上的DevServer和昇腾Snt9b资源。确保容器可以访问公网。 Step1 检查环境 SSH登录

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
作为调用发起方的客户端无法访问已经获取到的推理请求地址 - AI开发平台ModelArts

问题现象完成在线服务部署且服务处于“运行中”状态后，已经通过调用指南页面的信息获取到调用的server端地址，但是调用发起方的客户端访问该地址不通，出现无法连接、域名无法解析的现象。原因分析在调用指南页签中显示的调用地址都是华为云APIG（API网关服务）的地址。调用发起方的客户端和华为云网络不通。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

在Notebook中通过Dockerfile从0制作自定义镜像用于推理场景说明针对ModelArts目前不支持的AI引擎，您可以通过自定义镜像的方式将编写的模型导入ModelArts，创建为模型。本文详细介绍如何在ModelArts的开发环境Notebook中使用基础镜像构

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
安装Gallery CLI配置工具 - AI开发平台ModelArts

安装Gallery CLI配置工具场景描述 Gallery CLI配置工具支持将AI Gallery仓库的资产下载到云服务端，便于在云服务本地进行训练、部署推理。 Gallery CLI配置工具支持将单个超过5GB的文件从本地上传至AI Gallery仓库中。约束限制 Gallery

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
算法运行时需要依赖鉴权服务，公共资源池是否支持两者打通网络？ - AI开发平台ModelArts

算法运行时需要依赖鉴权服务，公共资源池是否支持两者打通网络？不支持，公共资源池不能打通网络。可通过专属资源池打通网络，使用ModelArts服务。父主题： Standard资源池

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard资源池
Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

能通过SSH登录，不同机器之间网络互通。购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
ModelArts如何通过标签实现资源分组管理 - AI开发平台ModelArts

ModelArts支持对接标签管理服务TMS，在ModelArts中创建资源消耗性任务（例如：创建Notebook、训练作业、推理在线服务）时，可以为这些任务配置标签，通过标签实现资源的多维分组管理。 ModelArts支持配置标签的任务有：创建训练作业任务、创建Notebook、创建推理在线服务。使用流程

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts

service会优先读取网卡配置文件中的IP设置为主机IP，此时无论DH Cient是否关闭，服务器都可以获取分配IP。当服务器没有网卡配置文件时，DH Client开启，此时服务器会分配私有IP。如果关闭DH Client，则服务器无法获取私有IP。图2 查看NetworkManager配置图3

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
InternVL2基于DevServer适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

能通过SSH登录，不同机器之间网络互通。购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
查询专属资源池作业列表 - AI开发平台ModelArts

查询专属资源池作业列表功能介绍查询专属资源池作业列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/pools/{pool_name}/workloads

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
监控安全风险 - AI开发平台ModelArts

监控安全风险 ModelArts支持监控ModelArts在线服务和对应模型负载，执行自动实时监控、告警和通知操作，帮助用户更好地了解服务和模型的各项性能指标。详细内容请参见ModelArts支持的监控指标。父主题：安全

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

在云监控平台查看在线服务性能指标 ModelArts支持的监控指标为使用户更好地掌握自己的ModelArts在线服务和对应模型负载的运行状态，云服务平台提供了云监控。您可以使用该服务监控您的ModelArts在线服务和对应模型负载，执行自动实时监控、告警和通知操作，帮助您更好地了解服务和模型的各项性能指标。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
配置Standard专属资源池可访问公网 - AI开发平台ModelArts

C的方式，使得专属资源池和已绑定EIP的弹性云服务器处于同一VPC内，实现专属资源池访问外网。前提条件已拥有需要部署SNAT的弹性云服务器。待部署SNAT的弹性云服务器操作系统为Linux操作系统。待部署SNAT的弹性云服务器网卡已配置为单网卡。步骤一：打通VPC 通过

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
SDXL&SD1.5 WebUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

SDXL&SD1.5 WebUI基于Lite Cluster适配NPU推理指导（6.3.906）本文档主要介绍如何在ModelArts Lite的Cluster环境中部署Stable Diffusion的WebUI套件，使用NPU卡进行推理。方案概览本方案介绍了在ModelArts的Lite

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
部署推理服务 - AI开发平台ModelArts

部署推理服务本章节介绍如何使用vLLM 0.4.2框架部署并启动推理服务。前提条件已准备好DevServer环境，具体参考资源规格要求。推荐使用“西南-贵阳一”Region上的DevServer和昇腾Snt9b资源。安装过程需要连接互联网git clone，确保容器可以访问公网。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
SD3 Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

SD3 Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.907） Stable Diffusion（简称SD）是一种基于扩散过程的图像生成模型，应用于文生图场景，能够帮助用户生成图像。方案概览本方案介绍了在ModelArts Lite

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
从AI Gallery订阅模型 - AI开发平台ModelArts

订阅模型与云服务订阅模型的区别：在管理控制台，模型管理所在位置不同。订阅模型统一管理在“模型管理>订阅模型”页面中，而云服务订阅模型管理在“模型管理>云服务订阅模型”页面中。模型来源不同。订阅模型，模型来源于AI Gallery；云服务订阅模型，模型来源于其他AI服务开发的模型。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
Bert基于DevServer适配MindSpore Lite 推理指导(6.3.910) - AI开发平台ModelArts

能通过SSH登录，不同机器之间网络互通。购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
MiniCPM-V2.6基于DevServer适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
准备镜像环境 - AI开发平台ModelArts

准备镜像环境准备训练模型适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置物理机环境操作。镜像地址本教程中用到的训练和推理的基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址基础镜像 swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 准备工作

总条数： 1222

上一页
1
...
48
49
50
...
62
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

部署推理服务 - AI开发平台ModelArts

作为调用发起方的客户端无法访问已经获取到的推理请求地址 - AI开发平台ModelArts

在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

安装Gallery CLI配置工具 - AI开发平台ModelArts

算法运行时需要依赖鉴权服务，公共资源池是否支持两者打通网络？ - AI开发平台ModelArts

Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

ModelArts如何通过标签实现资源分组管理 - AI开发平台ModelArts

裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts

InternVL2基于DevServer适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

查询专属资源池作业列表 - AI开发平台ModelArts

监控安全风险 - AI开发平台ModelArts

在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

配置Standard专属资源池可访问公网 - AI开发平台ModelArts

SDXL&SD1.5 WebUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

SD3 Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

从AI Gallery订阅模型 - AI开发平台ModelArts

Bert基于DevServer适配MindSpore Lite 推理指导(6.3.910) - AI开发平台ModelArts

MiniCPM-V2.6基于DevServer适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线