搜索_华为云

使用Server-Sent Events协议的方式访问在线服务 - AI开发平台ModelArts

P请求方式一致。可以使用ModelArts提供的以下认证方式： token认证 AK/SK APP认证 SSE服务调用如下（以图形界面的软件Postman进行预测，token认证为例）：图1 SSE服务调用图2 响应头Content-Type 正常情况下，可以观察到响应头C

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
使用CES监控Lite Server资源 - AI开发平台ModelArts

NPU：Docker容器环境检测 NpuContainerEnvSystem 重要 Docker不可用确认docker软件是否正常无法使用docker软件重要容器插件Ascend-Docker-Runtime未安装安装容器插件Ascend-Docker-Runtime，否则影响容器使用昇腾卡

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
自定义镜像使用场景 - AI开发平台ModelArts

环境进行固化，提供合适的软件、操作系统、网络等配置策略，通过在硬件上的充分测试，确保其兼容性和性能最合适。方便自定义，预置镜像已经在SWR仓库中，通过对预置镜像的扩展完成自定义镜像注册。安全可信，基于安全加固最佳实践，访问策略、用户权限划分、开发软件漏洞扫描、操作系统安全加固等方式，确保镜像使用的安全性。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard
SDXL&SD1.5 WebUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

推理部署推荐使用“西南-贵阳一”Region上的Cluster资源。获取软件获取插件代码包AscendCloud-6.3.906-xxx.zip中的AscendCloud-AIGC-6.3.906-xxx.zip文件。获取路径：Support-E。如果没有软件下载权限，请联系您所在企业的华为方技术支持下载获取。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

查看nv_peer_mem是否已安装。 dpkg -i | grep peer 如果未安装则需要安装，安装方法参考装机指导。如果已安装则进入下一检测项。查看该软件是否已经加载至内核。 lsmod | grep peer 如果没有则需要重新加载至内核，执行如下命令进行加载： /etc/init.d/nv_peer_mem

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
精度调优前准备工作 - AI开发平台ModelArts

些三方库的版本一致。环境版本更新这一项仅在条件允许的情况下进行，根据精度问题定位经验，部分问题是由于使用了较早版本的昇腾软件版本或者非商用发布的昇腾软件版本，所以推荐在条件允许的前提下配套安装最新商发版本的昇腾开发套件CANN Toolkit、昇腾驱动以及torch_npu包

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

虚拟私有云配置信息。图4 购买弹性云服务器时选择VPC 图5 查看虚拟私有云配置信息获取在线服务的IP和端口号可以通过使用图形界面的软件（以Postman为例）获取服务的IP和端口号，也可以登录弹性云服务器（ECS），创建Python环境运行代码，获取服务IP和端口号。 API接口：

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

dockerfile文件，需要去掉模型文件目录下存在dockerfile文件。图2 构建日志：dockerfile文件目录有问题 pip软件包版本不匹配，需要修改为日志中打印的存在的版本。图3 pip版本不匹配构建日志中出现报错：“exec /usr/bin/sh: exec

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
Open-Sora 1.0基于DevServer适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

pytorch_2.1.0 获取软件和镜像表2 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-3rdAIGC-6.3.905-xxx.zip 文件名中的xxx表示具体的时间戳，以包名的实际时间为准。获取路径：Support-E 如果没有软件下载权限，请联系您所在企业的华为方技术支持下载获取。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

虚拟私有云配置信息。图4 购买弹性云服务器时选择VPC 图5 查看虚拟私有云配置信息获取在线服务的IP和端口号可以通过使用图形界面的软件（以Postman为例）获取服务的IP和端口号，也可以登录弹性云服务器（ECS），创建Python环境运行代码，获取服务IP和端口号。 API接口：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
SD1.5基于DevServer适配PyTorch NPU Finetune训练指导（6.3.904） - AI开发平台ModelArts

pytorch_2.1.0 获取软件和镜像表2 获取软件和镜像分类名称获取路径插件代码包 ascendcloud-aigc-6.3.904-xxx.tar.gz 文件名中的xxx表示具体的时间戳，以包的实际时间为准。获取路径：Support-E网站。说明：如果没有软件下载权限，请联系您所在企业的华为方技术支持下载获取。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

的部署，需要先联系您所在企业的华为方技术支持。约束限制本文档适配昇腾云ModelArts 6.3.905版本，请参考表1获取配套版本的软件包，请严格遵照版本配套关系使用本文档。本文档中的模型运行环境是ModelArts Lite Server。镜像适配的Cann版本是cann_8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905）
训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

“nvidia-smi”是一个NVIDIA GPU监视器命令行工具，用于查看GPU的使用情况和性能指标，可以帮助用户进行GPU优化和故障排除。但是建议在业务软件或训练算法中，避免频繁使用“nvidia-smi”命令功能获取相关信息，存在锁死的风险。出现D+进程后可以尝试如下方法：方法1：可以根据ps

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
Lite Cluster资源开通 - AI开发平台ModelArts

安装后执行脚本：请输入脚本命令，命令中不能包含中文字符，需传入Base64转码后的脚本，转码后的字符数不能超过2048。脚本将在Kubernetes软件安装后执行，不影响Kubernetes软件安装。说明：暂不支持资源池中的存量节点池修改名称。请不要在安装后执行脚本中使用reboot命令立即重启，如果需要重启，可以使用“shutdown

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

构建ModelArts Standard推理镜像获取模型软件包和依赖包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。在ModelArts官方提供的基础镜像上，构建一个用于ModelArts Standard推理部署的镜像。在模型软件包和依赖包的同层目录下，创建并编辑Dockerfile。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 准备工作
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

贴到同一个文件中，而不是调用某些抽象提取出的模块化库。Diffusers的这种设计原则的好处是代码简单易用、对代码贡献者友好。然而，这种反软件结构化的设计也有明显的缺点。由于缺乏统一的模块化库，对于昇腾适配而言变得更加复杂，必须针对每个不同业务的Pipeline进行单独适配。本文以Stable

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

构建ModelArts Standard推理镜像获取模型软件包和依赖包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。在ModelArts官方提供的基础镜像上，构建一个用于ModelArts Standard推理部署的镜像。在模型软件包和依赖包的同层目录下，创建并编辑Dockerfile。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

华为方技术支持。约束限制本方案目前仅适用于部分企业客户。本文档适配昇腾云ModelArts 6.3.906版本，请参考软件配套版本获取配套版本的软件包，请严格遵照版本配套关系使用本文档。推理部署使用的服务框架是vLLM。vLLM支持v0.4.2版本。仅支持FP16和BF16数据类型推理。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
Lite Cluster&Server介绍 - AI开发平台ModelArts

Lite Server提供不同型号的xPU裸金属服务器，您可以通过弹性公网IP进行访问，在给定的操作系统镜像上可以自行安装加速卡相关的驱动和其他软件，使用SFS或OBS进行数据存储和读取相关的操作，满足算法工程师进行日常训练的需要。请参见弹性裸金属Lite Server。 ModelArts

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
准备BF16权重 - AI开发平台ModelArts

“deepseekv2”。转换后的权重文件再复制到其它三台机器的相同目录。如果是新开的Server机器则需要安装torch、tqdm等软件包，具体命令如下 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tqdm

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导 > 准备权重

总条数： 407

上一页
1
...
10
11
12
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Server-Sent Events协议的方式访问在线服务 - AI开发平台ModelArts

使用CES监控Lite Server资源 - AI开发平台ModelArts

自定义镜像使用场景 - AI开发平台ModelArts

SDXL&SD1.5 WebUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

精度调优前准备工作 - AI开发平台ModelArts

ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

Open-Sora 1.0基于DevServer适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

SD1.5基于DevServer适配PyTorch NPU Finetune训练指导（6.3.904） - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

Lite Cluster&Server介绍 - AI开发平台ModelArts

准备BF16权重 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线