搜索_华为云

创建AI应用失败，如何定位和处理问题？ - AI开发平台ModelArts

这种报错一般是因为所用镜像系统引擎和构建镜像的系统引擎不一致引起的，例如使用的是x86的镜像却标记的是arm的系统架构。可以通过查看AI应用详情看到配置的系统运行架构。基础镜像的系统架构详情可以参考推理基础镜像列表。父主题： AI应用管理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > AI应用管理
Lite Server资源配置流程 - AI开发平台ModelArts

Lite Server资源配置流程在开通Lite Server资源后，需要完成相关配置才能使用，配置流程如下图所示。图1 Lite Server资源配置流程图表1 Server资源配置流程配置顺序配置任务场景说明 1 配置Lite Server网络 Server资源开

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
Lite Cluster使用流程 - AI开发平台ModelArts

需的规格和进行权限配置。随后，在ModelArts控制台上购买Lite Cluster资源。请参考Lite Cluster资源开通。资源配置：完成资源购买后，需要对网络、存储、驱动进行相关配置。请参考Lite Cluster资源配置。资源使用：完成资源配置后，您可以使用集群资

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本案例在Notebook上部署推理服务进行调试，因此需要创建Notebook。部署推理服务在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。如果需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本案例在Notebook上部署推理服务进行调试，因此需要创建Notebook。部署推理服务在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。在推理生产环境中部署推理服务介绍如何在创建AI应用，部署并启动推理服务，在线预测在线服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
导入AI应用提示模型或镜像大小超过限制 - AI开发平台ModelArts

在导入AI应用时，提示模型或镜像大小超过限制。原因分析如果使用的是OBS导入或者训练导入，则是基础镜像、模型文件、代码、数据文件和下载安装软件包的大小总和超过了限制。如果使用的是自定义镜像导入，则是解压后镜像和镜像下载文件的大小总和超过了限制。处理方法精简模型或镜像后，重新导入。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > AI应用管理
Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。检查是否安装docker。 docker -v #检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
功能介绍 - AI开发平台ModelArts
功能介绍 - AI开发平台ModelArts

功能介绍 Standard功能介绍 MaaS大模型即服务平台功能介绍 Lite功能介绍 AI Gallery功能介绍

 帮助中心 > AI开发平台ModelArts > 产品介绍
导入AI应用提示该账号受限或者没有操作权限 - AI开发平台ModelArts

导入AI应用提示该账号受限或者没有操作权限问题现象在导入AI应用时，提示用户账号受限。原因分析提示用户账号受限，常见原因有如下几种：导入AI应用账号欠费导致被冻结；导入AI应用账号没有对应工作空间的权限；导入AI应用账号为子账号，主账号没有给子账号赋予AI应用相关权限。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > AI应用管理
用户创建AI应用时构建镜像或导入文件失败 - AI开发平台ModelArts

用户创建AI应用时构建镜像或导入文件失败问题现象用户创建AI应用时，构建镜像失败，失败日志中提示下载obs文件失败（Get object size from OBS failed！）。图1 下载obs文件失败用户创建AI应用时，事件提示：复制模型文件失败，请检查OBS权限是否正常（Failed

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > AI应用管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本案例在Notebook上部署推理服务进行调试，因此需要创建Notebook。部署推理服务在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。如果需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
Lite Server资源管理 - AI开发平台ModelArts

Lite Server资源管理查看Lite Server服务器详情启动或停止Lite Server服务器同步Lite Server服务器状态切换Lite Server服务器操作系统监控Lite Server资源 NPU日志收集上传释放Lite Server资源

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server）
模型包结构介绍 - AI开发平台ModelArts

件夹下面放置模型文件，模型配置文件，模型推理代码文件。模型文件：在不同模型包结构中模型文件的要求不同，具体请参见模型包结构示例。模型配置文件：模型配置文件必须存在，文件名固定为“config.json”，有且只有一个，模型配置文件编写请参见模型配置文件编写说明。模型推理代码

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建AI应用规范参考
导入AI应用提示单个模型文件超过5G限制 - AI开发平台ModelArts

导入AI应用提示单个模型文件超过5G限制问题现象在导入AI应用时，提示单个模型文件大小超过5G限制。原因分析在不使用动态加载的情况下，系统对单个模型文件的限制大小为5G，超过时无法进行导入。处理方法精简模型文件后，重新导入。使用动态加载功能进行导入。图1 使用动态加载

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > AI应用管理
自动学习生成的模型，存储在哪里？支持哪些其他操作？ - AI开发平台ModelArts

自动学习生成的模型自动学习生成的模型，支持哪些其他操作支持部署为在线服务、批量服务或边缘服务。在自动学习页面中，仅支持部署为在线服务，如需部署为批量服务或边缘服务，可在“AI应用管理 > AI应用”页面中直接部署。支持发布至市场将产生的模型发布至AI Gallery，共享给其他用户。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用窍门
更新MaaS模型服务的模型权重 - AI开发平台ModelArts

更新和迭代，必须对已部署的服务执行相应的升级操作，以确保服务使用的是最新模型。 ModelArts Studio大模型即服务平台支持滚动升级模型权重，允许模型服务在运行时进行权重的迭代升级，该操作不会影响部署服务的正常运行。滚动升级模型权重的功能避免了重新部署整个模型服务的必要性

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
基本配置 - AI开发平台ModelArts
基本配置 - AI开发平台ModelArts

基本配置权限配置创建网络专属资源池VPC打通 ECS服务器挂载SFS Turbo存储在ECS中创建ma-user和ma-group obsutil安装和配置（可选）工作空间配置父主题：专属资源池训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
推理场景介绍 - AI开发平台ModelArts

sh #安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字相关文档和本文档配套

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
推理场景介绍 - AI开发平台ModelArts

sh #安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字相关文档和本文档配套

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909）
推理服务测试 - AI开发平台ModelArts

推理服务在线测试支持文件、图片、json三种格式。通过部署为在线服务Predictor可以完成在线推理预测。示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。场景：部署在线服务Predictor的推理预测

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理

总条数： 1370

上一页
1
...
12
13
14
...
69
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建AI应用失败，如何定位和处理问题？ - AI开发平台ModelArts

Lite Server资源配置流程 - AI开发平台ModelArts

Lite Cluster使用流程 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

导入AI应用提示模型或镜像大小超过限制 - AI开发平台ModelArts

Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

功能介绍 - AI开发平台ModelArts

导入AI应用提示该账号受限或者没有操作权限 - AI开发平台ModelArts

用户创建AI应用时构建镜像或导入文件失败 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

Lite Server资源管理 - AI开发平台ModelArts

模型包结构介绍 - AI开发平台ModelArts

导入AI应用提示单个模型文件超过5G限制 - AI开发平台ModelArts

自动学习生成的模型，存储在哪里？支持哪些其他操作？ - AI开发平台ModelArts

更新MaaS模型服务的模型权重 - AI开发平台ModelArts

基本配置 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

推理服务测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线