搜索_华为云

单模型性能调优AOE - AI开发平台ModelArts

删除编译缓存。 rm -rf /root/atc_data/* 再次执行模型转换命令，确保AOE能够命中知识库。配置config.ini，关闭AOE调优： # unet.ini [ascend_context] input_shape=sample:[2,4,64,64];tim

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 性能调优
ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

负载均衡告警、监控和统计图1 VPC直连的高速访问通道示意图约束限制调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。准备工作使用专属资源池部署在线服务，服务状态为“运行中”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
查询资源池 - AI开发平台ModelArts

Notebook：Notebook作业 state String 业务状态。可选值如下： Enabling：启动中 Enabled：已启动 Disabling：关闭中 Disabled：已关闭表17 driver 参数参数类型描述 gpu PoolDriverStatus object GPU驱动信息。 npu

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
代码运行故障 - AI开发平台ModelArts

Notebook运行代码报错，在'/tmp'中到不到文件 Notebook无法执行代码，如何处理？运行训练代码，出现dead kernel，并导致实例崩溃如何解决训练过程中出现的cudaCheckError错误？如何处理使用opencv.imshow造成的内核崩溃？使用Windows下生成的文本文件时报错找不到路径？

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
模型使用CV2包部署在线服务报错 - AI开发平台ModelArts

）导入CV2模型包。处理方法需要您把CV2包制作为自定义镜像，上传至容器镜像服务（SWR），选择从容器镜像中导入元模型，部署在线服务。如何制作自定义镜像请参考从0-1制作自定义镜像并创建AI应用。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
欠费说明 - AI开发平台ModelArts
欠费说明 - AI开发平台ModelArts

欠费原因已购买资源包，但使用量超出资源包额度或资源包属性与桶属性不匹配，进而产生按需费用，同时账户中的余额不足以抵扣产生的按需费用。请参考如何查看ModelArts中正在收费的作业？识别产生按需计费的原因，并重新选择正确的资源包或保证账户中的余额充足。未购买资源包，在按需计费模式下账户的余额不足。

帮助中心 > AI开发平台ModelArts > 计费说明
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

40606190017-b881580 CANN：cann_8.0.rc2 PyTorch：2.1.0 Step1 创建ECS 下文中介绍如何在ECS中构建一个训练镜像，请参考ECS文档购买一个Linux弹性云服务器。完成网络配置、高级配置等步骤，可根据默认选择，或进行自定义。创

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
自定义镜像故障 - AI开发平台ModelArts

pause container xxx”如何解决？镜像保存时报错“container size %dG is greater than threshold %dG”如何解决？保存镜像时报错“too many layers in your image”如何解决？镜像保存时报错“The container

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

Lite Server GPU裸金属服务器使用EulerOS内核误升级如何解决 GPU A系列裸金属服务器无法获取显卡如何解决 GPU裸金属服务器无法Ping通如何解决 GPU A系列裸金属服务器RoCE带宽不足如何解决？ GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed

帮助中心 > AI开发平台ModelArts > 故障排除
自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

义镜像，具体请参见使用ModelArts的基础镜像构建新的训练镜像。如镜像来源于第三方，设法找到自定义镜像的制作者咨询，制作者一般对镜像如何使用更加了解。确定自定义镜像大小自定义镜像的大小推荐15GB以内，最大不要超过资源池的容器引擎空间大小的一半。镜像过大会直接影响训练作业的启动时间。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

40528150158-b521cc0 CANN：cann_8.0.rc2 PyTorch：2.1.0 Step1 创建ECS 下文中介绍如何在ECS中构建一个训练镜像，请参考ECS文档购买一个Linux弹性云服务器。完成网络配置、高级配置等步骤，可根据默认选择，或进行自定义。创

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
创建Workflow数据集标注节点 - AI开发平台ModelArts

是否必填数据类型 name 数据集标注节点的名称，命名规范(只能包含英文字母、数字、下划线（_）、中划线（-），并且只能以英文字母开头，长度限制为64字符)，一个Workflow里的两个step名称不能重复是 str inputs 数据集标注节点的输入列表是 LabelingI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

负载均衡告警、监控和统计图1 VPC直连的高速访问通道示意图约束限制调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。准备工作使用专属资源池部署在线服务，服务状态为“运行中”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
服务部署 - AI开发平台ModelArts
服务部署 - AI开发平台ModelArts

服务启动失败服务部署、启动、升级和修改时，拉取镜像失败如何处理？服务部署、启动、升级和修改时，镜像不断重启如何处理？服务部署、启动、升级和修改时，容器健康检查失败如何处理？服务部署、启动、升级和修改时，资源不足如何处理？模型使用CV2包部署在线服务报错服务状态一直处于“部署中”

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
ModelArts Standard推理服务访问公网方案 - AI开发平台ModelArts

ip}:3128", "https": "http://{proxy_server_private_ip}:3128" } 服务器私有IP获取如下图所示：图4 ECS私有IP 地址调用在推理代码中，使用服务URL进行业务请求，如： https://e8a048ce25136addbbac23ce6132a

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
训练过程读取数据 - AI开发平台ModelArts

训练过程读取数据在ModelArts上训练模型，输入输出数据如何配置？如何提升训练效率，同时减少与OBS的交互？大量数据文件，训练过程中读取数据效率低？使用Moxing时如何定义路径变量？父主题： Standard训练作业

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业
LLaVA-NeXT基于DevServer适配Pytorch NPU训练微调指导（6.3.910） - AI开发平台ModelArts

d Snt9B开展LLaVA-NeXT模型的训练过程，包括pretrain_clip训练和Finetune_onevision训练。约束限制本方案目前仅适用于企业客户。本文档适配昇腾云ModelArts 6.3.910版本，请参考获取配套版本的软件包和镜像，请严格遵照版本配套关系使用本文档。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
实例故障 - AI开发平台ModelArts
实例故障 - AI开发平台ModelArts

创建Notebook实例后无法打开页面，如何处理？使用pip install时出现“没有空间”的错误出现“save error”错误，可以运行代码，但是无法保存出现ModelArts.6333错误，如何处理？打开Notebook实例提示token不存在或者token丢失如何处理？父主题：开发环境

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
典型场景配置实践 - AI开发平台ModelArts

给子账号配置训练作业基本使用权限给子账号配置部署上线基本使用权限管理员和开发者权限分离给子账号配置查看所有Notebook实例的权限限制用户使用公共资源池委托授权ModelArts云服务使用SFS Turbo 给子账号配置文件夹级的SFS Turbo访问权限父主题： Standard权限管理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理
FlUX.1基于DevServer适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

2框架的推理过程。另外，FLUX.1-schnell模型的使用方法和FLUX.1-dev一致，只需替换权重文件即可，本文以FLUX.1-schn为例。约束限制本方案目前仅适用于企业客户。本文档适配昇腾云ModelArts 6.3.911版本，请参考表1获取配套版本的软件包和镜像，请严格遵照版本配套关系使用本文档。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理

总条数： 1211

上一页
1
...
32
33
34
...
61
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

单模型性能调优AOE - AI开发平台ModelArts

ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

查询资源池 - AI开发平台ModelArts

代码运行故障 - AI开发平台ModelArts

模型使用CV2包部署在线服务报错 - AI开发平台ModelArts

欠费说明 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

自定义镜像故障 - AI开发平台ModelArts

Lite Server - AI开发平台ModelArts

自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

创建Workflow数据集标注节点 - AI开发平台ModelArts

通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

服务部署 - AI开发平台ModelArts

ModelArts Standard推理服务访问公网方案 - AI开发平台ModelArts

训练过程读取数据 - AI开发平台ModelArts

LLaVA-NeXT基于DevServer适配Pytorch NPU训练微调指导（6.3.910） - AI开发平台ModelArts

实例故障 - AI开发平台ModelArts

典型场景配置实践 - AI开发平台ModelArts

FlUX.1基于DevServer适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线