搜索_华为云

ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

Standard推理服务支持VPC直连的高速访问通道配置背景说明访问在线服务的实际业务中，用户可能会存在如下需求：高吞吐量、低时延 TCP或者RPC请求因此，ModelArts提供了VPC直连的高速访问通道功能以满足用户的需求。使用VPC直连的高速访问通道，用户的业务请求不需要经过推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
导入模型时，模型配置文件中的安装包依赖参数如何编写？ - AI开发平台ModelArts

导入模型时，模型配置文件中的安装包依赖参数如何编写？问题描述从OBS中或者从容器镜像中导入模型时，开发者需要编写模型配置文件。模型配置文件描述模型用途、模型计算框架、模型精度、推理代码依赖包以及模型对外API接口。配置文件为JSON格式。配置文件中的“dependencies

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 模型管理 > 导入模型
推理部署计费项 - AI开发平台ModelArts

计费说明在ModelArts进行服务部署时，会产生计算资源和存储资源的累计值计费。计算资源为运行推理服务的费用。存储资源包括数据存储到OBS的计费。具体内容如表1所示。表1 计费项计费项计费项说明适用的计费模式计费公式计算资源公共资源池使用计算资源的用量。具体费用可参见ModelArts价格详情。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
训练作业运行失败排查指导 - AI开发平台ModelArts

label_map.pbtxt.”。如果使用的是AI Gallery订阅的算法，建议先检查数据的标签是否有问题。如果使用的是物体检测类算法，建议检查数据的label框是否为非矩形。物体检测类算法仅支持矩形label框。查看训练作业的“日志”，出现报错“RuntimeError:

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
部署的在线服务状态为告警 - AI开发平台ModelArts

请检查推理代码是否存在内存溢出或者内存泄漏的问题。模型运行异常。请检查您的模型是否能正常运行。例如模型依赖的资源是否故障，需要排查推理日志。实例pod数量异常。如果您曾经找过运维人员删除过异常的实例pod，事件中可能会出现告警“服务异常，不正常的实例数为XXX”。在出现这种告警后，服务会自动拉起新的正常实

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

volumes=[nfs-x]”。原因分析用户账号下的SFS Turbo所在的VPC网络需要与专属资源池所在的网络打通，运行于该专属资源池的训练作业才能正常挂载SFS。因此，当训练作业挂载SFS失败时，可能是网络不通导致的。处理步骤进入训练作业详情页，在左侧获取SFS Turbo的名称。图1 获取SFS

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 专属资源池创建训练作业
日志提示“ '(slice(0, 13184, None), slice(None, None, None))' is an invalid key” - AI开发平台ModelArts

原因分析出现该问题的可能原因如下：切分数据时，选择的数据不对。处理方法尝试如下代码： X = dataset.iloc[:,:-1].values 建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上n

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
创建Workflow训练作业节点 - AI开发平台ModelArts

如果您在本地IDEA环境中开发工作流，则Session初始化使用如下方式 # 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； # 本示例以ak和sk保存在环境变量中来实现身份验证为例，运行本示例前请先在本地环境中设置环境

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
使用GPTQ量化 - AI开发平台ModelArts

当前版本使用GPTQ量化仅支持W8A16 perchannel的量化形式，使用W8A16的量化不仅可以保证精度在可接受的范围内，同时也有一定的性能收益。 GPTQ W8A16量化支持的模型请参见支持的模型列表和权重文件。本章节介绍如何在GPU的机器上使用开源GPTQ量化工具GPTQ (huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
Lite Cluster使用流程 - AI开发平台ModelArts

供轻量级的虚拟化，以便隔离进程和资源。尽管容器技术已经出现很久，却是随着Docker的出现而变得广为人知。Docker是第一个使容器能在不同机器之间移植的系统。它不仅简化了打包应用的流程，也简化了打包应用的库和依赖，甚至整个操作系统的文件系统能被打包成一个简单的可移植的包，这个包

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
创建ModelArts数据清洗任务 - AI开发平台ModelArts

据上传至OBS。确保您使用的OBS与ModelArts在同一区域。创建数据处理任务登录ModelArts管理控制台，在左侧的导航栏中选择“资产管理>数据处理”，进入“数据处理”页面。在“数据处理”页面，单击“创建”进入“创建数据处理”页面。在创建数据处理页面，填写相关算法参数。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
Standard资源池节点故障定位 - AI开发平台ModelArts

-a查询到存在Pending Page Blacklist为Yes的记录，或多比特Register File大于0。对于Ampere架构的GPU，存在以下场景：存在不可纠正的SRAM错误。存在Remapping Failure记录。 dmsg中存在Xid 95事件。（参考NVIDIA GPU

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
日志提示“RuntimeError: Cannot re-initialize CUDA in forked subprocess” - AI开发平台ModelArts

forked subprocess” 问题现象在使用pytorch启动多进程的时候，出现如下报错： RuntimeError: Cannot re-initialize CUDA in forked subprocess 原因分析出现该问题的可能原因如下： multiprocessing启动方式有误。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

准备权重获取对应模型的权重文件，获取链接参考表1。权重文件下载有如下几种方式，但不仅限于以下方式：方法一：网页下载：通过单击表格中权重文件获取地址的访问链接，即可在模型主页的Files and Version中下载文件。方法二：huggingface-cli：huggingface-cli是

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.911） > 准备工作
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

准备权重获取对应模型的权重文件，获取链接参考表1。权重文件下载有如下几种方式，但不仅限于以下方式：方法一：网页下载：通过单击表格中权重文件获取地址的访问链接，即可在模型主页的Files and Version中下载文件。方法二：huggingface-cli：huggingface-cli是

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 准备工作
MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” - AI开发平台ModelArts

retCode=0x91, [the model stream execute failed] 原因分析出现该问题的可能原因如下：数据读入的速度跟不上模型迭代的速度。处理方法减少预处理shuffle操作。 dataset = dataset.shuffle(buffer_size=x)

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
Lite Cluster资源管理介绍 - AI开发平台ModelArts

后，由于用户AI开发业务的变化，对于资源池资源量的需求可能会产生变化，面对这种场景，ModelArts提供了扩缩容功能，用户可以根据自己的需求动态调整。升级Lite Cluster资源池驱动：当资源池中的节点含有GPU/Ascend资源时，用户基于自己的业务，可能会有自定义GP

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
创建Notebook并执行性能诊断任务 - AI开发平台ModelArts

到已提交的性能诊断任务详情。图8 查看性能诊断任务结果当前支持的状态有“分析中（Analyzing）、成功（Success）和失败（Failed）”。分析中的任务根据性能诊断数据量大小预计将在1~10分钟内完成；成功的任务可单击Report列的View链接查看详细的诊断报告，

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
续费概述 - AI开发平台ModelArts
续费概述 - AI开发平台ModelArts

请参见到期后影响。续费相关的功能包年/包月专属资源池续费相关的功能如表1所示。表1 续费相关的功能功能说明手动续费包年/包月专属资源池从购买到被自动删除之前，您可以随时在ModelArts控制台为专属资源池续费，以延长专属资源池的使用时间。自动续费开通自动续费

 帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

通过VPC高速访问通道的方式访问在线服务背景说明访问在线服务的实际业务中，用户可能会存在如下需求：高吞吐量、低时延 TCP或者RPC请求因此，ModelArts提供了VPC直连的高速访问通道功能以满足用户的需求。使用VPC直连的高速访问通道，用户的业务请求不需要经过推理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道

总条数： 1717

上一页
1
...
80
81
82
...
86
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

导入模型时，模型配置文件中的安装包依赖参数如何编写？ - AI开发平台ModelArts

推理部署计费项 - AI开发平台ModelArts

训练作业运行失败排查指导 - AI开发平台ModelArts

部署的在线服务状态为告警 - AI开发平台ModelArts

创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

日志提示“ '(slice(0, 13184, None), slice(None, None, None))' is an invalid key” - AI开发平台ModelArts

创建Workflow训练作业节点 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

Lite Cluster使用流程 - AI开发平台ModelArts

创建ModelArts数据清洗任务 - AI开发平台ModelArts

Standard资源池节点故障定位 - AI开发平台ModelArts

日志提示“RuntimeError: Cannot re-initialize CUDA in forked subprocess” - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” - AI开发平台ModelArts

Lite Cluster资源管理介绍 - AI开发平台ModelArts

创建Notebook并执行性能诊断任务 - AI开发平台ModelArts

续费概述 - AI开发平台ModelArts

通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线