搜索_华为云

导入模型提示单个模型文件超过5G限制 - AI开发平台ModelArts

导入模型提示单个模型文件超过5G限制问题现象在导入模型时，提示单个模型文件大小超过5G限制。原因分析在不使用动态加载的情况下，系统对单个模型文件的限制大小为5G，超过时无法进行导入。处理方法精简模型文件后，重新导入。使用动态加载功能进行导入。图1 使用动态加载父主题：

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
服务预测请求体大小限制是多少？ - AI开发平台ModelArts

服务预测请求体大小限制是多少？服务部署完成且服务处于运行中后，可以往该服务发送推理的请求，请求的内容根据模型的不同可以是文本，图片，语音，视频等内容。当使用调用指南页签中显示的调用地址（华为云APIG网关服务的地址）预测时，对请求体的大小限制是12MB，超过12MB时，请求会被拦截。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 功能咨询
ModelArts通过OBS的API访问OBS中的文件，算内网还是公网？ - AI开发平台ModelArts

还是公网？在同一区域，ModelArts通过OBS的API访问OBS中的文件属于内网通信，不消耗公网流量费。如果是通过互联网从OBS下载数据到本地，这时候会产生OBS公网流量费。OBS的详细计费说明可以参见计费项。父主题： API/SDK

帮助中心 > AI开发平台ModelArts > 常见问题 > API/SDK
部署GPU服务支持的Cuda版本是多少？ - AI开发平台ModelArts

部署GPU服务支持的Cuda版本是多少？默认支持Cuda版本为10.2，如果需要更高的版本，可以提工单申请技术支持。父主题：功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 功能咨询
GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ - AI开发平台ModelArts

属服务器使用Ubuntu20.04操作系统默认已经安装IB驱动。）操作步骤方法1：使用mlx硬件计数器，估算ROCE网卡收发流量统计300s内流量，统计脚本如下： x=$(cat /sys/class/infiniband/mlx5_2/ports/1/counters/port_rcv_data)

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
自动学习中偏好设置的各参数训练速度大概是多少 - AI开发平台ModelArts

自动学习中偏好设置的各参数训练速度大概是多少偏好设置中： performance_first：性能优先，训练时间较短，模型较小。对于TXT、图片类训练速度为10毫秒。 balance：平衡。对于TXT、图片类训练速度为14毫秒。 accuracy_first：精度优先，训练

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 模型训练
动态扩充云硬盘EVS容量 - AI开发平台ModelArts

动态扩容EVS适用于哪些使用场景在Notebook开发过程中，初期存储使用量较小时，创建Notebook可以选择小容量EVS，比如5G大小；开发完成后，需要大规模数据集训练，此时再将存储容量扩容至当前阶段所需容量，可以节约成本。动态扩容EVS有什么限制 Notebook实例的存储配置采用的是云硬盘EVS。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
资源选择推荐 - AI开发平台ModelArts

单机单卡：小数据量（1G训练数据）、低算力场景（1卡Vnt1），存储方案使用“OBS的并行文件系统（存放数据和代码）”。单机多卡：中等数据量（50G左右训练数据）、中等算力场景（8卡Vnt1），存储方案使用“SFS（存放数据和代码）”。多机多卡：大数据量（1T训练数据）、高算力场景（4台8卡Vnt1），存储方

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
在线服务预测报错ModelArts.4206 - AI开发平台ModelArts

ModelArts.4206表示该API的请求流量超过了设定值。为了保证服务的平稳运行，ModelArts对单个API的推理请求流量做了限制，同时为了保证推理服务可以稳定运行在合理区间，ModelArts将限流值设定在一个较高区间。处理办法降低API的流量，如果确有超高并发的需求，请提工单处理。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

单机单卡：小数据量（1G训练数据）、低算力场景（1卡Vnt1），存储方案推荐使用“OBS的并行文件系统（存放数据和代码）”。单机多卡：中等数据量（50G左右训练数据）、中等算力场景（8卡Vnt1），存储方案推荐使用“SFS（存放数据和代码）”。多机多卡：大数据量（1T训练数据）、高算力场景（4台8卡Vnt1），存

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
服务启动后，状态断断续续处于“告警中” - AI开发平台ModelArts

服务启动后，状态断断续续处于“告警中” 问题现象预测流量不大但频繁出现以下报错 Backend service internal error. Backend service read timed out Send the request from gateway to the

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
创建训练任务 - AI开发平台ModelArts

训练作业一般需要运行一段时间，根据您的训练业务逻辑和选择的资源不同，训练时长将持续几十分钟到几小时不等。训练作业执行成功后，日志信息如下所示。父主题：多机多卡

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

镜像：在“自定义镜像”页签选择已上传的自定义镜像。资源类型：按实际情况选择已创建的专属资源池。规格：选择8卡GPU规格，“run.sh”文件中默认MA_NUM_GPUS为8卡，因此选择notebook规格时需要与MA_NUM_GPUS默认值相同。存储配置：选择“弹性文件服务SF

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
模型管理 - AI开发平台ModelArts
模型管理 - AI开发平台ModelArts

自定义镜像导入配置运行时依赖无效通过API接口查询模型详情，model_name返回值出现乱码导入模型提示模型或镜像大小超过限制导入模型提示单个模型文件超过5G限制订阅的模型一直处于等待同步状态创建模型失败，提示模型镜像构建任务超时，没有构建日志父主题：推理部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

/configs/swin/swin_base_patch4_window7_224_22k.yaml 推荐先使用单机单卡运行脚本，待正常运行后再改用多机多卡运行脚本。多机多卡run.sh中的“VC_WORKER_HOSTS”、“VC_WORKER_NUM”、“VC_TASK_INDEX”、“MA_NUM

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

创建多机多卡的分布式训练（DistributedDataParallel）本章节介绍基于PyTorch引擎的多机多卡数据并行训练。并提供了分布式训练调测具体的代码适配操作过程和代码示例。同时还针对Resnet18在cifar10数据集上的分类任务，给出了分布式训练改造(DDP)的完整代码示例，供用户学习参考。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
资源购买 - AI开发平台ModelArts
资源购买 - AI开发平台ModelArts

被清空。SFS购买指导请参考如何购买弹性文件服务？。购买容器镜像服务SWR 容器镜像服务分为企业版和共享版。共享版计费项包括存储空间和流量费用，目前均免费提供给您。企业版当前仅支持按需计费模式，公测期间，可免费使用。上传镜像前需要创建组织，创建步骤请参考创建组织。购买对象存储服务OBS

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

使用VPC直连的高速访问通道，用户的业务请求不需要经过推理平台，而是直接经VPC对等连接发送到实例处理，访问速度更快。由于请求不经过推理平台，所以会丢失以下功能：认证鉴权流量按配置分发负载均衡告警、监控和统计图1 VPC直连的高速访问通道示意图约束限制调用API访问在线服务时，对预测请求体大小和预测时间有限制：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
推理性能测试 - AI开发平台ModelArts

创建在线服务时，每秒服务流量限制默认为100次，如果静态benchmark的并发数（parallel-num参数）或动态benchmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。同步请

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
推理性能测试 - AI开发平台ModelArts

创建在线服务时，每秒服务流量限制默认为100次，如果静态benchmark的并发数（parallel-num参数）或动态benchmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。同步请

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）

总条数： 423

上一页
1
2
3
4
5
...
22
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

导入模型提示单个模型文件超过5G限制 - AI开发平台ModelArts

服务预测请求体大小限制是多少？ - AI开发平台ModelArts

ModelArts通过OBS的API访问OBS中的文件，算内网还是公网？ - AI开发平台ModelArts

部署GPU服务支持的Cuda版本是多少？ - AI开发平台ModelArts

GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ - AI开发平台ModelArts

自动学习中偏好设置的各参数训练速度大概是多少 - AI开发平台ModelArts

动态扩充云硬盘EVS容量 - AI开发平台ModelArts

资源选择推荐 - AI开发平台ModelArts

在线服务预测报错ModelArts.4206 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

服务启动后，状态断断续续处于“告警中” - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

模型管理 - AI开发平台ModelArts

在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

资源购买 - AI开发平台ModelArts

通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线