搜索_华为云

日志提示“no socket interface found” - AI开发平台ModelArts

可能原因如下：原因1：未设置环境变量NCCL_IB_TC、NCCL_IB_GID_INDEX、NCCL_IB_TIMEOUT，因此会导致通信速度慢且不稳定，最后造成IB通信断连，偶发上述现象。原因2：NCCL_SOCKET_IFNAME设置错误。当用户的NCCL版本低于2.14时

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） - AI开发平台ModelArts

主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）推理场景介绍部署推理服务推理性能测试推理精度测试推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

NPU推理指导（6.3.910）场景介绍准备工作在Notebook调试环境中部署推理服务在推理生产环境中部署推理服务推理精度测试推理性能测试推理模型量化 eagle 投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：Standard大模型推理常见问题

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910）推理场景介绍部署推理服务推理性能测试推理精度测试推理模型量化 eagle投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

问通道功能以满足用户的需求。使用VPC直连的高速访问通道，用户的业务请求不需要经过推理平台，而是直接经VPC对等连接发送到实例处理，访问速度更快。由于请求不经过推理平台，所以会丢失以下功能：认证鉴权流量按配置分发负载均衡告警、监控和统计图1 VPC直连的高速访问通道示意图

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）推理场景介绍准备工作部署推理服务推理性能测试推理精度测试推理模型量化 Eagle投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题附录：工作负载Pod异常问题和解决方法

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

NPU推理指导（6.3.911）场景介绍准备工作在Notebook调试环境中部署推理服务在推理生产环境中部署推理服务推理精度测试推理性能测试推理模型量化 Eagle投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
创建资源池失败 - AI开发平台ModelArts

Cluster”页面。您可以通过单击“购买AI专属集群”右侧的“操作记录”，查看当前处于失败状态的资源池信息。图1 创建失败资源池信息鼠标悬停在“状态”列的上，即可看到该操作失败的具体原因。失败的记录默认按照操作的申请时间排序，最多显示500条并保留3天。父主题：资源池

 帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
性能调优 - AI开发平台ModelArts
性能调优 - AI开发平台ModelArts

性能调优单模型性能测试工具Mindspore lite benchmark 单模型性能调优AOE 父主题：基于AIGC模型的GPU推理业务迁移至昇腾指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
Standard模型部署 - AI开发平台ModelArts

供了一整套安全可靠的一站式部署方式。图1 部署模型的流程在线推理服务，可以实现高并发，低延时，弹性伸缩，并且支持多模型灰度发布、A/B测试。支持各种部署场景，既能部署为云端的在线推理服务和批量推理任务，也能部署到端，边等各种设备。一键部署，可以直接推送部署到边缘设备中，选择智能边缘节点，推送模型。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
SD WEBUI套件适配PyTorch NPU的推理指导（6.3.908） - AI开发平台ModelArts

WebUI推理方案概览在DevServer上部署SD WebUI推理服务在Standard上部署SD WebUI推理服务 SD WebUI推理性能测试父主题：文生图模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
Eagle投机小模型训练 - AI开发平台ModelArts

Eagle投机小模型训练什么是Eagle投机小模型训练 2013年12月滑铁卢大学、加拿大向量研究院、北京大学等机构联合发布Eagle，旨在提升大语言模型的推理速度，同时保证模型输出文本的分布一致。这种方法外推LLM的第二顶层特征向量，能够显著提升生成效率。 Eagle训练了一个单层模型，使用input

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
人工标注视频数据 - AI开发平台ModelArts

在标注页面中，播放视频，当视频播放至待标注时间时，单击进度条左侧的暂停按钮，将视频暂停至某一帧对应的画面。在上方区域选择标注框，默认为矩形框。使用鼠标在视频画面中框出目标，然后在弹出的添加标签文本框中，直接输入新的标签名，在文本框前面选中标签颜色，单击“添加”完成1个物体的标注。如果已存

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

Tree算法可以用更少的数据通信量完成all reduce计算，但用来测试性能不太合适。因此，会出现两节点实际带宽100，但测试出速度110，甚至130GB/s的情况。加这个参数以后，2节点和2节点以上情况的速度才会稳定一些。测试时需要执行mpirun的节点到hostfile中的节点间有免密登录，设置SSH免密登录方法如下：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
multi-lora - AI开发平台ModelArts
multi-lora - AI开发平台ModelArts

减少所需的训练参数，还降低了显存和计算成本，加快了模型微调速度。对于VLLM来说，使用LoRA进行多任务部署具有以下优势：资源节省：在大模型中引入LoRA，可以减少模型需要更新的参数量，从而节省NPU内存并提高推理速度。轻量化适配：无需改变原始模型结构，通过低秩矩阵的调整即可适配不同任务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
日志提示“No space left on device” - AI开发平台ModelArts

作业训练失败。实际存储空间足够，却依旧报错“No Space left on device”。同一目录下创建较多文件，为了加快文件检索速度，内核会创建一个索引表，短时间内创建较多文件时，会导致索引表达到上限，进而报错。触发条件和下面的因素有关：文件名越长，文件数量的上限越小。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
修改模型服务QPS - AI开发平台ModelArts

修改模型服务QPS 流量限制QPS是评估模型服务处理能力的关键指标，它指示系统在高并发场景下每秒能处理的请求量。这一指标直接关系到模型的响应速度和处理效率。不当的QPS配置可能导致用户等待时间延长，影响满意度。因此，能够灵活调整模型的QPS对于保障服务性能、优化用户体验、维持业务流畅及控制成本至关重要。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
单模型性能调优AOE - AI开发平台ModelArts

er_hidden_states:[2,77,768] input_format=NCHW 再次执行模型转换命令（此次运行关闭了AOE，速度会变快）： #shell converter_lite --modelFile=/home_host/work/runwayml/onnx_models/unet/model

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 性能调优
下载或读取文件报错，提示超时、无剩余空间 - AI开发平台ModelArts

作业训练失败。实际存储空间足够，却依旧报错“No Space left on device”。同一目录下创建较多文件，为了加快文件检索速度，内核会创建一个索引表，短时间内创建较多文件时，会导致索引表达到上限，进而报错。触发条件和下面的因素有关：文件名越长，文件数量的上限越小

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
释放Lite Server资源 - AI开发平台ModelArts

登录ModelArts管理控制台。在左侧导航栏中，选择“资源管理 > AI专属资源池 > 弹性节点Server”，进入“节点”列表页面。鼠标移动至节点名称上，复制需要退订的实例ID。图3 复制实例ID Server购买订单里绑定的资源ID为Server ID，与Server产品所封装的BMS/ECS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理

总条数： 273

上一页
1
...
5
6
7
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

日志提示“no socket interface found” - AI开发平台ModelArts

主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

创建资源池失败 - AI开发平台ModelArts

性能调优 - AI开发平台ModelArts

Standard模型部署 - AI开发平台ModelArts

SD WEBUI套件适配PyTorch NPU的推理指导（6.3.908） - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

人工标注视频数据 - AI开发平台ModelArts

GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

multi-lora - AI开发平台ModelArts

日志提示“No space left on device” - AI开发平台ModelArts

修改模型服务QPS - AI开发平台ModelArts

单模型性能调优AOE - AI开发平台ModelArts

下载或读取文件报错，提示超时、无剩余空间 - AI开发平台ModelArts

释放Lite Server资源 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线