搜索_华为云

附录：大模型推理常见问题 - AI开发平台ModelArts

k/tokenizer/chatglm3-6b/config.json 问题3：使用离线推理时，性能较差或精度异常。解决方法：将block_size大小设置为128。 from vllm import LLM, SamplingParams llm = LLM(model="facebook/opt-125m"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
网卡名称错误 - AI开发平台ModelArts

可以使用ifconfig命令检查网卡名称配置是否正确。比如，ifconfig看到当前机器IP对应的网卡名称为enp67s0f5，则可以设置环境变量指定该值。图1 网卡名称错误 export GLOO_SOCKET_IFNAME=enp67s0f5 # 多机之间使用gloo通信时需要指定网口名称，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

Administrator 裸金属服务器BMS BMS FullAccess 镜像服务IMS IMS FullAccess 数据加密服务DEW DEW KeypairReadOnlyAccess 虚拟私有云VPC VPC FullAccess 弹性云服务器ECS ECS FullAccess

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
环境准备 - AI开发平台ModelArts
环境准备 - AI开发平台ModelArts

打开”，打开Notebook实例。 ModelArts Lite DevServer 开通裸金属服务器资源请见DevServer资源开通，在裸金属服务器上搭建迁移环境请见裸金属服务器环境配置指导。父主题： GPU推理业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
使用ModelArts Studio的Qwen2-7B模型框架实现对话问答 - AI开发平台ModelArts

图5 资源设置表2 部署模型服务参数说明取值样例服务设置服务名称自定义模型服务的名称。 service-1122 描述部署模型服务的简介。 - 模型设置部署模型当从“我的模型”进入部署模型服务页面时，此处默认呈现选择的模型。 Qwen2-7B 资源设置资源池类型

 帮助中心 > AI开发平台ModelArts > 快速入门
实时推理的部署及使用流程 - AI开发平台ModelArts

协议：使用WebSocket协议的方式访问在线服务：WebSocket使得客户端和服务器之间的数据交换变得更加简单，允许服务端主动向客户端推送数据。在WebSocket API中，浏览器和服务器只需要完成一次握手，两者之间就可以建立持久性的连接，并进行双向数据传输。使用Server-Sent

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
删除算法 - AI开发平台ModelArts
删除算法 - AI开发平台ModelArts

/{algorithm_id} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 algorithm_id 是 String 算法ID。请求参数无响应参数无请求示例如下以修改uui

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
创建Workflow服务部署节点 - AI开发平台ModelArts

在ModelArts管理控制台，左侧菜单栏选择“Workflow”进入Workflow页面。在服务部署节点启动之后会等待用户设置相关配置信息，选择模型及版本为异步推理模型，设置服务启动参数，配置完成后直接单击继续运行即可。其中服务启动参数与您选择的异步推理模型相关，选择了需要的模型及版本后，系统会自动匹配响应的服务启动参数。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
配额与限制 - AI开发平台ModelArts

Cluster或Lite Server时，所需的ECS实例数、内存大小、CPU核数和EVS硬盘大小等资源会超出华为云默认提供的资源配额，因此需要申请扩大配额。具体配额项如下。表1 ModelArts Lite涉及的资源配额服务资源类型 ECS资源类型 ECS实例数 CPU核心数 RAM容量（MB）

帮助中心 > AI开发平台ModelArts > 产品介绍
Lite Server算力资源和镜像版本配套关系 - AI开发平台ModelArts

Server算力资源和镜像版本配套关系 Lite Server提供多种NPU、GPU镜像，您可在购买前了解当前支持的镜像及对应详情。 NPU Snt9裸金属服务器支持的镜像详情镜像名称：ModelArts-Euler2.8_Aarch64_Snt9_C78 表1 镜像详情软件类型版本详情操作系统

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server使用前必读
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

获取对应模型的权重文件，获取链接参考表1。权重文件下载有如下几种方式，但不仅限于以下方式：方法一：网页下载：通过单击表格中权重文件获取地址的访问链接，即可在模型主页的Files and Version中下载文件。方法二：huggingface-cli：huggingface-cli是 Hugging

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
训练作业访问OBS时，日志提示“stat:403 reason:Forbidden” - AI开发平台ModelArts

CAA1A71019C9D0 retry:0 原因分析出现该问题的可能原因如下: OBS服务的权限出现问题，导致无法正常读取数据处理方法请检查OBS权限配置，如未解决问题可参考OBS文档的已配置OBS权限，仍然无法访问OBS（403 AccessDenied）。建议与总结

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 权限问题
基本配置 - AI开发平台ModelArts
基本配置 - AI开发平台ModelArts

基本配置权限配置创建网络专属资源池VPC打通 ECS服务器挂载SFS Turbo存储在ECS中创建ma-user和ma-group obsutil安装和配置（可选）工作空间配置父主题：专属资源池训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
配置授权 - AI开发平台ModelArts
配置授权 - AI开发平台ModelArts

配置ModelArts授权。若没有授权，ModelArts训练管理、开发环境、数据管理、在线服务等功能将不能正常使用。该API支持管理员给IAM子用户设置委托，支持设置当前用户的访问密钥。调用该API需要在IAM系统里配置Security Administrator权限。调试您可以在API Ex

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
权限配置 - AI开发平台ModelArts
权限配置 - AI开发平台ModelArts

CommonOperations权限只能二选一，不能同时选。 SFS弹性文件服务弹性文件服务SFS Turbo的所有权限。使用SFS服务时需要配置。 ECS弹性云服务器弹性云服务器所有权限。使用ECS服务时需要配置。 SWR容器镜像仓库容器镜像仓库所有权限。使用SWR服务时需要配置。同时，还需开通SWR组织权限。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
使用MaaS压缩模型 - AI开发平台ModelArts

重，以提高推理效率。压缩后模型名称设置压缩后产生的新模型的名称。支持1~64位，以中文、大小写字母开头，只包含中文、大小写字母、数字、下划线（_）、中划线（-）和（.）。参数设置平滑系数/Migration Strength 设置SmoothQuant量化的迁移系数，仅

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

代码和推理评测代码。代码包具体说明请参见模型软件包结构说明。 AscendSpeed是用于模型并行计算的框架，其中包含了许多模型的输入处理方法。获取路径：Support-E，在此路径中查找下载ModelArts 6.3.911版本。说明：如果上述软件获取路径打开后未显示相应

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 准备工作
显存溢出错误 - AI开发平台ModelArts

allocated memory try setting max_split_size_mb to avoid fragmentation. 解决方法通过npu-smi info查看是否有进程资源占用NPU，导致训练时显存不足。解决可通过kill掉残留的进程或等待资源释放。可调整参数

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
推理精度测试 - AI开发平台ModelArts

#启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字确保Notebook内通网，已通网可以跳过这一步，未通网需要配置$config_proxy_str，$config_pip_str设置对应的代理和pip源，来确保当前代理和pip源可用。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
推理精度测试 - AI开发平台ModelArts

py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字确保容器内通网，未通网需要配置$config_proxy_str，$config_pip_str设置对应的代理和pip源，来确保当前代理和pip源可用。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906）

总条数： 1595

上一页
1
...
8
9
10
...
80
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

附录：大模型推理常见问题 - AI开发平台ModelArts

网卡名称错误 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

环境准备 - AI开发平台ModelArts

使用ModelArts Studio的Qwen2-7B模型框架实现对话问答 - AI开发平台ModelArts

实时推理的部署及使用流程 - AI开发平台ModelArts

删除算法 - AI开发平台ModelArts

创建Workflow服务部署节点 - AI开发平台ModelArts

配额与限制 - AI开发平台ModelArts

Lite Server算力资源和镜像版本配套关系 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

训练作业访问OBS时，日志提示“stat:403 reason:Forbidden” - AI开发平台ModelArts

基本配置 - AI开发平台ModelArts

配置授权 - AI开发平台ModelArts

权限配置 - AI开发平台ModelArts

使用MaaS压缩模型 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

显存溢出错误 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线