搜索_华为云

附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题问题1：在推理预测过程中遇到NPU out of memory 解决方法：调整推理服务启动时的显存利用率，将--gpu-memory-utilization的值调小。问题2：在推理预测过程中遇到ValueError:User-specified max_model_len

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化当前版本使用GPTQ量化仅支持W8A16 perchannel的量化形式，使用W8A16的量化不仅可以保证精度在可接受的范围内，同时也有一定的性能收益。 GPTQ W8A16量化支持的模型请参见支持的模型列表和权重文件。本章节介绍如何在GPU的机器上使用开源GPTQ量化工具GPTQ

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
推理关键特性使用 - AI开发平台ModelArts

推理关键特性使用量化剪枝分离部署 Prefix Caching multi-step 投机推理图模式多模态 Chunked Prefill multi-lora guided-decoding 父主题：主流开源大模型基于Lite Server适配Ascend-vLLM

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
执行预训练任务 - AI开发平台ModelArts

执行预训练任务 Step1 上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件和数据集到容器中，可以忽略此步骤。如果未上传训练权重文件和数据集到容器中，具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908）
执行预训练任务 - AI开发平台ModelArts

执行预训练任务步骤一上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件和数据集到容器中，可以忽略此步骤。如果未上传训练权重文件和数据集到容器中，具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909）
使用基础镜像 - AI开发平台ModelArts

使用基础镜像通过ECS获取和上传基础镜像将镜像上传至SWR服务后，可创建训练作业，在“选择镜像”中选择SWR中基础镜像。由于基础镜像内需要安装固定版本依赖包，如果直接使用基础镜像进行训练，每次创建训练作业时，训练作业的图1中都需要执行install.sh文件，来安装依赖以及下载完整代码。命令如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作 > 准备镜像
常见错误原因和解决方法 - AI开发平台ModelArts

常见错误原因和解决方法显存溢出错误网卡名称错误父主题：主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909）
准备数据（可选） - AI开发平台ModelArts

准备数据（可选）此小节为自定义数据集执行过程，如非自定义数据集此小节忽略。本教程使用到的是LLamaFactory代码包自带数据集。您也可以自行准备数据集，目前支持alpaca格式和sharegpt格式的微调数据集；使用自定义数据集时，请更新代码目录下data/dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 准备工作
查看和管理注册到CloudMap的微服务实例 - 应用平台 AppStage

查看和管理注册到CloudMap的微服务实例查看注册到CloudMap的微服务实例列表调整微服务实例状态父主题：管理Cloud Map中的服务资源

 帮助中心 > 应用平台 AppStage > 运行时引擎用户指南（即将下线） > 管理Cloud Map中的服务资源
在WiseDBA中新增和管理数据库账号 - 应用平台 AppStage

在WiseDBA中新增和管理数据库账号在WiseDBA中新增数据库账号在WiseDBA中同步数据库账号在WiseDBA中下线及还原数据库账号在WiseDBA中永久删除数据库账号在WiseDBA中新增数据库账号权限在WiseDBA中复制数据库账号权限在WiseDBA中新增数据库账号host

帮助中心 > 应用平台 AppStage > 运行时引擎用户指南（即将下线） > 配置运行时引擎数据库治理
查看依赖服务（声明） - 应用平台 AppStage

查看依赖服务（声明）依赖服务声明主要指的是在微服务之间建立的一种明确、显式的依赖关系描述，有助于理解和维护微服务之间的交互和依赖关系，以确保系统的稳定性和可维护性。查看依赖服务（声明）进入AppStage运维中心。在顶部导航栏选择服务。单击，选择“微服务开发 > 服务发现”。

帮助中心 > 应用平台 AppStage > 运行时引擎用户指南（即将下线） > 管理Cloud Map中的服务资源 > 查看注册到CloudMap的微服务信息
部署物体检测服务 - AI开发平台ModelArts

部署物体检测服务模型部署模型部署操作即将模型部署为在线服务，并且提供在线的测试UI与监控能力。完成模型训练后，可选择准确率理想且训练状态为“运行成功”的版本部署上线。具体操作步骤如下。在“运行节点”页面中，待服务部署节点的状态变为“等待输入”时，双击“服务部署”进入配置详情页，完成资源的参数配置操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现物体检测
部署文本分类服务 - AI开发平台ModelArts

部署文本分类服务模型部署模型部署操作即将模型部署为在线服务，并且提供在线的测试UI与监控能力。完成模型训练后，可选择准确率理想且训练状态为“运行成功”的版本部署上线。具体操作步骤如下。在“运行总览”页面中，待服务部署节点的状态变为“等待输入”，双击“服务部署”节点，进入配置详情页，完成资源的参数配置操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现文本分类
创建Workflow数据集节点 - AI开发平台ModelArts

创建Workflow数据集节点功能介绍通过对ModelArts数据集能力进行封装，实现新版数据集的创建功能。主要用于通过创建数据集对已有数据（已标注/未标注）进行统一管理的场景，后续常见数据集导入节点或者数据集标注节点。属性总览您可以使用CreateDatasetStep

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
使用会议并发资源召开会议 - 华为云会议 Meeting

总数。使用流程图1 使用流程登录华为云会议管理平台您可以使用IE11及以上版本、Chrome46及以上版本、FireFox41及以上版本浏览器访问华为云会议管理平台。您可以通过以下两种方式登录。使用企业管理员账号登录华为云会议管理平台。企业管理员账号及密码请从华为云会

 帮助中心 > 华为云会议 Meeting > 快速入门 > 使用会议资源召开会议
插件搜索、安装及使用 - CodeArts IDE

OpenVSX 插件市场上的插件，单击搜索框下方的标签页可切换搜索平台。单击右上角的按钮可刷新页面，单击按钮可一键清空搜索框。插件安装通过插件市场安装单击按钮可通过插件市场进行安装。下载安装华为云平台的插件时，请先登录华为云。本地插件安装如果需要安装本地的插件包可以通过单击

 帮助中心 > CodeArts IDE > 用户指南 > 插件市场
设备接收解绑定命令 - IoT物联网

设备接收解绑定命令接口功能被动接收平台下发的解绑定命令，删除直连设备的配置信息并且释放所有资源。(接收到此命令说明设备已经从平台侧删除。) 接口描述 1 HubService.TOPIC_UNBINDDEVICE; 接口所属类 HubService。示例调用该接口需要实现Agent

帮助中心 > IoT物联网 > SDK参考 > 设备侧Agent Lite API参考(Java)（联通用户专用） > 直连设备接入
查看对接参数 - 云客服
查看对接参数 - 云客服

查看对接参数前提条件已联系运营人员获取了对接参数。操作步骤以租户管理员角色登录AICC，选择“配置中心 > 系统管理 > 租户信息”，进入租间基本信息页签。选择“对接参数”项，查看API Fabric标识。 (可选)单击“下载SK”，可下载SK至本地。单击“重置SK”，输入当前用户密码后，可重置SK。

帮助中心 > 用户指南 > 租户管理员指南 > 配置公共资源
代码开发 - 云原生应用现代化
代码开发 - 云原生应用现代化

进入云数据库RDS管理控制台，单击名称进入实例详情页面。图1 RDS控制台在实例详情页面，单击“登录”。图2 登录在实例登录页面输入用户名和密码，单击“测试连接”，显示连接成功后，单击“登录”。图3 实例登录进入数据管理服务控制台后，点击“新建数据库”。填写数据库名称及字符集（utf8）后，点击“确认”。

帮助中心 > 华为云数字资产管理 > 实施步骤
系统管理 - 数据管理与分析
系统管理 - 数据管理与分析

设置租户管理员：为选择的租户指定管理员。冻结/启用：冻结、启用所选租户。编辑：编辑维护租户信息。续租：延长租户租期时间范围。父主题：数据生命周期平台操作手册

 帮助中心 > 数据管理与分析 > 软通动力数据中台及数据治理服务解决方案实践 > 实施步骤 > 数据生命周期平台操作手册

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

附录：大模型推理常见问题 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

推理关键特性使用 - AI开发平台ModelArts

执行预训练任务 - AI开发平台ModelArts

执行预训练任务 - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

常见错误原因和解决方法 - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

查看和管理注册到CloudMap的微服务实例 - 应用平台 AppStage

在WiseDBA中新增和管理数据库账号 - 应用平台 AppStage

查看依赖服务（声明） - 应用平台 AppStage

部署物体检测服务 - AI开发平台ModelArts

部署文本分类服务 - AI开发平台ModelArts

创建Workflow数据集节点 - AI开发平台ModelArts

使用会议并发资源召开会议 - 华为云会议 Meeting

插件搜索、安装及使用 - CodeArts IDE

设备接收解绑定命令 - IoT物联网

查看对接参数 - 云客服

代码开发 - 云原生应用现代化

系统管理 - 数据管理与分析

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线