搜索_华为云

概述 - 数据管理服务 DAS

概述 GaussDB(DWS)基于开源PG生态构建，目前用户普遍使用DAS连接集群，但DAS兼容多引擎，且其主要使用开源组件实现开发，对于GaussDB(DWS)语法兼容性并不完整，导致部分功能在使用DAS时会出现问题，适配DAS难度较大。在DWS侧用户只能做集群运维类操作，对于

帮助中心 > 数据管理服务 DAS > 用户指南 > GaussDB(DWS)（即将下线）

CodeArts Artifact最佳实践汇总 - 制品仓库 CodeArts Artifact

本实践介绍如何通过编译构建任务发布私有组件到NPM私有依赖库、如何从NPM私有依赖库获取依赖包完成编译构建任务。通过编译构建任务发布/获取Go私有组件本实践介绍如何通过编译构建任务发布私有组件到Go私有依赖库、如何从Go私有依赖库获取依赖包完成编译构建任务。通过编译构建任务发布/获取PyPI私有组件

帮助中心 > 制品仓库 CodeArts Artifact > 最佳实践

降低MapReduce客户端运行任务失败率 - MapReduce服务 MRS

max-host-failures MR任务在reduce过程中读取远端shuffle数据允许失败的次数。当设置次数大于5时，可以降低客户端应用的失败率。该参数适用于MRS 3.x版本。 5 mapreduce.client.submit.file.replication MR任务在运行时依赖的相关j

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce > MapReduce性能调优

提交MapReduce任务时客户端长时间无响应 - MapReduce服务 MRS

提交MapReduce任务时客户端长时间无响应问题向YARN服务器提交MapReduce任务后，客户端长时间无响应。回答对于上述出现的问题，ResourceManager在其WebUI上提供了MapReduce作业关键步骤的诊断信息，对于一个已经提交到YARN上的MapR

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > MapReduce开发指南（普通模式） > MapReduce应用开发常见问题

使用Flume服务端从本地采集静态日志保存到HDFS - MapReduce服务 MRS

使用Flume服务端从本地采集静态日志保存到HDFS 该任务指导用户使用Flume服务端从本地采集静态日志保存到HDFS上“/flume/test”目录下。本配置默认集群网络环境是安全的，数据传输过程不需要启用SSL认证。如需使用加密方式，请参考配置Flume加密传输数据采集任务。该配置为只用一个Flume场景，例如：Spooldir

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > 配置Flume非加密传输数据采集任务

使用Flume服务端从本地采集动态日志保存到HDFS - MapReduce服务 MRS

使用Flume服务端从本地采集动态日志保存到HDFS 该任务指导用户使用Flume服务端从本地采集动态日志保存到HDFS上“/flume/test”目录下。本配置默认集群网络环境是安全的，数据传输过程不需要启用SSL认证。如需使用加密方式，请参考配置Flume加密传输数据采集任务。该配置为只用一个Flume场景，例如：Taildir

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > 配置Flume非加密传输数据采集任务

P-3B 飞机在执行来自飞机和卫星的对流层成分北极研究（ARCTAS）任务期间收集的原地气溶胶数据

ARCTAS_Aerosol_AircraftInSitu_P3B_Data 是 P-3B 飞机在执行来自飞机和卫星的对流层成分北极研究（ARCTAS）任务期间收集的原地气溶胶数据。数据由颗粒烟尘吸收光度计 (PSAP)、空气动力颗粒测定仪 (APS)、凝结颗粒计数器 (CPC)、单颗粒烟尘光度计

开发者 > 博客

作者：此星光明

发表时间： 2024-08-05 08:43:41

42

0

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置本代码包中集成了不同模型（包括llama2、llama3、Qwen、Qwen1.5 ......）的训练脚本，并可通过统一的训练脚本一键式运行。训练脚本可判断是否完成预处理后的数据和权重转换的模型。如果未完成，则执行脚本，自动完成数据预处理和权重转换的过程。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明

显存溢出错误 - AI开发平台ModelArts

显存溢出错误在训练过程中，常见显存溢出报错，示例如下： RuntimeError: NPU out of memory. Tried to allocate 1.04 GiB (NPU 4; 60.97 GiB total capacity; 56.45 GiB already

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908） > 常见错误原因和解决方法

网卡名称错误 - AI开发平台ModelArts

网卡名称错误当训练开始时提示网卡名称错误。或者通信超时。可以使用ifconfig命令检查网卡名称配置是否正确。比如，ifconfig看到当前机器IP对应的网卡名称为enp67s0f5，则可以设置环境变量指定该值。 export GLOO_SOCKET_IFNAME=enp67s0f5

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 常见错误原因和解决方法

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置本代码包中集成了不同模型（包括llama2、llama3、Qwen、Qwen1.5 ......）的训练脚本，并可通过统一的训练脚本一键式运行。训练脚本可判断是否完成预处理后的数据和权重转换的模型。如果未完成，则执行脚本，自动完成数据预处理和权重转换的过程。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明

显存溢出错误 - AI开发平台ModelArts

显存溢出错误在训练过程中，常见显存溢出报错，示例如下： RuntimeError: NPU out of memory. Tried to allocate 1.04 GiB (NPU 4; 60.97 GiB total capacity; 56.45 GiB already

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909） > 常见错误原因和解决方法

ECS获取和上传基础镜像 - AI开发平台ModelArts

ECS获取和上传基础镜像 Step1 创建ECS 下文中介绍如何在ECS中构建一个训练镜像，请参考ECS文档购买一个Linux弹性云服务器。完成网络配置、高级配置等步骤，可根据默认选择，或进行自定义。创建完成后，单击“远程登录”，后续安装Docker等操作均在该ECS上进行。注

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作 > 准备镜像

ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像通过ECS获取和上传基础镜像获取基础镜像后，可通过ECS运行Dockerfile文件，在镜像的基础上构建新镜像。 Step1 构建新ModelArts Standard训练镜像获取模型软件包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。解压A

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作 > 准备镜像

使用kv-cache-int8量化 - AI开发平台ModelArts

使用kv-cache-int8量化 kv-cache-int8是实验特性，在部分场景下性能可能会劣于非量化。当前支持per-tensor静态量化、per-tensor+per-head静态量化以及per-token，支持kv-cache-int8量化和FP16、BF16、AWQ、smoothquant的组合。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化