搜索_华为云

Spark SQL性能调优 - MapReduce服务 MRS

优化数据倾斜场景下的Spark SQL性能优化小文件场景下的Spark SQL性能 Spark INSERT SELECT语句调优配置多并发客户端连接JDBCServer 配置SparkSQL的分块个数 Spark动态分区插入场景内存优化小文件优化聚合算法优化 Datasource表优化

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
使用FineBI访问MRS HetuEngine - MapReduce服务 MRS

FineBI是一款商业智能产品，针对企业信息化遇到的困难，为企业提供专业的商业智能解决方案。本章节以FineBI 5.1.9版本为例，讲解如何使用FineBI访问安全模式MRS集群的HetuEngine。方案架构出于管理和信息收集的需要，企业内部会存储海量数据，包括数目众多的各种数据库、数据仓库等，此时会面

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
10亿级数据量场景的解决方案有哪些？ - MapReduce服务 MRS

10亿级数据量场景的解决方案有哪些？问： 10亿级数据量场景的解决方案有哪些？答：有数据更新、联机事务处理OLTP、复杂分析的场景，建议使用云数据库 GaussDB(for MySQL)。 MRS的Impala + Kudu也能满足该场景，Impala + Kudu可以在j

帮助中心 > MapReduce服务 MRS > 常见问题 > 产品咨询类
HBase开源增强特性 - MapReduce服务 MRS

很难解决的问题：如果把海量小文件直接保存在HDFS中，会给NameNode带来极大的压力。由于HBase接口以及内部机制的原因，一些较大的文件也不适合直接保存到HBase中。 HFS的出现，就是为了解决需要在Hadoop中存储海量小文件，同时也要存储一些大文件的混合的场景。简

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HBase
compaction&cleaning配置 - MapReduce服务 MRS

置为0，会关闭此功能。由于批处理中分区中插入记录的数量众多，总会出现小文件。Hudi提供了一个选项，可以通过将对该分区中的插入作为对现有小文件的更新来解决小文件的问题。此处的大小是被视为“小文件大小”的最小文件大小。 104857600 byte hoodie.copyonwrite

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见配置参数
HDFS常见问题 - MapReduce服务 MRS
HDFS常见问题 - MapReduce服务 MRS

为什么DataNode无法正常上报数据块是否可以手动调整DataNode数据存储目录 DataNode的容量计算出错如何处理为什么存储小文件过程中，缓存中的数据会丢失当分级存储策略为LAZY_PERSIST时为什么文件的副本的存储类型为DISK 为什么NameNode UI上显示有一些块缺失

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
Spark SQL性能调优 - MapReduce服务 MRS

Spark SQL join优化优化数据倾斜场景下的Spark SQL性能优化小文件场景下的Spark SQL性能 Spark INSERT SELECT语句调优动态分区插入场景内存优化小文件优化聚合算法优化 Datasource表优化合并CBO优化多级嵌套子查询以及混合Join的SQL调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）
HDFS常见问题 - MapReduce服务 MRS
HDFS常见问题 - MapReduce服务 MRS

为什么DataNode无法正常上报数据块是否可以手动调整DataNode数据存储目录 DataNode的容量计算出错如何处理为什么存储小文件过程中，缓存中的数据会丢失当分级存储策略为LAZY_PERSIST时为什么文件的副本的存储类型为DISK 为什么NameNode UI上显示有一些块缺失

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
Spark Core企业级能力增强 - MapReduce服务 MRS

Native引擎配置Spark事件队列大小配置parquet表的压缩格式使用Ranger时适配第三方JDK 配置Spark小文件自动合并使用Spark小文件合并工具说明配置流式读取Spark Driver执行结果配置Spark Executor退出时执行自定义代码配置Spark动态脱敏

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
使用Hadoop客户端删除OBS上数据时报.Trash目录没有权限错误 - MapReduce服务 MRS

hadoop删除文件时会将文件先移动到.Trash目录，若该目录没有权限则出现403报错。解决方法方案一：使用hadoop fs -rm -skipTrash命令来删除文件。方案二：在集群对应的委托中添加访问.Trash目录的权限。在集群“概览”页签中，查询并记录集群所绑定的委托名称。

帮助中心 > MapReduce服务 MRS > 故障排除 > 存算分离类
ALM-12051 磁盘Inode使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响文件系统无法正常写入。可能原因磁盘小文件过多。系统环境异常。处理步骤磁盘小文件过多。登录MRS集群详情页面，选择“告警管理”。在实时告警列表中，单击此告警。在“告警详情”区域，获取告警所在主机地址和磁盘分区。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
MRS组件应用开发简介 - MapReduce服务 MRS

MRS组件应用开发简介 MRS是企业级大数据存储、查询、分析的统一平台，能够帮助企业快速构建海量数据信息处理系统，通过对海量信息数据的分析挖掘，发现全新价值点和企业商机。 MRS提供了各组件的常见业务场景样例程序，开发者用户可基于样例工程进行相关数据应用的开发与编译，样例工程依赖

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版）
Presto - MapReduce服务 MRS
Presto - MapReduce服务 MRS

式分析查询。其主要应用于海量结构化数据/半结构化数据分析、海量多维数据聚合/报表、ETL、Ad-Hoc查询等场景。 Presto允许查询的数据源包括Hadoop分布式文件系统（HDFS），Hive，HBase，Cassandra，关系数据库甚至专有数据存储。一个Presto查询可

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
ARM环境python pipeline运行报139错误码规避方案 - MapReduce服务 MRS

so，而使用系统自带的libssl.so（因为hadoop native目录没有带该包）。由于这两个库版本不匹配，导致了python文件运行时出现段错误。解决方案方案一：修改Spark2x客户端conf目录下spark-default.conf文件，清空（直接赋值为空）配置项spark.driver

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
ARM环境python pipeline运行报139错误码规避方案 - MapReduce服务 MRS

so，而使用系统自带的libssl.so（因为hadoop native目录没有带该包）。由于这两个库版本不匹配，导致了python文件运行时出现段错误。解决方案方案一：修改Spark2x客户端conf目录下spark-default.conf文件，清空（直接赋值为空）配置项spark.driver

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
ALM-12051 磁盘Inode使用率超过阈值 - MapReduce服务 MRS

对系统的影响业务失败：文件系统无法正常写入时，如果需要修改或使用该磁盘上的数据，可能会导致作业运行失败。可能原因磁盘写入的小文件过多。处理步骤磁盘写入的小文件过多。打开FusionInsight Manager页面，选择“运维 > 告警 > 告警”，单击此告警所在行的，获取告警所在主机地址和磁盘分区。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
HDFS应用开发简介 - MapReduce服务 MRS

API接口介绍。常用概念 Colocation 同分布（Colocation）功能是将存在关联关系的数据或可能要进行关联操作的数据存储在相同的存储节点上。HDFS文件同分布的特性是，将那些需进行关联操作的文件存放在相同的数据节点上，在进行关联操作计算时，避免了到别的数据节点上获

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（安全模式）
通过Flume采集指定目录日志系统文件至HDFS - MapReduce服务 MRS

通过Flume采集指定目录日志系统文件至HDFS 应用场景 Flume是一个分布式、可靠和高可用的海量日志聚合的系统。它能够将不同数据源的海量日志数据进行高效收集、聚合、移动，最后存储到一个中心化数据存储系统中。支持在系统中定制各类数据发送方，用于收集数据。同时，提供对数据进行简单处理，并写到各种数据接受方（可定制）的能力。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
CarbonData性能调优常见配置参数 - MapReduce服务 MRS

设置用于CarbonData查询的Executor个数、CPU核数以及内存大小。如何调优在银行方案中，为每个执行器提供4个CPU内核和15GB内存，可以获得良好的性能。这2个值并不意味着越多越好，在资源有限的情况下，需要正确配置。例如，在银行方案中，每个节点有足够的32个CPU核，而只有64GB的内存，这个内

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData性能调优
Doris数据导入规范 - MapReduce服务 MRS

Connector方式。在Flink实时写入数据到Doris的场景下，CheckPoint设置的时间需要考虑每批次数据量，如果每批次数据太小会造成大量小文件，推荐值为60s。建议不使用insert values作为数据写入的主要方式，批量数据导入推荐使用StreamLoad、BrokerLoad或SparkLoad。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Doris应用开发规范

总条数： 3174

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark SQL性能调优 - MapReduce服务 MRS

使用FineBI访问MRS HetuEngine - MapReduce服务 MRS

10亿级数据量场景的解决方案有哪些？ - MapReduce服务 MRS

HBase开源增强特性 - MapReduce服务 MRS

compaction&cleaning配置 - MapReduce服务 MRS

HDFS常见问题 - MapReduce服务 MRS

Spark SQL性能调优 - MapReduce服务 MRS

HDFS常见问题 - MapReduce服务 MRS

Spark Core企业级能力增强 - MapReduce服务 MRS

使用Hadoop客户端删除OBS上数据时报.Trash目录没有权限错误 - MapReduce服务 MRS

ALM-12051 磁盘Inode使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

MRS组件应用开发简介 - MapReduce服务 MRS

Presto - MapReduce服务 MRS

ARM环境python pipeline运行报139错误码规避方案 - MapReduce服务 MRS

ARM环境python pipeline运行报139错误码规避方案 - MapReduce服务 MRS

ALM-12051 磁盘Inode使用率超过阈值 - MapReduce服务 MRS

HDFS应用开发简介 - MapReduce服务 MRS

通过Flume采集指定目录日志系统文件至HDFS - MapReduce服务 MRS

CarbonData性能调优常见配置参数 - MapReduce服务 MRS

Doris数据导入规范 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线