搜索_华为云

HDFS开源增强特性 - MapReduce服务 MRS

HDFS的现有读写策略主要以数据本地性优先为主，并未考虑节点或磁盘的实际负载情况。HDFS Load Balance功能是基于不同节点的I/O负载情况，在HDFS客户端进行读写操作时，尽可能地选择I/O负载较低的节点进行读写，以此达到I/O负载均衡，以及充分利用集群整体吞吐能力。写文件时，如果开启写文件的HDFS

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

由于使用Colocation进行存储数据的时候，会固定存储在指定的locator所对应的数据节点上面，所以如果不对locator进行规划，会造成数据节点容量不均衡。下面总结了保证数据节点容量均衡的两个主要的使用原则，如表2所示。表2 使用原则编号使用原则说明 1 所有的数据节点在locators中出现的频率一样。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（普通模式） > 开发HDFS应用
配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

由于使用Colocation进行存储数据的时候，会固定存储在指定的locator所对应的数据节点上面，所以如果不对locator进行规划，会造成数据节点容量不均衡。下面总结了保证数据节点容量均衡的两个主要的使用原则，如表2所示。表2 使用原则编号使用原则说明 1 所有的数据节点在locators中出现的频率一样。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式） > 开发HDFS应用
配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

由于使用Colocation进行存储数据的时候，会固定存储在指定的locators所对应的数据节点上面，所以如果不对locator进行规划，会造成数据节点容量不均衡。下面总结了保证数据节点容量均衡的两个主要的使用原则，如表2所示。表2 使用原则编号使用原则说明 1 所有的数据节点在locators中出现的频率一样。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（安全模式） > 开发HDFS应用
配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

由于使用Colocation进行存储数据的时候，会固定存储在指定的locators所对应的数据节点上面，所以如果不对locator进行规划，会造成数据节点容量不均衡。下面总结了保证数据节点容量均衡的两个主要的使用原则，如表2所示。表2 使用原则编号使用原则说明 1 所有的数据节点在locators中出现的频率一样。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（普通模式） > 开发HDFS应用
Hive ORC数据存储优化 - MapReduce服务 MRS

前提条件已登录Hive客户端，具体操作请参见Hive客户端使用实践。操作步骤推荐：使用“SNAPPY”压缩，适用于压缩比和读取效率要求均衡场景。 Create table xx (col_name data_type) stored as orc tblproperties ("orc

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
Consumer初始化成功但是无法从Kafka中获取指定Topic消息 - MapReduce服务 MRS

group)有多个consumer先后启动，就是一个消费者组内有多个consumer同时消费多个partition数据，consumer端也会有负载均衡（consumer个数小于partitions数量时）。 consumer实际上是靠存储在zk中的临时节点来表明针对哪个topic的那个

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
使用ClickHouse客户端 - MapReduce服务 MRS

使用ClickHouse客户端 ClickHouse是面向联机分析处理的列式数据库，支持SQL查询，且查询性能好，特别是基于大宽表的聚合分析查询性能非常优异，比其他分析型数据库速度快一个数量级。前提条件已安装客户端，例如安装目录为“/opt/client”。以下操作的客户端目

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse
集群内ClickHouseServer节点间数据迁移 - MapReduce服务 MRS

他ClickHouseServer节点上相同的表中。在扩容场景中，可以使用该工具将原节点上的部分数据迁移至新增节点上，从而达到扩容后的数据均衡。前提条件 ClickHouse服务运行正常，Zookeeper服务运行正常，迁入、迁出节点的ClickHouseServer实例状态正常。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse运维管理
集群内ClickHouseServer节点间数据迁移 - MapReduce服务 MRS

他ClickHouseServer节点上相同的表中。在扩容场景中，可以使用该工具将原节点上的部分数据迁移至新增节点上，从而达到扩容后的数据均衡。前提条件 ClickHouse服务运行正常，Zookeeper服务运行正常，迁入、迁出节点的ClickHouseServer实例状态正常。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse运维管理
Yarn节点配置调优 - MapReduce服务 MRS

/srv/BigData/yarn/data2/nm/containerlogs。这样数据就会存储在所有设置的目录中，一般会是在不同的设备中。为保证磁盘IO负载均衡，需要提供几个路径且每个路径都对应一个单独的磁盘。应用程序的本地化后的日志目录存在于相对路径/application_%{appid}中

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn性能调优
Yarn节点配置调优 - MapReduce服务 MRS

/srv/BigData/yarn/data2/nm/containerlogs。这样数据就会存储在所有设置的目录中，一般会是在不同的设备中。为保证磁盘IO负载均衡，需要提供几个路径且每个路径都对应一个单独的磁盘。应用程序的本地化后的日志目录存在于相对路径/application_%{appid}中

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn性能调优
Spark SQL ROLLUP和CUBE使用的注意事项 - MapReduce服务 MRS

d1, d2 with rollup”则从业务上无法解释。当前对于语句2所有聚合（sum/avg/max/min）结果均为0。只有在rollup和cube操作中对出现在group by中的字段进行聚合结果才是0，非rollup和cube操作其结果跟预期一致。父主题： SQL和DataFrame

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
Spark SQL ROLLUP和CUBE使用的注意事项 - MapReduce服务 MRS

d1, d2 with rollup”则从业务上无法解释。当前对于语句2所有聚合（sum/avg/max/min）结果均为0。只有在rollup和cube操作中对出现在group by中的字段进行聚合结果才是0，非rollup和cube操作其结果跟预期一致。父主题： SQL和DataFrame

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
如何避免对历史数据进行minor compaction？ - MapReduce服务 MRS

因此这些segments将会被压缩。加载增量负载。配置minor compaction参数的阈值：“compaction.level.threshold” = “6,6”。运行minor compaction。此时只考虑增量负载。父主题： CarbonData常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData常见问题
CarbonData性能调优常见配置参数 - MapReduce服务 MRS

适用于数据查询场景描述 Spark shuffle时启动的Task个数。如何调优一般建议将该参数值设置为执行器核数的1到2倍。例如，在聚合场景中，将task个数从200减少到32，有些查询的性能可提升2倍。表2 设置用于CarbonData查询的Executor个数、CPU核数以及内存大小

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData性能调优
如何避免对历史数据进行minor compaction？ - MapReduce服务 MRS

因此这些segments将会被压缩。加载增量负载。配置minor compaction参数的阈值：“compaction.level.threshold” = “6,6”。运行minor compaction。此时只考虑增量负载。父主题： CarbonData常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData常见问题
CarbonData性能调优常见配置参数 - MapReduce服务 MRS

适用于数据查询场景描述 Spark shuffle时启动的Task个数。如何调优一般建议将该参数值设置为执行器核数的1到2倍。例如，在聚合场景中，将task个数从200减少到32，有些查询的性能可提升2倍。表2 设置用于CarbonData查询的Executor个数、CPU核数以及内存大小

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData性能调优
Spark开源增强特性 - MapReduce服务 MRS

不支持aggregate下推支持的聚合函数为：sum, avg, max, min, count 例如：select count(*) from table 支持聚合函数内部表达式例如：select sum(a+b) from table 支持聚合函数运算，例如：select avg(a)

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
Spark跨源复杂数据的SQL查询优化 - MapReduce服务 MRS

不支持aggregate下推支持的聚合函数为：sum, avg, max, min, count 例如：select count(*) from table 支持聚合函数内部表达式例如：select sum(a+b) from table 支持聚合函数运算，例如：select avg(a)

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x

总条数： 422

上一页
1
...
8
9
10
...
22
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

HDFS开源增强特性 - MapReduce服务 MRS

配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

Hive ORC数据存储优化 - MapReduce服务 MRS

Consumer初始化成功但是无法从Kafka中获取指定Topic消息 - MapReduce服务 MRS

使用ClickHouse客户端 - MapReduce服务 MRS

集群内ClickHouseServer节点间数据迁移 - MapReduce服务 MRS

集群内ClickHouseServer节点间数据迁移 - MapReduce服务 MRS

Yarn节点配置调优 - MapReduce服务 MRS

Yarn节点配置调优 - MapReduce服务 MRS

Spark SQL ROLLUP和CUBE使用的注意事项 - MapReduce服务 MRS

Spark SQL ROLLUP和CUBE使用的注意事项 - MapReduce服务 MRS

如何避免对历史数据进行minor compaction？ - MapReduce服务 MRS

CarbonData性能调优常见配置参数 - MapReduce服务 MRS

如何避免对历史数据进行minor compaction？ - MapReduce服务 MRS

CarbonData性能调优常见配置参数 - MapReduce服务 MRS

Spark开源增强特性 - MapReduce服务 MRS

Spark跨源复杂数据的SQL查询优化 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线