搜索_华为云

Hive ORC数据存储优化 - MapReduce服务 MRS

Hive ORC数据存储优化操作场景 “ORC”是一种高效的列存储格式，在压缩比和读取效率上优于其他文件格式。建议使用“ORC”作为Hive表默认的存储格式。前提条件已登录Hive客户端，具体操作请参见Hive客户端使用实践。操作步骤推荐：使用“SNAPPY”压缩，适用于压缩比和读取效率要求均衡场景。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
Flink性能调优建议 - MapReduce服务 MRS

Group的情况下，一个SubTask是部署在一个slot上的。即使开启了Slot Sharing Group，大部分情况下Slot中拥有的SubTask也是负载均衡的。所以可以理解为TM上的Slot个数代表了上面运行的任务线程数。合理的Slots数量应该和CPU核数相同，在使用超线程时，每个Slot将占用2个或更多的硬件线程。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink性能调优开发规范
配置ClickHouse冷热分离 - MapReduce服务 MRS

创建普通账号委托并绑定集群 ClickHouse集群添加OBS磁盘信息配置磁盘存储策略自定义冷热分离数据存储策略导入数据ClickHouse测试验证原理介绍 OBS对象存储是支持海量数据存储，并提供安全可靠的、低成本的分布式存储服务，ClickHouse基于OBS的优势构建冷热分离存储架构

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse企业级能力增强
集群内ClickHouseServer节点间数据迁移 - MapReduce服务 MRS

集群内ClickHouseServer节点间数据迁移 ClickHouse数据迁移工具可以将某几个ClickHouseServer实例节点上的一个或多个MergeTree引擎分区表的部分分区迁移至其他ClickHouseServer节点上相同的表中。在扩容场景中，可以使用该工具将

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse运维管理
集群在线扩缩容 - MapReduce服务 MRS

集群在线扩缩容大数据集群的处理能力通常可以通过增加集群的节点数来横向扩展，当集群规模不符合业务要求时，用户可以通过该功能进行集群节点规模的调整，进行扩容或者缩容；在缩容节点时，MRS会智能地选择负载最少或者迁移数据量最小节点，并且在缩容过程中，缩容节点不再接收新的任务，正在执行

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能 > 集群管理
集群内ClickHouseServer节点间数据迁移 - MapReduce服务 MRS

集群内ClickHouseServer节点间数据迁移 ClickHouse数据迁移工具可以将某几个ClickHouseServer实例节点上的一个或多个MergeTree引擎分区表的部分分区迁移至其他ClickHouseServer节点上相同的表中。在扩容场景中，可以使用该工具将

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse运维管理
什么是MapReduce服务 - MapReduce服务 MRS

如果您是首次使用MRS的用户，建议您学习并了解如下信息：基础知识了解通过MRS组件介绍和产品功能章节的内容，了解MRS相关的基础知识，包含MRS各组件的基本原理和增强特性介绍，以及MRS服务的特有概念和功能的详细介绍。入门使用您可以参考《快速入门》学习并上手使用MRS。《快速入门》提供了样例的

 帮助中心 > MapReduce服务 MRS > 产品介绍
Spark2x多租户 - MapReduce服务 MRS
Spark2x多租户 - MapReduce服务 MRS

租户可以配置不同的YARN队列，从而达到资源隔离，且JDBCServer根据需求动态启动，可避免浪费资源。实现方案多租户模式的HA方案原理如图1所示。图1 Spark JDBCServer多租户 ProxyServer在启动时，向ZooKeeper注册自身消息，在指定目录中

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x
HBase开源增强特性 - MapReduce服务 MRS

效地获取到所需要的数据。在实际应用中，很多场景是查询某一个列值为“XXX”的数据。HBase提供了Filter特性去支持这样的查询，它的原理是：按照RowKey的顺序，去遍历所有可能的数据，再依次去匹配那一列的值，直到获取到所需要的数据。可以看出，可能只是为了获取一行数据，它却

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HBase
执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

执行大数据量的shuffle过程时Executor注册shuffle service失败问题执行超过50T数据的shuffle过程时，出现部分Executor注册shuffle service超时然后丢失从而导致任务失败的问题。错误日志如下所示： 2016-10-19 01:33:34

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
Flink Job Pipeline增强 - MapReduce服务 MRS

Job发送数据。这种发送数据的流图称为Job Pipeline，如图1所示。图1 Job Pipeline流图 Job Pipeline原理介绍图2 Job Pipeline NettySink和NettySource Pipeline中上下游Job是直接通过Netty进行通

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flink
配置HDFS文件目录标签策略（NodeLabel） - MapReduce服务 MRS

-setLabelExpression -expression 'LabelB[fallback=NONE]' -path /Spark命令，给Spark目录设置表达式。在“/Spark”目录下文件对应的数据块副本只能放置到LabelB标签上的节点，如DN5、DN6、DN7、DN8。设置数据节点的标签参考配置描述。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

执行大数据量的shuffle过程时Executor注册shuffle service失败问题执行超过50T数据的shuffle过程时，出现部分Executor注册shuffle service超时然后丢失从而导致任务失败的问题。错误日志如下所示： 2016-10-19 01:33:34

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
Doris建表规范 - MapReduce服务 MRS
Doris建表规范 - MapReduce服务 MRS

Doris建表规范该章节主要介绍创建Doris表时需遵循的规则和建议。 Doris建表规则在创建Doris表指定分桶buckets时，每个桶的数据大小应保持在100MB~3GB之间，单分区中最大分桶数量不超过5000。表数据超过5亿条以上必须设置分区分桶策略。表的分桶列不

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Doris应用开发规范
配置HDFS文件目录标签策略（NodeLabel） - MapReduce服务 MRS

-setLabelExpression -expression 'LabelB[fallback=NONE]' -path /Spark命令，给Spark目录设置表达式。在“/Spark”目录下文件对应的数据块副本只能放置到LabelB标签上的节点，如DN5、DN6、DN7、DN8。设置数据节点的标签参考配置描述。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
降低MapReduce客户端运行任务失败率 - MapReduce服务 MRS

降低MapReduce客户端运行任务失败率配置场景当网络不稳定或者集群IO、CPU负载过高的情况下，通过调整如下参数值，降低客户端应用的失败率，保证应用的正常运行。配置描述在客户端的“mapred-site.xml”配置文件中调整如下参数。 “mapred-site.xm

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce性能调优
提升HBase Put和Scan数据性能 - MapReduce服务 MRS

提升HBase Put和Scan数据性能操作场景 HBase有很多与读写性能相关的配置参数。读写请求负载不同的情况下，配置参数需要进行相应的调整，本章节旨在指导用户通过修改RegionServer配置参数进行读写性能调优。操作步骤登录FusionInsight Manager界面，选择“集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase性能调优
配置HDFS快速关闭文件功能 - MapReduce服务 MRS

配置HDFS快速关闭文件功能操作场景默认情况下关闭HDFS文件时需要等待所有的Block都上报成功（处于COMPLETED状态）。因此HDFS的一部分写性能消耗为等待DataNode块上报以及NameNode处理块上报。对于一个负载较大的集群，等待的消耗对集群影响较大。HDF

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS企业级能力增强
HBase如何关闭HDFS多路读功能 - MapReduce服务 MRS

HBase如何关闭HDFS多路读功能现象描述 MRS 3.3.1及之后版本，HBase默认适配开启HDFS多路读功能（HDFS多路读相关介绍请参见配置HDFS多路读）以降低读取延迟及适应网络变化，相关参数如表1所示。表1 HBase适配HDFS多路读相关参数参数名称参数描述

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase常见问题
Spark应用开发建议 - MapReduce服务 MRS

ort两个操作同时进行，比先shuffle再sort来说，性能可能是要高的。使用foreachPartitions替代foreach。原理类似于“使用mapPartitions替代map”，也是一次函数调用处理一个partition的所有数据，而不是一次函数调用处理一条数据

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Spark应用开发规范

总条数： 327

上一页
1
...
8
9
10
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hive ORC数据存储优化 - MapReduce服务 MRS

Flink性能调优建议 - MapReduce服务 MRS

配置ClickHouse冷热分离 - MapReduce服务 MRS

集群内ClickHouseServer节点间数据迁移 - MapReduce服务 MRS

集群在线扩缩容 - MapReduce服务 MRS

集群内ClickHouseServer节点间数据迁移 - MapReduce服务 MRS

什么是MapReduce服务 - MapReduce服务 MRS

Spark2x多租户 - MapReduce服务 MRS

HBase开源增强特性 - MapReduce服务 MRS

执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

Flink Job Pipeline增强 - MapReduce服务 MRS

配置HDFS文件目录标签策略（NodeLabel） - MapReduce服务 MRS

执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

Doris建表规范 - MapReduce服务 MRS

配置HDFS文件目录标签策略（NodeLabel） - MapReduce服务 MRS

降低MapReduce客户端运行任务失败率 - MapReduce服务 MRS

提升HBase Put和Scan数据性能 - MapReduce服务 MRS

配置HDFS快速关闭文件功能 - MapReduce服务 MRS

HBase如何关闭HDFS多路读功能 - MapReduce服务 MRS

Spark应用开发建议 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线