搜索_华为云

HDFS开源增强特性 - MapReduce服务 MRS

HDFS开源增强特性 HDFS开源增强特性：文件块同分布（Colocation）离线数据汇总统计场景中，Join是一个经常用到的计算功能，在MapReduce中的实现方式大体如下： Map任务分别将两个表文件的记录处理成（Join Key，Value），然后按照Join Key做

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
集群在线扩缩容 - MapReduce服务 MRS

集群在线扩缩容大数据集群的处理能力通常可以通过增加集群的节点数来横向扩展，当集群规模不符合业务要求时，用户可以通过该功能进行集群节点规模的调整，进行扩容或者缩容；在缩容节点时，MRS会智能地选择负载最少或者迁移数据量最小节点，并且在缩容过程中，缩容节点不再接收新的任务，正在执行的任务继续执行

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能 > 集群管理
执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

执行大数据量的shuffle过程时Executor注册shuffle service失败问题执行超过50T数据的shuffle过程时，出现部分Executor注册shuffle service超时然后丢失从而导致任务失败的问题。错误日志如下所示： 2016-10-19 01:33

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

执行大数据量的shuffle过程时Executor注册shuffle service失败问题执行超过50T数据的shuffle过程时，出现部分Executor注册shuffle service超时然后丢失从而导致任务失败的问题。错误日志如下所示： 2016-10-19 01:33

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
Doris建表规范 - MapReduce服务 MRS
Doris建表规范 - MapReduce服务 MRS

Doris建表规范该章节主要介绍创建Doris表时需遵循的规则和建议。 Doris建表规则在创建Doris表指定分桶buckets时，每个桶的数据大小应保持在100MB~3GB之间，单分区中最大分桶数量不超过5000。表数据超过5亿条以上必须设置分区分桶策略。表的分桶列不要设置太多

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Doris应用开发规范
HyperLogLog函数 - MapReduce服务 MRS
HyperLogLog函数 - MapReduce服务 MRS

HyperLogLog函数 HetuEngine使用HyperLogLog数据结构实现rox_distinct（）函数。数据结构 HyperLogLog（hll）是一种统计基数的算法。它实际上不会存储每个元素出现的次数，它使用的是概率算法，通过存储元素的32位hash值的第一个1

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
Storm日志介绍 - MapReduce服务 MRS
Storm日志介绍 - MapReduce服务 MRS

Storm日志介绍本章节内容适用于MRS 3.x及后续版本。日志描述日志路径：Storm相关日志的默认存储路径为“/var/log/Bigdata/storm/角色名”（运行日志），“/var/log/Bigdata/audit/storm/角色名”（审计日志）。 Nimbus

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Storm
HBase如何关闭HDFS多路读功能 - MapReduce服务 MRS

HBase如何关闭HDFS多路读功能现象描述 MRS 3.3.1及之后版本，HBase默认适配开启HDFS多路读功能（HDFS多路读相关介绍请参见配置HDFS多路读）以降低读取延迟及适应网络变化，相关参数如表1所示。表1 HBase适配HDFS多路读相关参数参数名称参数描述

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase常见问题
提升HBase Put和Scan数据性能 - MapReduce服务 MRS

提升HBase Put和Scan数据性能操作场景 HBase有很多与读写性能相关的配置参数。读写请求负载不同的情况下，配置参数需要进行相应的调整，本章节旨在指导用户通过修改RegionServer配置参数进行读写性能调优。操作步骤登录FusionInsight Manager

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase性能调优
配置HDFS快速关闭文件功能 - MapReduce服务 MRS

配置HDFS快速关闭文件功能操作场景默认情况下关闭HDFS文件时需要等待所有的Block都上报成功（处于COMPLETED状态）。因此HDFS的一部分写性能消耗为等待DataNode块上报以及NameNode处理块上报。对于一个负载较大的集群，等待的消耗对集群影响较大。HDFS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS企业级能力增强
ClickHouse开源增强特性 - MapReduce服务 MRS

ClickHouse开源增强特性 MRS ClickHouse具备“手动挡”集群模式升级、平滑弹性扩容、高可用HA部署架构等优势能力，具体详情如下：手动挡集群模式升级如图1所示，多个ClickHouse节点组成的集群，没有中心节点，更多的是一个静态资源池的概念，业务要使用ClickHouse

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > ClickHouse
降低MapReduce客户端运行任务失败率 - MapReduce服务 MRS

降低MapReduce客户端运行任务失败率配置场景当网络不稳定或者集群IO、CPU负载过高的情况下，通过调整如下参数值，降低客户端应用的失败率，保证应用的正常运行。配置描述在客户端的“mapred-site.xml”配置文件中调整如下参数。 “mapred-site.xml

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce性能调优
降低MapReduce客户端运行任务失败率 - MapReduce服务 MRS

降低MapReduce客户端运行任务失败率配置场景当网络不稳定或者集群IO、CPU负载过高的情况下，通过调整如下参数值，降低客户端应用的失败率，保证应用的正常运行。配置描述在客户端的“mapred-site.xml”配置文件中调整如下参数。 “mapred-site.xml

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce > MapReduce性能调优
提升HBase Put和Scan性能综合调优 - MapReduce服务 MRS

提升HBase Put和Scan性能综合调优操作场景 HBase有很多与读写性能相关的配置参数。读写请求负载不同的情况下，配置参数需要进行相应的调整，本章节旨在指导用户通过修改RegionServer配置参数进行读写性能调优。本章节适用于MRS 3.x及之后版本。操作步骤登录

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase性能调优
MRS集群Task节点弹性伸缩概述 - MapReduce服务 MRS

MRS集群Task节点弹性伸缩概述在大数据应用，尤其是实时分析处理数据的场景中，常常需要根据数据量的变化动态调整集群节点数量以增减资源。 MRS当前支持配置弹性伸缩规则、资源计划、自动化脚本来调整Task节点数量。弹性伸缩规则：根据集群实时负载指标对Task节点数量进行调整，数据量变化后触发扩缩容

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群容量调整 > MRS集群Task节点弹性伸缩
Kudu - MapReduce服务 MRS
Kudu - MapReduce服务 MRS

Kudu Kudu是专为Apache Hadoop平台开发的列式存储管理器，具有Hadoop生态系统应用程序的共同技术特性：在通用的商用硬件上运行，可水平扩展，提供高可用性。 Kudu的设计具有以下优点：能够快速处理OLAP工作负载支持与MapReduce，Spark和其他Hadoop

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
Kudu应用开发简介 - MapReduce服务 MRS

Kudu应用开发简介 Kudu简介 Kudu是专为Apache Hadoop平台开发的列式存储管理器，具有Hadoop生态系统应用程序的共同技术特性：在通用的商用硬件上运行，可水平扩展，提供高可用性。 Kudu的设计具有以下优点：能够快速处理OLAP工作负载。支持与MapReduce

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kudu开发指南（安全模式） > Kudu应用开发概述
Kudu应用开发简介 - MapReduce服务 MRS

Kudu应用开发简介 Kudu简介 Kudu是专为Apache Hadoop平台开发的列式存储管理器，具有Hadoop生态系统应用程序的共同技术特性：在通用的商用硬件上运行，可水平扩展，提供高可用性。 Kudu的设计具有以下优点：能够快速处理OLAP工作负载。支持与MapReduce

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kudu开发指南（普通模式） > Kudu应用开发概述
Storm常用参数 - MapReduce服务 MRS
Storm常用参数 - MapReduce服务 MRS

Storm常用参数本章节内容适用于MRS 3.x及后续版本。参数入口参数入口，请参考修改集群服务配置参数。参数说明表1 参数说明配置参数说明默认值 supervisor.slots.ports supervisor上能够运行workers的端口列表。每个worker

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Storm
Doris基本原理 - MapReduce服务 MRS
Doris基本原理 - MapReduce服务 MRS

Doris基本原理 Doris简介 Doris是一个基于MPP架构的高性能、实时的分析型数据库，以极速易用的特点被人们所熟知，仅需亚秒级响应时间即可返回海量数据下的查询结果，不仅可以支持高并发的点查询场景，也能支持高吞吐的复杂分析场景。基于此，Apache Doris能够较好的满足报表分析

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Doris

总条数： 303

上一页
1
...
4
5
6
...
16
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消