搜索_华为云

配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

配置使用分布式缓存执行MapReduce任务配置场景本章节操作适用于MRS 3.x及之后版本。分布式缓存在两种情况下非常有用。滚动升级在升级过程中，应用程序必须保持文字内容（jar文件或配置文件）不变。而这些内容并非基于当前版本的Yarn，而是要基于其提交时的版本。一般情况下，应用程序（例如MapRedu

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce
HDFS文件系统目录简介 - MapReduce服务 MRS

taging目录下文件否 MR任务日志丢失 /tmp/hadoop-yarn/staging/history/done 固定目录周期性扫描线程定期将done_intermediate的日志文件转移到done目录否 MR任务日志丢失 /tmp/mr-history 固定目录存储预加载历史记录文件的路径

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
启用/禁用HBase二级索引 - MapReduce服务 MRS

sExample方法中。 enableIndices ():启用指定的索引（索引状态将从INACTIVE变为ACTIVE状态），因此可用于扫描索引。 public void enableIndicesExample() { LOG.info("Entering Enabling

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > 开发HBase应用
Impala应用开发规则 - MapReduce服务 MRS

建表时分区不要超过10万个，分区太多会影响元数据加载速度，阻塞查询 Impala元数据和分区、文件数量正相关，太多分区会导致Impala元数据占用内存过大，刷新元数据时需要扫描的分区文件就越多，极大地降低查询效率。建表时整数类型的分区键不补前置0，例如'hour=01'等分区整数类型分区使用补齐前缀0的方式，

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Impala应用开发规范
提升HBase实时写数据效率 - MapReduce服务 MRS

对于可以压缩的数据，配置压缩算法可以有效减少磁盘的IO，从而达到提高性能的目的。说明：并非所有数据都可以进行有效压缩。例如一张图片的数据，因为图片一般已经是压缩后的数据，所以压缩效果有限。常用的压缩算法是SNAPPY，因为它有较好的Encoding/Decoding速度和可以接受的压缩率。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase性能调优
提升HBase实时写数据效率 - MapReduce服务 MRS

对于可以压缩的数据，配置压缩算法可以有效减少磁盘的IO，从而达到提高性能的目的。说明：并非所有数据都可以进行有效压缩。例如一张图片的数据，因为图片一般已经是压缩后的数据，所以压缩效果有限。常用的压缩算法是SNAPPY，因为它有较好的Encoding/Decoding速度和可以接受的压缩率。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase性能调优
Kafka数据消费概述 - MapReduce服务 MRS

息发布-订阅系统，它提供了类似于JMS的特性，但在设计上完全不同，它具有消息持久化、高吞吐、分布式、多客户端支持、实时等特性，适用于离线和在线的消息消费，如常规的消息收集、网站活性跟踪、聚合统计系统运营数据（监控数据）、日志收集等大量数据的互联网服务的数据收集场景。 Kafka结构

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kafka
Hive使用WHERE条件查询超过3.2万分区的表报错 - MapReduce服务 MRS

execute(QueryExecutorImpl.java:346) 回答：带有分区条件的查询，Hiveserver会对分区进行优化，避免全表扫描，需要查询元数据符合条件的所有分区。而gaussDB中提供的接口sendOneQuery，调用的sendParse方法中对参数的限制为3

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive常见问题
停止运行的RegionServer，在HMaster WebUI中显示的“Dead Region Servers”信息什么时候会被清除掉 - MapReduce服务 MRS

在HMaster Web UI中显示处于“Dead Region Servers”状态的RegionServer什么时候会被清除掉？回答当一个在线的RegionServer突然运行停止，会在HMaster Web UI中显示处于“Dead Region Servers”状态。当停止运

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase常见问题
什么是MapReduce服务 - MapReduce服务 MRS

能大数据存储方案，以一份数据同时支持多种应用场景，并通过多级索引、字典编码、预聚合、动态Partition、准实时数据查询等特性提升了IO扫描和计算性能，实现万亿数据分析秒级响应。同时MRS支持自研增强型调度器Superior，突破单集群规模瓶颈，单集群调度能力超10000节点。

帮助中心 > MapReduce服务 MRS > 产品介绍
Hive使用WHERE条件查询超过3.2万分区的表报错 - MapReduce服务 MRS

execute(QueryExecutorImpl.java:346) 回答带有分区条件的查询，Hiveserver会对分区进行优化。避免全表扫描，需要查询元数据符合条件的所有分区。而gaussDB中提供的接口sendOneQuery，调用的sendParse方法中对参数的限制为32767。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive常见问题
Kafka基本原理 - MapReduce服务 MRS
Kafka基本原理 - MapReduce服务 MRS

息发布-订阅系统，它提供了类似于JMS的特性，但在设计上完全不同，它具有消息持久化、高吞吐、分布式、多客户端支持、实时等特性，适用于离线和在线的消息消费，如常规的消息收集、网站活性跟踪、聚合统计系统运营数据（监控数据）、日志收集等大量数据的互联网服务的数据收集场景。 Kafka结构

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Kafka
优化小文件场景下的Spark SQL性能 - MapReduce服务 MRS

单位：byte。 134217728（即128M） spark.files.openCostInBytes 打开文件的预估成本，按照同一时间能够扫描的字节数来测量。当一个分区写入多个文件时使用。高估更好，这样小文件分区将比大文件分区更先被调度。 4M 父主题： Spark SQL性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
添加HBase数据源 - MapReduce服务 MRS

Key封装成一个List<Get>，然后请求这个列表以获取数据的查询方式。该方式能避免每个Row Key都发起一次请求。 HBase单表查询范围扫描优化 HBase单表查询范围扫描优化是指根据HBase的列的谓词条件尝试自动推断rowkey的起止地址，在tableScan的时候设置hbase scan起止地址从而提高访问性能。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
停止运行的RegionServer，在HMaster WebUI中显示的“Dead Region Servers”信息什么时候会被清除掉 - MapReduce服务 MRS

在HMaster Web UI中显示处于“Dead Region Servers”状态的RegionServer什么时候会被清除掉？回答当一个在线的RegionServer突然运行停止，会在HMaster Web UI中显示处于“Dead Region Servers”状态。当停止运

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase常见问题
运行MapReduce作业 - MapReduce服务 MRS

作业。 MapReduce作业用于提交Hadoop jar程序快速并行处理大量数据，是一种分布式数据处理模式。用户可以在MRS管理控制台在线创建一个作业并提交运行，也可以通过MRS集群客户端来以命令行形式提交作业。前提条件用户已经将作业所需的程序包和数据文件上传至OBS或HDFS文件系统中。

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
运行SparkSql作业 - MapReduce服务 MRS

SparkSql作业用于查询和分析数据，包括SQL语句和Script脚本两种形式，如果SQL语句涉及敏感信息，也可使用脚本文件方式提交。用户可以在MRS管理控制台在线创建一个作业并提交运行，也可以通过MRS集群客户端来以命令行形式提交作业。操作视频本视频以在MRS集群的管理控制台上提交并查看SparkSql作业为例进行说明。

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

配置HDFS DiskBalancer磁盘均衡配置场景 DiskBalancer是一个在线磁盘均衡器，旨在根据各种指标重新平衡正在运行的DataNode上的磁盘数据。工作方式与HDFS的Balancer工具类似。不同的是，HDFS Balancer工具用于DataNode节点间的数据均衡，而HDFS

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
运行HiveSql作业 - MapReduce服务 MRS

SQL语句和SQL脚本文件查询和分析数据，包括SQL语句和Script脚本两种形式，如果SQL语句中涉及敏感信息，也可使用脚本文件方式提交。用户可以在MRS管理控制台在线创建一个作业并提交运行，也可以通过MRS集群客户端来以命令行形式提交作业。前提条件用户已经将作业所需的程序包和数据文件上传至OBS或HDFS文件系统中。

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
运行Flink作业 - MapReduce服务 MRS
运行Flink作业 - MapReduce服务 MRS

取结果，本章节指导您如何在MRS集群中提交一个Flink作业。 Flink作业用于提交jar程序处理流式数据。用户可以在MRS管理控制台在线创建一个作业并提交运行，也可以通过MRS集群客户端来以命令行形式提交作业。操作视频本视频以在未开启Kerberos认证的MRS 3.1

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业

总条数： 247

上一页
1
2
3
4
5
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

HDFS文件系统目录简介 - MapReduce服务 MRS

启用/禁用HBase二级索引 - MapReduce服务 MRS

Impala应用开发规则 - MapReduce服务 MRS

提升HBase实时写数据效率 - MapReduce服务 MRS

提升HBase实时写数据效率 - MapReduce服务 MRS

Kafka数据消费概述 - MapReduce服务 MRS

Hive使用WHERE条件查询超过3.2万分区的表报错 - MapReduce服务 MRS

停止运行的RegionServer，在HMaster WebUI中显示的“Dead Region Servers”信息什么时候会被清除掉 - MapReduce服务 MRS

什么是MapReduce服务 - MapReduce服务 MRS

Hive使用WHERE条件查询超过3.2万分区的表报错 - MapReduce服务 MRS

Kafka基本原理 - MapReduce服务 MRS

优化小文件场景下的Spark SQL性能 - MapReduce服务 MRS

添加HBase数据源 - MapReduce服务 MRS

停止运行的RegionServer，在HMaster WebUI中显示的“Dead Region Servers”信息什么时候会被清除掉 - MapReduce服务 MRS

运行MapReduce作业 - MapReduce服务 MRS

运行SparkSql作业 - MapReduce服务 MRS

配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

运行HiveSql作业 - MapReduce服务 MRS

运行Flink作业 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线