搜索_华为云

配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

的统计信息，结合算子的输入数据集来估计每个算子的输出条数以及字节大小，这些就是执行一个算子的代价。 CBO会调整执行计划，来最小化端到端的查询时间，中心思路2点：尽早过滤不相关的数据。最小化每个算子的代价。 CBO优化过程分为2步：收集统计信息。根据输入的数据集估算特定算子的输出数据集。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

的统计信息，结合算子的输入数据集来估计每个算子的输出条数以及字节大小，这些就是执行一个算子的代价。 CBO会调整执行计划，来最小化端到端的查询时间，中心思路2点：尽早过滤不相关的数据。最小化每个算子的代价。 CBO优化过程分为2步：收集统计信息。根据输入的数据集估算特定算子的输出数据集。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
使用Spark BulkLoad工具同步数据到HBase表中 - MapReduce服务 MRS

--rowkey-columns <arg> 指定源表中组成HBase Rowkey的列，如果有多个列，请使用逗号分隔。 SQL错误导致查询异常、查询数据为空、数据重复都会导致Spark BulkLoad任务执行失败，请保证SQL的正确性，以及Rowkey字段对应的数据组合不会出现重复。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强
Java样例代码 - MapReduce服务 MRS
Java样例代码 - MapReduce服务 MRS

resultDataBuffer[i];//hbase2 row if (!resultData.isEmpty()) { // 查询hbase1Value String hbase1Value = ""; Iterator<Cell>

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > 从HBase读取数据再写入HBase
CarbonData数据类型概述 - MapReduce服务 MRS

范围A到Z&a到z&0到9 Boolean 范围true或者false Decimal 默认值是(10,0) ，最大值是(38,38) 说明：当进行带过滤条件的查询时，为了得到准确的结果，需要在数字后面加上BD。例如，select * from carbon_table where num = 1234567890123456

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本）
Scala样例代码 - MapReduce服务 MRS
Scala样例代码 - MapReduce服务 MRS

resultDataBuffer(i) //hbase2 row if (!resultData.isEmpty) { // 查询hbase1Value var hbase1Value = "" val it = iteratorArray(i)

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > 从HBase读取数据再写入HBase
Kafka常用配置参数 - MapReduce服务 MRS

sec 指定缓存中保存用户对应组信息的时间。单位：秒。 300 缓存中用户和组对应关系缓存时间，超过此时间用户信息才会再次通过id -Gn命令查询，在此期间，仅使用缓存中的用户和组对应关系。 zookeeper.connection.timeout.ms 连接ZooKeeper的超时时间。单位：毫秒。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka运维管理
提交SQL语句 - MapReduce服务 MRS
提交SQL语句 - MapReduce服务 MRS

默认取值： default archive_path 否 String 参数解释： SQL执行结果的转储文件夹。只有select语句才会转储查询的结果。当前仅支持转储到OBS中。约束限制：不涉及取值范围：不涉及默认取值：不涉及响应参数状态码： 200 表3 响应Body参数

 帮助中心 > MapReduce服务 MRS > API参考 > API V2 > SQL接口
Kafka常用配置参数 - MapReduce服务 MRS

sec 指定缓存中保存用户对应组信息的时间。单位：秒。 300 缓存中用户和组对应关系缓存时间，超过此时间用户信息才会再次通过id -Gn命令查询，在此期间，仅使用缓存中的用户和组对应关系。 zookeeper.connection.timeout.ms 连接ZooKeeper的超时时间。单位：毫秒。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kafka > Kafka运维管理
MRS集群Task节点弹性伸缩概述 - MapReduce服务 MRS

建议您在调试阶段设置为“继续”，无论此脚本是否执行成功，则集群都能继续扩缩容操作。若脚本执行失败，请到集群虚拟机的“/var/log/Bootstrap”路径下查看失败日志。由于缩容成功不可回滚，缩容后执行的脚本失败操作只能选择“继续”。自动化脚本只在弹性伸缩时触发，手动调整集群节点时不会运行。父主题：

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群容量调整 > MRS集群Task节点弹性伸缩
快速开发HBase应用 - MapReduce服务 MRS

根据已有信息创建表。 2 导入用户数据。 3 增加“教育信息”列族，在用户信息中新增用户的学历、职称等信息。 4 根据用户编号查询用户姓名和地址。 5 根据用户姓名进行查询。 6 为提升查询性能，创建二级索引或者删除二级索引。 7 用户销户，删除用户信息表中该用户的数据。 8 A业务结束后，删除用户信息表。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
HDFS基本原理 - MapReduce服务 MRS
HDFS基本原理 - MapReduce服务 MRS

MRS使用HDFS的副本机制来保证数据的可靠性，HDFS中每保存一个文件则自动生成1个备份文件，即共2个副本。HDFS副本数可通过“dfs.replication”参数查询。当MRS集群中Core节点规格选择为非本地盘（hdd）时，若集群中只有一个Core节点，则HDFS默认副本数为1。若集群中Core节点

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

SQL根据spark.sql.shuffle.partitions配置指定shuffle时的partition个数。此种方法在一个应用中执行多种SQL查询时缺乏灵活性，无法保证所有场景下的性能合适。开启Adaptive Execution后，Spark SQL将自动为每个shuffle过程动

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

SQL根据spark.sql.shuffle.partitions配置指定shuffle时的partition个数。此种方法在一个应用中执行多种SQL查询时缺乏灵活性，无法保证所有场景下的性能更优。开启Adaptive Execution后，Spark SQL将自动为每个shuffle过程动

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
Flink应用开发简介 - MapReduce服务 MRS

务2会不定时收到1条消息记录，消息记录该用户的名字、职业信息。实现实时的以根据业务2中消息记录的用户名字作为关键字，对两个业务数据进行联合查询的功能。父主题： Flink开发指南（安全模式）

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式）
Flink应用开发简介 - MapReduce服务 MRS

务2会不定时收到1条消息记录，消息记录该用户的名字、职业信息。实现实时的以根据业务2中消息记录的用户名字作为关键字，对两个业务数据进行联合查询的功能。父主题： Flink开发指南（普通模式）

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式）
Kafka基本原理 - MapReduce服务 MRS
Kafka基本原理 - MapReduce服务 MRS

e.topic.enable = true”）支持为已有主题增加分区支持更新现有主题的配置可以为分区级别和主题级别度量标准启用JMX查询父主题： Kafka

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Kafka
HDFS Colocation - MapReduce服务 MRS
HDFS Colocation - MapReduce服务 MRS

Colocation为locator分配数据节点的时候，locator的分配算法会根据已分配的情况，进行均衡的分配数据节点。 locator分配算法的原理是，查询目前存在的所有locators，读取所有locators所分配的数据节点，并记录其使用次数。根据使用次数，对数据节点进行排序，使用次数少的

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HDFS开发指南 > 开发HDFS应用
数据迁移到MRS前信息收集 - MapReduce服务 MRS

Streaming消费Kafka数据存入HDFS，HDFS上进行小文件合并后加载到Hive表中，运营人员可以通过Presto进行Hive数据查询。图1 源集群业务图针对大数据离线平台包括HDFS和Hive数据需要迁移，Kafka、Spark Streaming、HDFS、Hiv

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

开发思路使用Structured Streaming接收Kafka中数据，生成请求流、展示流、点击流。对请求流、展示流、点击流的数据进行关联查询。统计结果写入kafka。应用中监控流处理任务的状态。打包项目通过IDEA自带的Maven工具，打包项目，生成jar包。具体操作请

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming对接Kafka样例程序

总条数： 3627

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

使用Spark BulkLoad工具同步数据到HBase表中 - MapReduce服务 MRS

Java样例代码 - MapReduce服务 MRS

CarbonData数据类型概述 - MapReduce服务 MRS

Scala样例代码 - MapReduce服务 MRS

Kafka常用配置参数 - MapReduce服务 MRS

提交SQL语句 - MapReduce服务 MRS

Kafka常用配置参数 - MapReduce服务 MRS

MRS集群Task节点弹性伸缩概述 - MapReduce服务 MRS

快速开发HBase应用 - MapReduce服务 MRS

HDFS基本原理 - MapReduce服务 MRS

配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

Flink应用开发简介 - MapReduce服务 MRS

Flink应用开发简介 - MapReduce服务 MRS

Kafka基本原理 - MapReduce服务 MRS

HDFS Colocation - MapReduce服务 MRS

数据迁移到MRS前信息收集 - MapReduce服务 MRS

Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线