搜索_华为云

Kafka常用配置参数 - MapReduce服务 MRS

sec 指定缓存中保存用户对应组信息的时间。单位：秒。 300 缓存中用户和组对应关系缓存时间，超过此时间用户信息才会再次通过id -Gn命令查询，在此期间，仅使用缓存中的用户和组对应关系。 zookeeper.connection.timeout.ms 连接ZooKeeper的超时时间。单位：毫秒。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka运维管理
Kafka常用配置参数 - MapReduce服务 MRS

sec 指定缓存中保存用户对应组信息的时间。单位：秒。 300 缓存中用户和组对应关系缓存时间，超过此时间用户信息才会再次通过id -Gn命令查询，在此期间，仅使用缓存中的用户和组对应关系。 zookeeper.connection.timeout.ms 连接ZooKeeper的超时时间。单位：毫秒。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kafka > Kafka运维管理
Spark Structured Streaming状态操作样例程序开发思路 - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序开发思路场景说明假设需要跨批次统计每个session期间发生了多少次event以及本session的开始和结束timestamp；同时输出本批次被更新状态的session。数据规划在kafka中生成模拟数据（需要有Kafka权限用户）。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming状态操作样例程序
Spark Structured Streaming状态操作样例程序开发思路 - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序开发思路场景说明假设需要跨批次统计每个session期间发生了多少次event以及本session的开始和结束timestamp。同时输出本批次被更新状态的session。数据规划在kafka中生成模拟数据（需要有Kafka权限用户）。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming状态操作样例程序
创建CDL数据同步任务作业 - MapReduce服务 MRS

在“作业管理”的作业列表中，找到创建的作业名称，单击操作列的“启动”，等待作业启动。观察数据传输是否生效，例如在MySQL数据库中对作业中指定的表进行插入数据操作，查看Hudi导入的文件内容是否正常。父主题：创建CDL作业

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > 创建CDL作业
Spark Structured Streaming样例程序开发思路 - MapReduce服务 MRS

Spark Structured Streaming样例程序开发思路场景说明在Spark应用中，通过使用StructuredStreaming调用Kafka接口来获取单词记录，然后把单词记录分类统计，得到每个单词记录数。数据规划 StructuredStreaming样例工

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming样例程序
HDFS基本原理 - MapReduce服务 MRS
HDFS基本原理 - MapReduce服务 MRS

MRS使用HDFS的副本机制来保证数据的可靠性，HDFS中每保存一个文件则自动生成1个备份文件，即共2个副本。HDFS副本数可通过“dfs.replication”参数查询。当MRS集群中Core节点规格选择为非本地盘（hdd）时，若集群中只有一个Core节点，则HDFS默认副本数为1。若集群中Core节点

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

SQL根据spark.sql.shuffle.partitions配置指定shuffle时的partition个数。此种方法在一个应用中执行多种SQL查询时缺乏灵活性，无法保证所有场景下的性能合适。开启Adaptive Execution后，Spark SQL将自动为每个shuffle过程动

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

SQL根据spark.sql.shuffle.partitions配置指定shuffle时的partition个数。此种方法在一个应用中执行多种SQL查询时缺乏灵活性，无法保证所有场景下的性能更优。开启Adaptive Execution后，Spark SQL将自动为每个shuffle过程动

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
Flink应用开发简介 - MapReduce服务 MRS

务2会不定时收到1条消息记录，消息记录该用户的名字、职业信息。实现实时的以根据业务2中消息记录的用户名字作为关键字，对两个业务数据进行联合查询的功能。父主题： Flink开发指南（普通模式）

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式）
Flink应用开发简介 - MapReduce服务 MRS

务2会不定时收到1条消息记录，消息记录该用户的名字、职业信息。实现实时的以根据业务2中消息记录的用户名字作为关键字，对两个业务数据进行联合查询的功能。父主题： Flink开发指南（安全模式）

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式）
Flink Join样例程序（Scala） - MapReduce服务 MRS

running = false } } } 生成Table1和Table2，并使用Join对Table1和Table2进行联合查询，打印输出结果。 object SqlJoinWithSocket { def main(args: Array[String]):

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 开发Flink应用 > Flink Join样例程序
Kafka基本原理 - MapReduce服务 MRS
Kafka基本原理 - MapReduce服务 MRS

e.topic.enable = true”）支持为已有主题增加分区支持更新现有主题的配置可以为分区级别和主题级别度量标准启用JMX查询父主题： Kafka

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Kafka
HDFS Colocation - MapReduce服务 MRS
HDFS Colocation - MapReduce服务 MRS

Colocation为locator分配数据节点的时候，locator的分配算法会根据已分配的情况，进行均衡的分配数据节点。 locator分配算法的原理是，查询目前存在的所有locators，读取所有locators所分配的数据节点，并记录其使用次数。根据使用次数，对数据节点进行排序，使用次数少的

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HDFS开发指南 > 开发HDFS应用
数据迁移到MRS前信息收集 - MapReduce服务 MRS

Streaming消费Kafka数据存入HDFS，HDFS上进行小文件合并后加载到Hive表中，运营人员可以通过Presto进行Hive数据查询。图1 源集群业务图针对大数据离线平台包括HDFS和Hive数据需要迁移，Kafka、Spark Streaming、HDFS、Hiv

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
Spark应用开发简介 - MapReduce服务 MRS

算法。流式处理（Streaming Processing）：支持秒级延迟的流式处理，可支持多种外部数据源。查询分析（Query Analysis）：支持标准SQL查询分析，同时提供DSL（DataFrame），并支持多种外部输入。本文档重点介绍Spark、Spark SQL和Spark

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式）
Spark应用开发简介 - MapReduce服务 MRS

算法。流式处理（Streaming Processing）：支持秒级延迟的流式处理，可支持多种外部数据源。查询分析（Query Analysis）：支持标准SQL查询分析，同时提供DSL（DataFrame），并支持多种外部输入。本文档重点介绍Spark、Spark SQL和Spark

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式）
Java样例代码 - MapReduce服务 MRS
Java样例代码 - MapReduce服务 MRS

Java样例代码功能介绍实时统计连续网购时间超过半个小时的女性网民信息，将统计结果直接打印或者输出写入到Kafka中。 Spark Streaming Write To Print代码样例下面代码片段仅为演示，具体代码参见com.huawei.bigdata.spark.examples

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark Streaming程序
Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

开发思路使用Structured Streaming接收Kafka中数据，生成请求流、展示流、点击流。对请求流、展示流、点击流的数据进行关联查询。统计结果写入kafka。应用中监控流处理任务的状态。打包项目通过IDEA自带的Maven工具，打包项目，生成jar包。具体操作请

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming对接Kafka样例程序
Flink Join样例程序（Scala） - MapReduce服务 MRS

running = false } } } 生成Table1和Table2，并使用Join对Table1和Table2进行联合查询，打印输出结果。 object SqlJoinWithSocket { def main(args: Array[String]):

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > Flink Join样例程序

总条数： 3413

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Kafka常用配置参数 - MapReduce服务 MRS

Kafka常用配置参数 - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序开发思路 - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序开发思路 - MapReduce服务 MRS

创建CDL数据同步任务作业 - MapReduce服务 MRS

Spark Structured Streaming样例程序开发思路 - MapReduce服务 MRS

HDFS基本原理 - MapReduce服务 MRS

配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

Flink应用开发简介 - MapReduce服务 MRS

Flink应用开发简介 - MapReduce服务 MRS

Flink Join样例程序（Scala） - MapReduce服务 MRS

Kafka基本原理 - MapReduce服务 MRS

HDFS Colocation - MapReduce服务 MRS

数据迁移到MRS前信息收集 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

Java样例代码 - MapReduce服务 MRS

Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

Flink Join样例程序（Scala） - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线