搜索_华为云

通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据应用场景本文介绍如何使用MRS集群运行Spark Streaming作业以消费Kafka数据。假定某个业务Kafka每1秒就会收到1个单词记录。基于业务需要，开发的Spark应用程序实现实时累加计算每个单词的记录总数的功能。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
配置并导入Flink样例工程 - MapReduce服务 MRS

配置并导入Flink样例工程操作场景 Flink针对多个场景提供样例工程，包含Java样例工程和Scala样例工程等，帮助客户快速学习Flink工程。针对Java和Scala不同语言的工程，其导入方式相同。以下操作步骤以导入Java样例代码为例。操作流程如图1所示。图1 导入样例工程流程

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > 准备Flink应用开发环境
配置Hive读取Hudi表 - MapReduce服务 MRS

配置Hive读取Hudi表 Hudi表对应的Hive外部表介绍 Hudi源表对应一份HDFS的数据，通过Spark组件、Flink组件或者Hudi客户端，可以将Hudi表的数据映射为Hive外部表，基于该外部表，Hive可以进行实时视图查询、读优化视图查询以及增量视图查询。根据

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive
在本地Windows环境中调测HBase应用 - MapReduce服务 MRS

在本地Windows环境中调测HBase应用操作场景在程序代码完成开发后，您可以在Windows开发环境中运行应用。本地和集群业务平面网络互通时，您可以直接在本地进行调测。如果Windows开发环境中使用IBM JDK，不支持在Windows环境中直接运行应用程序。需要在

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > 调测HBase应用
最新动态 - MapReduce服务 MRS
最新动态 - MapReduce服务 MRS

最新动态本文介绍了MapReduce服务MRS各特性版本的功能发布和对应的文档动态，新特性将在各个区域（Region）陆续发布，欢迎体验。 2021年07月序号功能名称功能描述阶段相关文档 1 MRS支持Hudi组件 Hudi是数据湖的文件组织层，对Parquet格式

 帮助中心 > MapReduce服务 MRS > 最新动态
Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

Spark Structured Streaming对接Kafka样例程序开发思路场景说明假定一个广告业务，存在广告请求事件、广告展示事件、广告点击事件，广告主需要实时统计有效的广告展示和广告点击数据。已知：终端用户每次请求一个广告后，会生成广告请求事件，保存到kafka的adRequest

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming对接Kafka样例程序
BulkGet接口使用 - MapReduce服务 MRS

BulkGet接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将要获取的数据的rowKey构造成rdd，然后通过HBaseContext的bulkGet接口获取对HBase表上这些rowKey对应的数据。数据规划基于Bul

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
foreachPartition接口使用 - MapReduce服务 MRS

foreachPartition接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的mapPartition接口将rdd并发写入HBase表中。数据规划

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
分布式Scan HBase表 - MapReduce服务 MRS

分布式Scan HBase表场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用hbaseRDD方法以特定的规则扫描HBase表。数据规划使用操作Avro格式数据章节中创建的hbase数据表。开发思路设置scan的规则，例如：setCaching。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
BulkDelete接口使用 - MapReduce服务 MRS

BulkDelete接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将要删除的数据的rowKey构造成rdd，然后通过HBaseContext的bulkDelete接口对HBase表上这些rowKey对应的数据进行删除。数据规划

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
BulkGet接口使用 - MapReduce服务 MRS

BulkGet接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将要获取的数据的rowKey构造成rdd，然后通过HBaseContext的bulkGet接口获取对HBase表上这些rowKey对应的数据。数据规划基于Bul

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

Spark Structured Streaming对接Kafka样例程序开发思路场景说明假定一个广告业务，存在广告请求事件、广告展示事件、广告点击事件，广告主需要实时统计有效的广告展示和广告点击数据。已知：终端用户每次请求一个广告后，会生成广告请求事件，保存到kafka的adRequest

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming对接Kafka样例程序
入门实践 - MapReduce服务 MRS
入门实践 - MapReduce服务 MRS

入门实践当完成MRS集群部署后，可以根据自身的业务需求使用MRS提供的一系列常用实践。表1 MRS常用最佳实践实践描述数据分析使用Spark2x实现车联网车主驾驶行为分析本实践指导使用Spark实现车主驾驶行为分析。用于了解MRS的基本功能，利用MRS服务的Spar

帮助中心 > MapReduce服务 MRS > 快速入门
操作HBase数据源 - MapReduce服务 MRS

操作HBase数据源场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，将dataFrame写入HBase中，并从HBase读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
操作HBase数据源 - MapReduce服务 MRS

操作HBase数据源场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，将dataFrame写入HBase中，并从HBase读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
快速开发Flink应用 - MapReduce服务 MRS

快速开发Flink应用 Flink是一个批处理和流处理结合的统一计算框架，其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理，是业界最顶级的开源流处理引擎。 Flink最适合的应用场景是低时延的数据处理（Data Processing）场景：高并发pi

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
分布式Scan HBase表 - MapReduce服务 MRS

分布式Scan HBase表场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用hbaseRDD方法以特定的规则扫描HBase表。数据规划使用操作Avro格式数据章节中创建的hbase数据表。开发思路设置scan的规则，例如：setCaching。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
Flink客户端常见命令说明 - MapReduce服务 MRS

Flink客户端常见命令说明本章节适用于MRS 3.x及之后版本。在使用Flink的Shell脚本前，首先需要执行以下操作，详细使用场景可参考Flink客户端使用实践运行wordcount作业：安装Flink客户端，例如安装目录为“/opt/client”。初始化环境变量。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink
BulkLoad接口使用 - MapReduce服务 MRS

BulkLoad接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的bulkLoad接口将rdd写入HFile中。将生成的HFile导入HBase表的操作

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
foreachPartition接口使用 - MapReduce服务 MRS

foreachPartition接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的mapPartition接口将rdd并发写入HBase表中。数据规划

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序

总条数： 1599

上一页
1
...
75
76
77
...
80
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

配置并导入Flink样例工程 - MapReduce服务 MRS

配置Hive读取Hudi表 - MapReduce服务 MRS

在本地Windows环境中调测HBase应用 - MapReduce服务 MRS

最新动态 - MapReduce服务 MRS

Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

BulkGet接口使用 - MapReduce服务 MRS

foreachPartition接口使用 - MapReduce服务 MRS

分布式Scan HBase表 - MapReduce服务 MRS

BulkDelete接口使用 - MapReduce服务 MRS

BulkGet接口使用 - MapReduce服务 MRS

Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

入门实践 - MapReduce服务 MRS

操作HBase数据源 - MapReduce服务 MRS

操作HBase数据源 - MapReduce服务 MRS

快速开发Flink应用 - MapReduce服务 MRS

分布式Scan HBase表 - MapReduce服务 MRS

Flink客户端常见命令说明 - MapReduce服务 MRS

BulkLoad接口使用 - MapReduce服务 MRS

foreachPartition接口使用 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线