搜索_华为云

SparkStreaming批量写入HBase表 - MapReduce服务 MRS

SparkStreaming批量写入HBase表场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用streamBulkPut接口将流数据写入HBase表中。数据规划在客户端执行hbase shell进入HBase命令行。在hb

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
导入并配置Flink样例工程 - MapReduce服务 MRS

导入并配置Flink样例工程操作场景 Flink针对多个场景提供样例工程，包含Java样例工程和Scala样例工程等，帮助客户快速学习Flink工程。针对Java和Scala不同语言的工程，其导入方式相同。以下操作步骤以导入Java样例代码为例。操作流程如图1所示。图1 导入样例工程流程

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > 准备Flink应用开发环境
开发和部署对接HetuEngine的Hive UDF - MapReduce服务 MRS

开发和部署对接HetuEngine的Hive UDF 用户可以自定义一些函数，用于扩展SQL以满足个性化的需求，这类函数称为UDF。本章节主要介绍开发和应用Hive UDF的具体步骤。 MRS 3.2.1及以后版本，需要基于JDK17.0.4及以上版本开发。本章节以MRS 3.3

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 开发和部署HetuEngine UDF
BulkLoad接口使用 - MapReduce服务 MRS

BulkLoad接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的bulkLoad接口将rdd写入HFile中。将生成的HFile文件导入HBase表的

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
BulkLoad接口使用 - MapReduce服务 MRS

BulkLoad接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的bulkLoad接口将rdd写入HFile中。将生成的HFile文件导入HBase表的

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序开发思路场景说明假定某个业务Kafka每1秒就会收到1个单词记录。基于某些业务要求，开发的Spark应用程序实现如下功能：实时累加计算每个单词的记录总数。 “log1.txt”示例文件： LiuYang YuanJing

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Streaming对接Kafka0-10样例程序
Flume基本原理 - MapReduce服务 MRS
Flume基本原理 - MapReduce服务 MRS

File Channel：基于WAL（预写式日志Write-Ahead Logging）的持久化实现。 JDBC Channel：基于嵌入Database的持久化实现。 Channel支持事务，可提供较弱的顺序保证，可以和任何数量的Source和Sink工作。 Sink Sink负责将

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flume
mapPartition接口使用 - MapReduce服务 MRS

mapPartition接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用mapPartition接口并行遍历HBase表。数据规划使用foreachPartition接口使用章节创建的HBase数据表。开发思路构造

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
使用Jupyter Notebook对接MRS Spark - MapReduce服务 MRS

使用Jupyter Notebook对接MRS Spark 应用场景在MRS服务中可以配合Jupyter Notebook使用PySpark，能够提高机器学习、数据探索和ETL应用开发效率。本实践指导用户如何在MRS集群中配置Jupyter Notebook来使用Pyspark。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
Spark REST API接口介绍 - MapReduce服务 MRS

" : 373, "numActiveBatches" : 0, "numProcessedRecords" : 1, "numReceivedRecords" : 1, "avgInputRate" : 0.002680965147453083, "avgSchedulingDelay"

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
使用Spark2x实现车联网车主驾驶行为分析 - MapReduce服务 MRS

myhuaweicloud.com/mrs-demon-samples/demon/detail-records.zip获取Spark样例数据到本地。将下载的“detail-records.zip”解压，获取图3所示的样例数据。图3 样例数据进入“input”文件夹，单击“上传文件”，选择本地存放的Spark样例数据。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
foreachPartition接口使用 - MapReduce服务 MRS

foreachPartition接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的mapPartition接口将rdd并发写入HBase表中。数据规划

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
mapPartition接口使用 - MapReduce服务 MRS

mapPartition接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用mapPartition接口并行遍历HBase表。数据规划使用foreachPartition接口使用章节创建的HBase数据表。开发思路构造

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
foreachPartition接口使用 - MapReduce服务 MRS

foreachPartition接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的mapPartition接口将rdd并发写入HBase表中。数据规划

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
配置Spark通过IAM委托访问OBS - MapReduce服务 MRS

客户端安装目录/Spark2x/spark/bin ./spark-sql 执行以下命令在OBS中创建表并插入数据： create database test location "obs://并行文件系统路径/test"; use test; create table test1(a

帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 配置MRS集群通过IAM委托对接OBS > MRS集群服务对接OBS示例
使用Oozie调度Spark访问HBase以及Hive - MapReduce服务 MRS

执行以下命令创建Hive表。可以在Hue UI里hive面板里面直接输入以下的SQL。图1 执行Hive SQL命令 CREATE DATABASE test; CREATE TABLE IF NOT EXISTS `test`.`usr` (user_id int comment

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Oozie开发指南（普通模式） > 开发Oozie应用
使用Oozie调度Spark2x访问HBase以及Hive - MapReduce服务 MRS

ticator”。执行以下命令创建Hive表。可以在Hue WebUI中的Hive面板直接输入以下SQL创建表。 CREATE DATABASE test; CREATE TABLE IF NOT EXISTS `test`.`usr` (user_id int comment

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（普通模式） > 开发Oozie应用
JOINS - MapReduce服务 MRS
JOINS - MapReduce服务 MRS

JOINS 允许合并多个relation的数据。 HetuEngine支持JOIN类型为：CROSS JOIN、INNER JOIN、OUTER JOIN（LEFT JOIN、RIGHT JOIN、FULL JOIN）、SEMIN JOIN和ANTI JOIN。 CROSS JOIN

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DQL SQL语法说明
快速开发Hive JDBC应用 - MapReduce服务 MRS

快速开发Hive JDBC应用 Hive是一个开源的，建立在Hadoop上的数据仓库框架，提供类似SQL的HQL语言操作结构化数据，其基本原理是将HQL语言自动转换成Mapreduce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
导入并配置Flink样例工程 - MapReduce服务 MRS

导入并配置Flink样例工程操作场景 Flink针对多个场景提供样例工程，包含Java样例工程和Scala样例工程等，帮助客户快速学习Flink工程。针对Java和Scala不同语言的工程，其导入方式相同。以下操作步骤以导入Java样例代码为例。操作流程如图1所示。图1 导入样例工程流程

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 准备Flink应用开发环境

总条数： 1370

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SparkStreaming批量写入HBase表 - MapReduce服务 MRS

导入并配置Flink样例工程 - MapReduce服务 MRS

开发和部署对接HetuEngine的Hive UDF - MapReduce服务 MRS

BulkLoad接口使用 - MapReduce服务 MRS

BulkLoad接口使用 - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

Flume基本原理 - MapReduce服务 MRS

mapPartition接口使用 - MapReduce服务 MRS

使用Jupyter Notebook对接MRS Spark - MapReduce服务 MRS

Spark REST API接口介绍 - MapReduce服务 MRS

使用Spark2x实现车联网车主驾驶行为分析 - MapReduce服务 MRS

foreachPartition接口使用 - MapReduce服务 MRS

mapPartition接口使用 - MapReduce服务 MRS

foreachPartition接口使用 - MapReduce服务 MRS

配置Spark通过IAM委托访问OBS - MapReduce服务 MRS

使用Oozie调度Spark访问HBase以及Hive - MapReduce服务 MRS

使用Oozie调度Spark2x访问HBase以及Hive - MapReduce服务 MRS

JOINS - MapReduce服务 MRS

快速开发Hive JDBC应用 - MapReduce服务 MRS

导入并配置Flink样例工程 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线