搜索_华为云

SparkStreaming批量写入HBase表 - MapReduce服务 MRS

SparkStreaming批量写入HBase表场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用streamBulkPut接口将流数据写入HBase表中。数据规划在客户端执行hbase shell进入HBase命令行。在hb

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
SparkStreaming批量写入HBase表 - MapReduce服务 MRS

SparkStreaming批量写入HBase表场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用streamBulkPut接口将流数据写入HBase表中。数据规划在客户端执行hbase shell进入HBase命令行。在hb

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
使用Spark2x实现车联网车主驾驶行为分析 - MapReduce服务 MRS

myhuaweicloud.com/mrs-demon-samples/demon/detail-records.zip获取Spark样例数据到本地。将下载的“detail-records.zip”解压，获取图3所示的样例数据。图3 样例数据进入“input”文件夹，单击“上传文件”，选择本地存放的Spark样例数据。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
Spark REST API接口介绍 - MapReduce服务 MRS

" : 373, "numActiveBatches" : 0, "numProcessedRecords" : 1, "numReceivedRecords" : 1, "avgInputRate" : 0.002680965147453083, "avgSchedulingDelay"

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
开发和部署对接HetuEngine的Hive UDF - MapReduce服务 MRS

开发和部署对接HetuEngine的Hive UDF 用户可以自定义一些函数，用于扩展SQL以满足个性化的需求，这类函数称为UDF。本章节主要介绍开发和应用Hive UDF的具体步骤。 MRS 3.2.1及以后版本，需要基于JDK17.0.4及以上版本开发。本章节以MRS 3.3

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 开发和部署HetuEngine UDF
BulkLoad接口使用 - MapReduce服务 MRS

BulkLoad接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的bulkLoad接口将rdd写入HFile中。将生成的HFile文件导入HBase表的

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
BulkLoad接口使用 - MapReduce服务 MRS

BulkLoad接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的bulkLoad接口将rdd写入HFile中。将生成的HFile文件导入HBase表的

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序开发思路场景说明假定某个业务Kafka每1秒就会收到1个单词记录。基于某些业务要求，开发的Spark应用程序实现如下功能：实时累加计算每个单词的记录总数。 “log1.txt”示例文件： LiuYang YuanJing

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Streaming对接Kafka0-10样例程序
Flume基本原理 - MapReduce服务 MRS
Flume基本原理 - MapReduce服务 MRS

File Channel：基于WAL（预写式日志Write-Ahead Logging）的持久化实现。 JDBC Channel：基于嵌入Database的持久化实现。 Channel支持事务，可提供较弱的顺序保证，可以和任何数量的Source和Sink工作。 Sink Sink负责将

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flume
mapPartition接口使用 - MapReduce服务 MRS

mapPartition接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用mapPartition接口并行遍历HBase表。数据规划使用foreachPartition接口使用章节创建的HBase数据表。开发思路构造

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
使用Jupyter Notebook对接MRS Spark - MapReduce服务 MRS

使用Jupyter Notebook对接MRS Spark 应用场景在MRS服务中可以配合Jupyter Notebook使用PySpark，能够提高机器学习、数据探索和ETL应用开发效率。本实践指导用户如何在MRS集群中配置Jupyter Notebook来使用Pyspark。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
使用Oozie调度Spark2x访问HBase以及Hive - MapReduce服务 MRS

ticator”。执行以下命令创建Hive表。可以在Hue WebUI中的Hive面板直接输入以下SQL创建表。 CREATE DATABASE test; CREATE TABLE IF NOT EXISTS `test`.`usr` (user_id int comment

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（普通模式） > 开发Oozie应用
使用Oozie调度Spark访问HBase以及Hive - MapReduce服务 MRS

执行以下命令创建Hive表。可以在Hue UI里hive面板里面直接输入以下的SQL。图1 执行Hive SQL命令 CREATE DATABASE test; CREATE TABLE IF NOT EXISTS `test`.`usr` (user_id int comment

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Oozie开发指南（普通模式） > 开发Oozie应用
配置Spark通过IAM委托访问OBS - MapReduce服务 MRS

客户端安装目录/Spark2x/spark/bin ./spark-sql 执行以下命令在OBS中创建表并插入数据： create database test location "obs://并行文件系统路径/test"; use test; create table test1(a

帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 配置MRS集群通过IAM委托对接OBS > MRS集群服务对接OBS示例
foreachPartition接口使用 - MapReduce服务 MRS

foreachPartition接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的mapPartition接口将rdd并发写入HBase表中。数据规划

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
mapPartition接口使用 - MapReduce服务 MRS

mapPartition接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用mapPartition接口并行遍历HBase表。数据规划使用foreachPartition接口使用章节创建的HBase数据表。开发思路构造

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
foreachPartition接口使用 - MapReduce服务 MRS

foreachPartition接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的mapPartition接口将rdd并发写入HBase表中。数据规划

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
JOINS - MapReduce服务 MRS
JOINS - MapReduce服务 MRS

JOINS 允许合并多个relation的数据。 HetuEngine支持JOIN类型为：CROSS JOIN、INNER JOIN、OUTER JOIN（LEFT JOIN、RIGHT JOIN、FULL JOIN）、SEMIN JOIN和ANTI JOIN。 CROSS JOIN

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DQL SQL语法说明
Flume日志采集概述 - MapReduce服务 MRS

Channel：基于预写式日志（Write-Ahead Logging，简称WAL）的持久化实现 JDBC Channel：基于嵌入Database的持久化实现 Channel支持事务特性，可保证简易的顺序操作，同时可以配合任意数量的Source和Sink共同工作。 Sink S

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume
新增并执行作业 - MapReduce服务 MRS

新增并执行作业功能介绍在MRS集群中新增并提交一个作业。需要先在集群详情页的“概览”页签，单击“IAM用户同步”右侧的“同步”进行IAM用户同步，然后再通过该接口提交作业。如需使用OBS加密功能，请先参考“MRS用户指南 > 管理现有集群 > 作业管理 > 使用OBS加密

 帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 作业管理接口

总条数： 1353

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SparkStreaming批量写入HBase表 - MapReduce服务 MRS

SparkStreaming批量写入HBase表 - MapReduce服务 MRS

使用Spark2x实现车联网车主驾驶行为分析 - MapReduce服务 MRS

Spark REST API接口介绍 - MapReduce服务 MRS

开发和部署对接HetuEngine的Hive UDF - MapReduce服务 MRS

BulkLoad接口使用 - MapReduce服务 MRS

BulkLoad接口使用 - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

Flume基本原理 - MapReduce服务 MRS

mapPartition接口使用 - MapReduce服务 MRS

使用Jupyter Notebook对接MRS Spark - MapReduce服务 MRS

使用Oozie调度Spark2x访问HBase以及Hive - MapReduce服务 MRS

使用Oozie调度Spark访问HBase以及Hive - MapReduce服务 MRS

配置Spark通过IAM委托访问OBS - MapReduce服务 MRS

foreachPartition接口使用 - MapReduce服务 MRS

mapPartition接口使用 - MapReduce服务 MRS

foreachPartition接口使用 - MapReduce服务 MRS

JOINS - MapReduce服务 MRS

Flume日志采集概述 - MapReduce服务 MRS

新增并执行作业 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线