搜索_华为云

操作HBase数据源 - MapReduce服务 MRS

操作HBase数据源场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，将dataFrame写入HBase中，并从HBase读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
操作HBase数据源 - MapReduce服务 MRS

操作HBase数据源场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，将dataFrame写入HBase中，并从HBase读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
操作HBase数据源 - MapReduce服务 MRS

操作HBase数据源场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，将dataFrame写入HBase中，并从HBase读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
使用Spark执行Hudi样例程序（Python） - MapReduce服务 MRS

使用Spark执行Hudi样例程序（Python）下面代码片段仅为演示，具体代码参见：HudiPythonExample.py。插入数据： #insert inserts = sc._jvm.org.apache.hudi.QuickstartUtils.convertToStringList(dataGen

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > 使用Spark执行Hudi样例程序
使用Spark执行Hudi样例程序（Python） - MapReduce服务 MRS

使用Spark执行Hudi样例程序（Python）下面代码片段仅为演示，具体代码参见：HudiPythonExample.py。插入数据： #insert inserts = sc._jvm.org.apache.hudi.QuickstartUtils.convertToStringList(dataGen

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > 使用Spark执行Hudi样例程序
配置Hive Beeline高可靠性 - MapReduce服务 MRS

配置Hive Beeline高可靠性操作场景在批处理任务运行过程中，beeline客户端由于网络异常等问题断线时，Hive能支持beeline在断线前已经提交的任务继续运行。当再次运行该批处理任务时，已经提交过的任务不再重新执行，直接从下一个任务开始执行。在批处理任务运行过

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive企业级能力增强
配置Hive Beeline高可靠性 - MapReduce服务 MRS

配置Hive Beeline高可靠性操作场景在批处理任务运行过程中，beeline客户端由于网络异常等问题断线时，Hive能支持beeline在断线前已经提交的任务继续运行。当再次运行该批处理任务时，已经提交过的任务不再重新执行，直接从下一个任务开始执行。在批处理任务运行过

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive企业级能力增强
Executor进程Crash导致Stage重试 - MapReduce服务 MRS

Executor进程Crash导致Stage重试问题在执行大数据量的Spark任务（如100T的TPCDS测试套）过程中，有时会出现Executor丢失从而导致Stage重试的现象。查看Executor的日志，出现“Executor 532 is lost rpc with driver

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
配置Structured Streaming使用RocksDB做状态存储 - MapReduce服务 MRS

配置Structured Streaming使用RocksDB做状态存储本章节仅适用于MRS 3.3.0及之后版本。配置场景当大量的状态信息存储在默认的HDFS BackedStateStore，导致JVM GC占用大量时间时，可以通过如下配置，选择RocksDB作为状态后端。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Streaming企业级能力增强
Executor进程Crash导致Stage重试 - MapReduce服务 MRS

Executor进程Crash导致Stage重试问题在执行大数据量的Spark任务（如100T的TPCDS测试套）过程中，有时会出现Executor丢失从而导致Stage重试的现象。查看Executor的日志，出现“Executor 532 is lost rpc with driver

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
添加MRS子租户 - MapReduce服务 MRS

新安装集群的Yarn组件默认使用Superior调度器。也可以参考切换MRS租户资源调度器切换调度器。调度器类型可登录Manager，在Yarn服务“全部配置”页面搜索“yarn.resourcemanager.scheduler.class”参数进行查询。表3 子租户参数一览（Superior调度器）

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群租户 > 配置MRS租户
配置Spark小文件自动合并 - MapReduce服务 MRS

配置Spark小文件自动合并配置场景小文件自动合并特性开启后，Spark将数据先写入临时目录，再去检测每个分区的平均文件大小是否小于16MB（默认值）。如果发现平均文件大小小于16MB，则认为分区下有小文件，Spark会启动一个Job合并这些小文件，并将合并后的大文件写入到最终的表目录下。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
Flink应用开发规范 - MapReduce服务 MRS

Flink应用开发规范 Flink开发规范概述 FlinkSQL Connector开发规范 Flink on Hudi开发规范 Flink任务开发规范 Flink SQL逻辑开发规范 Flink性能调优开发规范 Flink开发样例

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范
向Phoenix表中插入数据 - MapReduce服务 MRS

向Phoenix表中插入数据功能简介使用Phoenix实现写数据。代码样例以下代码片段在com.huawei.bigdata.hbase.examples包的“PhoenixSample”类的testPut方法中。 /** * Put data */ public

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > 开发HBase应用 > HBase数据读写样例程序
使用JDBC提交数据分析任务 - MapReduce服务 MRS

使用JDBC提交数据分析任务功能简介本章节介绍如何使用JDBC样例程序完成数据分析任务。样例代码使用Hive JDBC接口提交数据分析任务，该样例程序在“hive-examples/hive-jdbc-example”的“JDBCExample.java”中，实现该功能的模块如下：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式） > 开发Hive应用 > Hive JDBC访问样例程序
HetuEngine样例程序（Python3） - MapReduce服务 MRS

HetuEngine样例程序（Python3）通过HSBroker的用户名密码认证实现查询HetuEngine SQL任务通过HSFabric的用户名密码认证实现查询HetuEngine SQL任务父主题：开发HetuEngine应用

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（普通模式） > 开发HetuEngine应用
操作HBase数据源 - MapReduce服务 MRS

操作HBase数据源场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，将dataFrame写入HBase中，并从HBase读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
策略及授权项说明 - MapReduce服务 MRS

策略及授权项说明如果您需要对您所拥有的MapReduce服务（MRS）进行精细的权限管理，您可以使用统一身份认证服务（Identity and Access Management，简称IAM），如果华为账号已经能满足您的要求，不需要创建独立的IAM用户，您可以跳过本章节，不影响您使用MRS服务的其它功能。

帮助中心 > MapReduce服务 MRS > API参考 > 权限策略和授权项

总条数： 2570

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

操作HBase数据源 - MapReduce服务 MRS

操作HBase数据源 - MapReduce服务 MRS

操作HBase数据源 - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

使用Spark执行Hudi样例程序（Python） - MapReduce服务 MRS

使用Spark执行Hudi样例程序（Python） - MapReduce服务 MRS

配置Hive Beeline高可靠性 - MapReduce服务 MRS

配置Hive Beeline高可靠性 - MapReduce服务 MRS

Executor进程Crash导致Stage重试 - MapReduce服务 MRS

配置Structured Streaming使用RocksDB做状态存储 - MapReduce服务 MRS

Executor进程Crash导致Stage重试 - MapReduce服务 MRS

添加MRS子租户 - MapReduce服务 MRS

配置Spark小文件自动合并 - MapReduce服务 MRS

Flink应用开发规范 - MapReduce服务 MRS

向Phoenix表中插入数据 - MapReduce服务 MRS

使用JDBC提交数据分析任务 - MapReduce服务 MRS

HetuEngine样例程序（Python3） - MapReduce服务 MRS

操作HBase数据源 - MapReduce服务 MRS

策略及授权项说明 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线