搜索_华为云

Spark Streaming调优 - MapReduce服务 MRS

Spark Streaming调优操作场景 Streaming作为一种mini-batch方式的流式处理框架，它主要的特点是秒级时延和高吞吐量。因此Streaming调优的目标是在秒级延迟的情景下，提高Streaming的吞吐能力，在单位时间处理尽可能多的数据。本章节适用于输入数据源为Kafka的使用场景。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优
HBase访问多ZooKeeper场景安全认证 - MapReduce服务 MRS

HBase访问多ZooKeeper场景安全认证场景说明在同一个客户端进程内同时访问FusionInsight ZooKeeper和第三方的ZooKeeper时，为了避免访问连接ZooKeeper认证冲突，提供了样例代码使HBase客户端访问FusionInsight ZooK

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > 准备HBase应用开发环境 > 配置HBase应用安全认证
常见jar包冲突处理方式 - MapReduce服务 MRS

常见jar包冲突处理方式问题现象 Spark能对接很多的第三方工具，因此在使用过程中经常会依赖一堆的三方包。而有一些包MRS已经自带，这样就有可能造成代码使用的jar包版本和集群自带的jar包版本不一致，在使用过程中就有可能出现jar包冲突的情况。常见的jar包冲突报错有： 1、报错类找不到：java

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
常见jar包冲突处理方式 - MapReduce服务 MRS

常见jar包冲突处理方式问题现象 Spark能对接很多的第三方工具，因此在使用过程中经常会依赖一堆的三方包。而有一些包MRS已经自带，这样就有可能造成代码使用的jar包版本和集群自带的jar包版本不一致，在使用过程中就有可能出现jar包冲突的情况。常见的jar包冲突报错有： 1、报错类找不到：java

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
Kafka集群节点内多磁盘数据量占用高 - MapReduce服务 MRS

Kafka集群节点内多磁盘数据量占用高用户问题 Kafka流式集群节点内有多块磁盘的使用量很高。当达到100%时就会造成kafka不可用如何处理？问题现象客户购买的MRS Kafka流式集群节点内有多块磁盘，由于分区不合理及业务原因导致某几个磁盘的使用量很高。当达到100%时就会造成kafka不可用。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
SHOW FUNCTIONS - MapReduce服务 MRS
SHOW FUNCTIONS - MapReduce服务 MRS

SHOW FUNCTIONS 语法 SHOW FUNCTIONS [LIKE pattern [ESCAPE escapeChar]]; SHOW EXTERNAL FUNCTIONS; SHOW EXTERNAL FUNCTION qualified_function_name;

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DDL SQL语法说明
使用Impala操作Kudu表 - MapReduce服务 MRS

使用Impala操作Kudu表您可以使用Impala的SQL语法插入、查询、更新和删除Kudu中的数据，作为使用Kudu API构建自定义Kudu应用程序的替代方案。前提条件已安装集群完整客户端。例如安装目录为“/opt/Bigdata/client”，以下操作的客户端目录只是举例，请根据实际安装目录修改。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Impala
ALM-45441 ZooKeeper连接断开 - MapReduce服务 MRS

ALM-45441 ZooKeeper连接断开告警解释系统每分钟检测一次ClickHouse和ZooKeeper的连接情况，如果检测连接失败，系统产生告警（告警原因为ZooKeeper连接异常）。如果连续3次检测连接失败，系统产生告警（告警原因为ZooKeeper连接断开）。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
快速开发Hive JDBC应用 - MapReduce服务 MRS

快速开发Hive JDBC应用 Hive是一个开源的，建立在Hadoop上的数据仓库框架，提供类似SQL的HQL语言操作结构化数据，其基本原理是将HQL语言自动转换成Mapreduce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
开源sqoop-shell工具使用示例（SFTP - HDFS） - MapReduce服务 MRS

开源sqoop-shell工具使用示例（SFTP - HDFS）操作场景本文将以“从SFTP服务器导入数据到HDFS”的作业为例，介绍如何分别在交互模式和批量模式下使用sqoop-shell工具进行创建和启动Loader作业。本章节适用于MRS 3.x及后续版本。前提条件

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 客户端工具说明
使用sqoop-shell工具导入数据到HDFS - MapReduce服务 MRS

使用sqoop-shell工具导入数据到HDFS 操作场景本文将以从SFTP服务器导入数据到HDFS的作业为例，介绍如何分别在交互模式和批量模式下使用sqoop-shell工具进行创建和启动Loader作业。前提条件已安装并配置Loader客户端，具体操作请参见使用客户端运行Loader作业。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
配置ClickHouse对接普通模式Kafka - MapReduce服务 MRS

配置ClickHouse对接普通模式Kafka 本章节适用于MRS 3.3.0-LTS及之后版本。操作场景本章节主要介绍ClickHouse连接普通模式的Kafka，消费Kafka的数据。前提条件已创建Kafka集群，且为普通模式（关闭Kerberos认证）。已创建Cl

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse数据导入 > 配置ClickHouse对接Kafka
CarbonData Segment API语法说明 - MapReduce服务 MRS

CarbonData Segment API语法说明本章节描述Segment的API以及使用方法，所有方法在org.apache.spark.util.CarbonSegmentUtil类中。如下方法已废弃： /** * Returns the valid segments

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考
Java样例代码 - MapReduce服务 MRS
Java样例代码 - MapReduce服务 MRS

Java样例代码功能介绍在Spark应用中，通过使用Spark调用Hive接口来操作hive表，然后把Hive表的数据经过分析后写到HBase表。代码样例下面代码片段仅为演示，具体代码参见：com.huawei.bigdata.spark.examples.SparkHivetoHbase。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > 从Hive读取数据再写入HBase
Spark On Hudi性能调优 - MapReduce服务 MRS

Spark On Hudi性能调优优化Spark Shuffle参数提升Hudi写入效率开启spark.shuffle.readHostLocalDisk=true，本地磁盘读取shuffle数据，减少网络传输的开销。开启spark.io.encryption.enable

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Spark on Hudi开发规范
删除CarbonData表Segments - MapReduce服务 MRS

删除CarbonData表Segments 操作场景如果用户将错误数据加载到表中，或者数据加载后出现许多错误记录，用户希望修改并重新加载数据时，可删除对应的segment。可使用segment ID来删除segment，也可以使用加载数据的时间来删除segment。删除seg

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData数据分析
删除CarbonData表Segments - MapReduce服务 MRS

删除CarbonData表Segments 操作场景如果用户将错误数据加载到表中，或者数据加载后出现许多错误记录，用户希望修改并重新加载数据时，可删除对应的segment。可使用segment ID来删除segment，也可以使用加载数据的时间来删除segment。删除seg

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData数据分析
CarbonData Segment API语法说明 - MapReduce服务 MRS

CarbonData Segment API语法说明本章节描述Segment的API以及使用方法，所有方法在org.apache.spark.util.CarbonSegmentUtil类中。如下方法已废弃： /** * Returns the valid segments

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
通过JDBC访问Spark SQL样例程序（Scala） - MapReduce服务 MRS

通过JDBC访问Spark SQL样例程序（Scala）功能简介使用自定义客户端的JDBC接口提交数据分析任务，并返回结果。样例代码定义SQL语句。SQL语句必须为单条语句，注意其中不能包含“;”。示例： val sqlList = new ArrayBuffer[String]

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > 通过JDBC访问Spark SQL样例程序
Scala样例代码 - MapReduce服务 MRS
Scala样例代码 - MapReduce服务 MRS

Scala样例代码功能介绍在Spark应用中，通过使用Streaming调用kafka接口来获取数据，然后把数据经过分析后，找到对应的HBase表记录，再写到HBase表。代码样例下面代码片段仅为演示，具体代码参见：com.huawei.bigdata.spark.examples

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Streaming从Kafka读取数据再写入HBase

总条数： 4246

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Streaming调优 - MapReduce服务 MRS

HBase访问多ZooKeeper场景安全认证 - MapReduce服务 MRS

常见jar包冲突处理方式 - MapReduce服务 MRS

常见jar包冲突处理方式 - MapReduce服务 MRS

Kafka集群节点内多磁盘数据量占用高 - MapReduce服务 MRS

SHOW FUNCTIONS - MapReduce服务 MRS

使用Impala操作Kudu表 - MapReduce服务 MRS

ALM-45441 ZooKeeper连接断开 - MapReduce服务 MRS

快速开发Hive JDBC应用 - MapReduce服务 MRS

开源sqoop-shell工具使用示例（SFTP - HDFS） - MapReduce服务 MRS

使用sqoop-shell工具导入数据到HDFS - MapReduce服务 MRS

配置ClickHouse对接普通模式Kafka - MapReduce服务 MRS

CarbonData Segment API语法说明 - MapReduce服务 MRS

Java样例代码 - MapReduce服务 MRS

Spark On Hudi性能调优 - MapReduce服务 MRS

删除CarbonData表Segments - MapReduce服务 MRS

删除CarbonData表Segments - MapReduce服务 MRS

CarbonData Segment API语法说明 - MapReduce服务 MRS

通过JDBC访问Spark SQL样例程序（Scala） - MapReduce服务 MRS

Scala样例代码 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线