搜索_华为云

mapPartition接口使用 - MapReduce服务 MRS

mapPartition接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用mapPartition接口并行遍历HBase表。数据规划使用foreachPartition接口使用章节创建的HBase数据表。开发思路构造

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
更改DataNode的存储目录 - MapReduce服务 MRS

更改DataNode的存储目录操作场景本章节适用于MRS 3.x及后续版本。 HDFS DataNode定义的存储目录不正确或HDFS的存储规划变化时，MRS集群管理员需要在FusionInsight Manager中修改DataNode的存储目录，以保证HDFS正常工作。适用于以下场景：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS运维管理
添加GBase数据源 - MapReduce服务 MRS

添加GBase数据源本章节适用于MRS 3.5.0及之后的版本。 HetuEngine支持配置GBase数据源实现对GBase数据源的接入与查询功能。本章节指导用户在集群的HSConsole界面添加GBase类型的JDBC数据源。前提条件数据源与HetuEngine集群节点网络互通。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
ALM-24001 Flume Agent异常 - MapReduce服务 MRS

ALM-24001 Flume Agent异常告警解释 Flume Agent监控模块对Flume Agent状态进行监控，当Flume Agent进程故障（每5秒检测一次）或Flume Agent启动失败时（即时上报告警），系统产生此告警。当检测到Flume Agent进程故障恢复，Flume

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ClickHouse客户端使用实践 - MapReduce服务 MRS

ClickHouse客户端使用实践 ClickHouse是面向联机分析处理的列式数据库，支持SQL查询，且查询性能好，特别是基于大宽表的聚合分析查询性能非常优异，比其他分析型数据库速度快一个数量级。 ClickHouse依靠ReplicatedMergeTree引擎与ZooKee

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse
添加Hive数据源 - MapReduce服务 MRS

添加Hive数据源 Hive数据源介绍 HetuEngine服务在安装时已经将共部署（与HetuEngine在同一个Hadoop集群）的Hive数据源默认实现对接，数据源名称为“hive”，不可删除。部分默认配置不可修改，如数据源名称，数据源类型，服务端Principal，客户端

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
更改DataNode的存储目录 - MapReduce服务 MRS

更改DataNode的存储目录操作场景本章节适用于MRS 3.x及后续版本。 HDFS DataNode定义的存储目录不正确或HDFS的存储规划变化时，MRS集群管理员需要在FusionInsight Manager中修改DataNode的存储目录，以保证HDFS正常工作。适用于以下场景：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS运维管理
mapPartition接口使用 - MapReduce服务 MRS

mapPartition接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用mapPartition接口并行遍历HBase表。数据规划使用foreachPartition接口使用章节创建的HBase数据表。开发思路构造

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
BulkPut接口使用 - MapReduce服务 MRS

BulkPut接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将构建的RDD写入HBase中。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的Hase表： create

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
Flink SQL逻辑开发建议 - MapReduce服务 MRS

Flink SQL逻辑开发建议在aggregate和join等操作前将数据过滤来减少计算的数据量提前过滤可以减少在shuffle阶段前的数据量，减少网络IO，从而提升查询效率。比如在表join前先过滤数据比在ON和WHERE时过滤可以有效较少join数据量。因为执行顺序从发

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink SQL逻辑开发规范
LOAD DATA - MapReduce服务 MRS
LOAD DATA - MapReduce服务 MRS

LOAD DATA 命令功能 LOAD DATA命令以CarbonData特定的数据存储类型加载原始的用户数据，这样，CarbonData可以在查询数据时提供良好的性能。仅支持加载位于HDFS上的原始数据。命令格式 LOAD DATA INPATH 'folder_path'

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
Geospatial函数 - MapReduce服务 MRS
Geospatial函数 - MapReduce服务 MRS

Geospatial函数以ST_前缀开头的HetuEngine Geospatial功能支持SQL、MM规范，并符合Open Geospatial Consortium（OGC）的OpenGIS规范。因此，许多HetuEngine Geospatial功能要求或更准确地说是假设

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
LOAD DATA - MapReduce服务 MRS
LOAD DATA - MapReduce服务 MRS

LOAD DATA 命令功能 LOAD DATA命令以CarbonData特定的数据存储类型加载原始的用户数据，这样，CarbonData可以在查询数据时提供良好的性能。仅支持加载位于HDFS上的原始数据。命令格式 LOAD DATA INPATH 'folder_path'

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DML
快速使用Flume采集节点日志 - MapReduce服务 MRS

快速使用Flume采集节点日志操作场景 Flume支持将采集的日志信息导入到Kafka。前提条件已创建开启Kerberos认证的包含Flume、Kafka等组件的流式集群。可参考购买自定义集群。已配置网络，使日志生成节点与流集群互通。使用Flume客户端（MRS 3.x之前版本）

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume
ClickHouse概述 - MapReduce服务 MRS
ClickHouse概述 - MapReduce服务 MRS

ClickHouse概述 ClickHouse表引擎介绍表引擎在ClickHouse中的作用十分关键，不同的表引擎决定了：数据存储和读取的位置支持哪些查询方式能否并发式访问数据能不能使用索引是否可以执行多线程请求数据复制使用的参数其中MergeTree和Distr

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse
ClickHouse概述 - MapReduce服务 MRS
ClickHouse概述 - MapReduce服务 MRS

ClickHouse概述 ClickHouse表引擎介绍表引擎在ClickHouse中的作用十分关键，不同的表引擎决定了：数据存储和读取的位置支持哪些查询方式能否并发式访问数据能不能使用索引是否可以执行多线程请求数据复制使用的参数其中MergeTree和Distr

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse
使用ZooKeeper客户端 - MapReduce服务 MRS

使用ZooKeeper客户端 Zookeeper是一个开源的，高可靠的，分布式一致性协调服务。Zookeeper设计目标是用来解决那些复杂，易出错的分布式系统难以保证数据一致性的。不必开发专门的协同应用，十分适合高可用服务保持数据一致性。背景信息在使用客户端前，除主管理节点以

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ZooKeeper
Spark应用开发建议 - MapReduce服务 MRS

Spark应用开发建议 RDD多次使用时，建议将RDD持久化 RDD在默认情况下的存储级别是StorageLevel.NONE，即既不存磁盘也不放在内存中，如果某个RDD需要多次使用，可以考虑将该RDD持久化，方法如下：调用spark.RDD中的cache()、persist(

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Spark应用开发规范

总条数： 1968

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

mapPartition接口使用 - MapReduce服务 MRS

更改DataNode的存储目录 - MapReduce服务 MRS

添加GBase数据源 - MapReduce服务 MRS

ALM-24001 Flume Agent异常 - MapReduce服务 MRS

ClickHouse客户端使用实践 - MapReduce服务 MRS

添加Hive数据源 - MapReduce服务 MRS

更改DataNode的存储目录 - MapReduce服务 MRS

mapPartition接口使用 - MapReduce服务 MRS

BulkPut接口使用 - MapReduce服务 MRS

Flink SQL逻辑开发建议 - MapReduce服务 MRS

LOAD DATA - MapReduce服务 MRS

Geospatial函数 - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

LOAD DATA - MapReduce服务 MRS

快速使用Flume采集节点日志 - MapReduce服务 MRS

ClickHouse概述 - MapReduce服务 MRS

ClickHouse概述 - MapReduce服务 MRS

使用ZooKeeper客户端 - MapReduce服务 MRS

Spark应用开发建议 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线