搜索_华为云

Spark Distinct聚合优化 - MapReduce服务 MRS

distinct聚合函数。使用约束作业已配置足够的内存。配置参数在Spark客户端的“{客户端安装目录}/Spark/spark/conf/spark-defaults.conf”配置文件中进行设置，修改如下参数：参数说明默认值 spark.sql.keep.distinct

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
Flink Kafka样例程序（Java） - MapReduce服务 MRS

Flink Kafka样例程序（Java）功能介绍在Flink应用中，调用flink-connector-kafka模块的接口，生产并消费数据。代码样例用户在开发前需要使用对接安全模式的Kafka，则需要引入FusionInsight的kafka-clients-*.ja

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > 开发Flink应用 > Flink Kafka样例程序
Python样例代码 - MapReduce服务 MRS

print "Usage: CollectFemaleInfo <file>" exit(-1) # 创建SparkContext，设置AppName sc = SparkContext(appName = "CollectFemaleInfo")? """ 以下程序主要实现以下几步功能：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark Core程序
Scala样例代码 - MapReduce服务 MRS
Scala样例代码 - MapReduce服务 MRS

StreamingContext(sparkConf, batchDuration) // 设置Streaming的CheckPoint目录，由于窗口概念存在，该参数必须设置 ssc.checkpoint("checkpoint") // 组装Kafka的主题列表

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark Streaming程序
ZooKeeper上数据错乱导致ClickHouse启动失败问题 - MapReduce服务 MRS

ZooKeeper上数据错乱导致ClickHouse启动失败问题问题现象 ClickHouse集群中某实例节点启动失败，该实例节点启动日志中有如下类似报错信息： 2021.03.15 21:01:19.816593 [ 11111 ] {} <Error> Application:

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用ClickHouse
配置DBService HA模块的SSL - MapReduce服务 MRS

0/security”目录下的“root-ca.crt”和“root-ca.pem”相同。操作步骤以omm用户登录到需要配置SSL的DBService节点上。进入“$BIGDATA_HOME/FusionInsight_BASE_x.x.x/install/FusionInsight-dbservice-2

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用DBService
为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

CarbonData可获得所有节点上的executor。为了优化并行数据处理及并行读取块数据，运用动态分配的用户需配置以下特性。使用参数“spark.dynamicAllocation.executorIdleTimeout”并将此参数值设置为15min（或平均查询时间）。正确配置参数“spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData常见问题
为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

CarbonData可获得所有节点上的executor。为了优化并行数据处理及并行读取块数据，运用动态分配的用户需配置以下特性。使用参数“spark.dynamicAllocation.executorIdleTimeout”并将此参数值设置为15min（或平均查询时间）。正确配置参数“spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData故障排除
导入并配置ClickHouse事务样例工程 - MapReduce服务 MRS

e-examples”以及Maven相关配置。在应用开发环境中，导入样例工程到IntelliJ IDEA开发环境。在IDEA界面选择“File > New > Project from Existing Sources”。在显示的“Select File or Directory

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > ClickHouse开发指南（普通模式） > 准备ClickHouse应用开发环境
导入并配置ClickHouse事务样例工程 - MapReduce服务 MRS

e-examples”以及Maven相关配置。在应用开发环境中，导入样例工程到IntelliJ IDEA开发环境。在IDEA界面选择“File > New > Project from Existing Sources”。在显示的“Select File or Directory

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > ClickHouse开发指南（安全模式） > 准备ClickHouse应用开发环境
在Linux环境中调测Spark应用 - MapReduce服务 MRS

在Linux环境中调测Spark应用在程序代码完成开发后，您可以上传至Linux客户端环境中运行应用。使用Scala或Java语言开发的应用程序在Spark客户端的运行步骤是一样的。使用Python开发的Spark应用程序无需打包成jar，只需将样例工程复制到编译机器上即可。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 调测Spark应用
准备本地应用开发环境 - MapReduce服务 MRS

准备本地应用开发环境准备开发环境在进行应用开发时，要准备的开发和运行环境如表1所示。表1 开发环境准备项说明操作系统开发环境：Windows系统，支持Windows7以上版本。运行环境： Linux系统。如需在本地调测程序，运行环境需要和集群业务平面网络互通。安装JDK

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kudu开发指南（普通模式） > 准备Kudu应用开发环境
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

针对小文件很多的场景，DataSource在创建RDD时，先将Table中的split生成PartitionedFile，再将这些PartitionedFile进行合并。即将多个PartitionedFile组成一个partition，从而减少partition数量，避免在Shuffle操作时生成过多的hash分桶，如图1所示。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

针对小文件很多的场景，DataSource在创建RDD时，先将Table中的split生成PartitionedFile，再将这些PartitionedFile进行合并。即将多个PartitionedFile组成一个partition，从而减少partition数量，避免在Shuffle操作时生成过多的hash分桶，如图1所示。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
HBase如何关闭HDFS多路读功能 - MapReduce服务 MRS

间，单位：毫秒。 250 大于等于1 dfs.client.hedged.read.threadpool.size 多路读取线程池的大小，设置参数值大于0时启用多路读功能。 200 大于等于0 由于HDFS多路读功能在磁盘IO负载高的情况下可能导致性能劣化，在此场景下，HBase

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase常见问题
导入并配置ClickHouse样例工程 - MapReduce服务 MRS

例介绍请参见ClickHouse样例工程介绍。在应用开发环境中，导入样例工程到IntelliJ IDEA开发环境。在IDEA界面选择“File > New > Project from Existing Sources”。在显示的“Select File or Directory

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > ClickHouse开发指南（安全模式） > 准备ClickHouse应用开发环境
Java样例代码 - MapReduce服务 MRS
Java样例代码 - MapReduce服务 MRS

Java样例代码功能介绍在Spark应用中，通过使用Streaming调用kafka接口来获取数据,然后把数据经过分析后，找到对应的HBase表记录，再写到HBase表。代码样例下面代码片段仅为演示，具体代码参见：com.huawei.bigdata.spark.examples

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Streaming从Kafka读取数据再写入HBase
Flink向Kafka生产并消费数据Java样例代码 - MapReduce服务 MRS

Flink向Kafka生产并消费数据Java样例代码功能简介在Flink应用中，调用flink-connector-kafka模块的接口，生产并消费数据。用户在开发前需要使用对接安全模式的Kafka，则需要引入MRS的kafka-client-xx.x.x.jar，该jar包可在MRS

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > 开发Flink应用 > 向Kafka生产并消费数据程序
JobGateway日志介绍 - MapReduce服务 MRS

JobGateway提供了如下表2所示的日志级别。日志的级别优先级从高到低分别是ERROR、WARN、INFO、DEBUG，程序会打印高于或等于所设置级别的日志，设置的日志等级越高，打印出来的日志就越少。表2 日志级别级别描述 ERROR ERROR表示系统运行的错误信息。 WARN WARN表示当前事件处理存在异常信息。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用JobGateway
Storm-Kafka开发指引 - MapReduce服务 MRS

getDefaultRealm().toLowerCase()); return props; } 如果修改了集群域名，在设置Kafka消费者/生产者属性中kerberos域名时，需要将其设置为集群实际域名，例如props.put(KERBEROS_DOMAIN_NAME , "hadoop.hadoop1

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发常见问题

总条数： 3243

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Distinct聚合优化 - MapReduce服务 MRS

Flink Kafka样例程序（Java） - MapReduce服务 MRS

Python样例代码 - MapReduce服务 MRS

Scala样例代码 - MapReduce服务 MRS

ZooKeeper上数据错乱导致ClickHouse启动失败问题 - MapReduce服务 MRS

配置DBService HA模块的SSL - MapReduce服务 MRS

为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

导入并配置ClickHouse事务样例工程 - MapReduce服务 MRS

导入并配置ClickHouse事务样例工程 - MapReduce服务 MRS

在Linux环境中调测Spark应用 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

小文件优化 - MapReduce服务 MRS

小文件优化 - MapReduce服务 MRS

HBase如何关闭HDFS多路读功能 - MapReduce服务 MRS

导入并配置ClickHouse样例工程 - MapReduce服务 MRS

Java样例代码 - MapReduce服务 MRS

Flink向Kafka生产并消费数据Java样例代码 - MapReduce服务 MRS

JobGateway日志介绍 - MapReduce服务 MRS

Storm-Kafka开发指引 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线