搜索_华为云

Spark Distinct聚合优化 - MapReduce服务 MRS

配置参数在Spark客户端的“{客户端安装目录}/Spark/spark/conf/spark-defaults.conf”配置文件中进行设置，修改如下参数：参数说明默认值 spark.sql.keep.distinct.expandThreshold 由cube等引起的数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

如图1所示。图1 小文件合并操作步骤要启动小文件优化，在Spark客户端的“spark-defaults.conf”配置文件中进行设置。表1 参数介绍参数描述默认值 spark.sql.files.maxPartitionBytes 在读取文件时，将单个分区打包的最大字节数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

如图1所示。图1 小文件合并操作步骤要启动小文件优化，在Spark客户端的“spark-defaults.conf”配置文件中进行设置。表1 参数介绍参数描述默认值 spark.sql.files.maxPartitionBytes 在读取文件时，将单个分区打包的最大字节数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
Hudi数据表Compaction规范 - MapReduce服务 MRS

paction执行合并的过程必须和实时任务解耦，通过周期调度Spark任务来完成异步Compaction，这个方案的关键之处在于如何合理的设置这个周期，周期如果太短意味着Spark任务可能会空跑，周期如果太长可能会积压太多的Compaction Plan没有去执行而导致Spark

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表管理操作规范
Kafka Old Consumer API使用样例 - MapReduce服务 MRS

kafka.example.Old_Consumer类中，作用在于订阅指定Topic的消息。（注意：旧Consumer API仅支持访问未设置ACL的Topic，安全接口说明见Kafka安全接口介绍）样例代码 Old Consumer API线程run方法中的消费逻辑。 /**

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Kafka开发指南 > 开发Kafka应用
配置Sqoop通过IAM委托访问OBS - MapReduce服务 MRS

数介绍。表1 参数说明参数说明 --connect 指定JDBC连接的URL，格式为：jdbc:mysql://MySQL数据库IP地址:MySQL的端口/数据库名称。 --username 连接MySQL数据库的用户名。 -password 连接MySQL数据库的用户密码

 帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 配置MRS集群通过IAM委托对接OBS > MRS集群服务对接OBS示例
在Linux环境中调测MapReduce应用 - MapReduce服务 MRS

mapreduce.examples.FemaleInfoCollector <inputPath> <outputPath> 此命令包含了设置参数和提交job的操作，其中<inputPath>指HDFS文件系统中input的路径，<outputPath>指HDFS文件系统中output的路径。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > MapReduce开发指南（普通模式） > 调测MapReduce应用
SELECT查询表数据 - MapReduce服务 MRS

format] 使用示例 --查看ClickHouse集群信息 select * from system.clusters; --显示当前节点设置的宏 select * from system.macros; --查看数据库容量 select sum(rows) as "总行数",

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse常用SQL语法
Hudi数据表Archive规范 - MapReduce服务 MRS

automatic默认为true)。 Archive操作并不是每次写数据时都会触发，至少需要满足以下两个条件： Hudi表满足hoodie.keep.max.commits设置的阈值。如果是Flink写hudi至少提交的checkpoint要超过这个阈值；如果是Spark写hudi，写Hudi的次数要超过这个阈值。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表管理操作规范
编译并调测Flink应用 - MapReduce服务 MRS

指本地文件系统中文件路径，每个节点都需要放一份/opt/log1.txt和/opt/log2.txt。可以默认，也可以设置。 <windowTime> 指窗口时间大小，以分钟为单位。可以默认，也可以设置。运行向Kafka生产并消费数据样例程序（Scala和Java语言）。生产数据的执行命令启动程序。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 调测Flink应用
在Linux环境中调测MapReduce应用 - MapReduce服务 MRS

mapreduce.examples.FemaleInfoCollector <inputPath> <outputPath> 此命令包含了设置参数和提交job的操作，其中<inputPath>指HDFS文件系统中input的路径，<outputPath>指HDFS文件系统中output的路径。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（普通模式） > 调测MapReduce应用
调测ClickHouse Springboot样例程序 - MapReduce服务 MRS

inux运行环境中运行。前提条件 Linux环境已安装JDK，版本号需要和IntelliJ IDEA导出Jar包使用的JDK版本一致，并设置好Java环境变量。编译并运行程序在IDEA中右侧单击“Maven”，展开“Lifecycle”，双击“package”，对当前工程进行打包。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > ClickHouse开发指南（安全模式） > 调测ClickHouse应用
Flink应用开发常用概念 - MapReduce服务 MRS

SavePoint Savepoint是指允许用户在持久化存储中保存某个checkpoint，以便用户可以暂停自己的任务进行升级。升级完后将任务状态设置为savepoint存储的状态开始恢复运行，保证数据处理的延续性。父主题： Flink应用开发概述

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发概述
规划IoTDB容量 - MapReduce服务 MRS
规划IoTDB容量 - MapReduce服务 MRS

数据文件。容量规格 ConfigNode容量规格当创建新的存储组时，IoTDB默认为该存储组分配10000个槽位，数据写入时根据写入的设备名和时间值，分配或创建一个data region并挂载在某个槽位上。所以ConfigNode的内存容量占用跟存储组个数和该存储组持续写入的时间相关。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用IoTDB > IoTDB运维管理
调测springboot样例程序 - MapReduce服务 MRS

inux运行环境中运行。前提条件 Linux环境已安装JDK，版本号需要和IntelliJ IDEA导出Jar包使用的JDK版本一致，并设置好Java环境变量。编译并运行程序在IDEA中右侧单击“Maven”，展开“Lifecycle”，双击“package”，对当前工程进行打包。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > ClickHouse开发指南（普通模式） > 调测ClickHouse应用
Spark Streaming对接Kafka0-10样例程序（Scala） - MapReduce服务 MRS

<checkPointDir>为checkPoint目录。 * <topics>为Kafka中订阅的主题，多以逗号分隔。 * <brokers>为获取元数据的Kafka地址。 */ object DstreamKafkaWriterTest1 { def main(args: Array[String])

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Streaming对接Kafka0-10样例程序
Java样例代码 - MapReduce服务 MRS
Java样例代码 - MapReduce服务 MRS

JavaStreamingContext jssc = new JavaStreamingContext(sparkConf, batchDuration); // 设置Streaming的CheckPoint目录 if (!"nocp".equals(checkPointDir)) {

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Streaming从Kafka读取数据再写入HBase
Flink向Kafka生产并消费数据Java样例代码 - MapReduce服务 MRS

env = StreamExecutionEnvironment.getExecutionEnvironment(); // 设置并发度 env.setParallelism(1); // 解析运行参数 ParameterTool

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > 开发Flink应用 > 向Kafka生产并消费数据程序
Flink DataStream样例程序（Java） - MapReduce服务 MRS

split(","); assert filePaths.length > 0; // windowTime设置窗口时间大小，默认2分钟一个窗口足够读取文本内的所有数据了 final int windowTime = ParameterTool

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > 开发Flink应用 > Flink DataStream样例程序
添加MRS租户资源池 - MapReduce服务 MRS

选择“现有集群”，选中一个运行中的集群并单击集群名称，进入集群信息页面。在集群详情页，单击“租户管理”。单击“资源池”页签。单击“添加资源池”。在“添加资源池”设置资源池的属性。 “名称”：填写资源池的名称。不支持创建名称为“default”的资源池。可包含数字、字母和下划线，且不能以下划线开头。 “

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群租户 > 配置MRS租户

总条数： 3223

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Distinct聚合优化 - MapReduce服务 MRS

小文件优化 - MapReduce服务 MRS

小文件优化 - MapReduce服务 MRS

Hudi数据表Compaction规范 - MapReduce服务 MRS

Kafka Old Consumer API使用样例 - MapReduce服务 MRS

配置Sqoop通过IAM委托访问OBS - MapReduce服务 MRS

在Linux环境中调测MapReduce应用 - MapReduce服务 MRS

SELECT查询表数据 - MapReduce服务 MRS

Hudi数据表Archive规范 - MapReduce服务 MRS

编译并调测Flink应用 - MapReduce服务 MRS

在Linux环境中调测MapReduce应用 - MapReduce服务 MRS

调测ClickHouse Springboot样例程序 - MapReduce服务 MRS

Flink应用开发常用概念 - MapReduce服务 MRS

规划IoTDB容量 - MapReduce服务 MRS

调测springboot样例程序 - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序（Scala） - MapReduce服务 MRS

Java样例代码 - MapReduce服务 MRS

Flink向Kafka生产并消费数据Java样例代码 - MapReduce服务 MRS

Flink DataStream样例程序（Java） - MapReduce服务 MRS

添加MRS租户资源池 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线