搜索_华为云

Flink性能调优规则 - MapReduce服务 MRS

Flink性能调优规则及时对Hudi表进行compaction防止Hudi Source算子Checkpoint完成时间过长当Hudi Source算子Checkpoint完成时间长时，可检查该Hudi表compaction是否正常。因为当长时间不做compaction时list性能会变差。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink性能调优开发规范
Flume业务模型配置说明 - MapReduce服务 MRS

Flume业务模型配置说明业务模型配置指导本任务旨在提供Flume常用模块的性能差异，用于指导用户进行合理的Flume业务配置，避免出现前端Source和后端Sink性能不匹配进而导致整体业务性能不达标的场景。本任务只针对于单通道的场景进行比较说明。 Flume业务配置及模

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume
Flume业务配置指南 - MapReduce服务 MRS

Flume业务配置指南本章节适用于MRS 3.x及之后版本。该操作指导用户完成Flume常用业务的配置。其他一些不太常用的Source、Channel、Sink的配置请参考Flume社区提供的用户手册（http://flume.apache.org/releases/1.9.0

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > Flume运维管理
十进制函数和操作符 - MapReduce服务 MRS

十进制函数和操作符 DECIMAL字面量可以使用DECIMAL 'xxxxxxx.yyyyyyy' 语法来定义DECIMAL类型的字面量。 DECIMAL类型的字面量精度将等于字面量（包括尾随零和前导零）的位数。范围将等于小数部分（包括尾随零）的位数。示例字面量数据类型 DECIMAL

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
Hive CBO原理介绍 - MapReduce服务 MRS

Hive CBO原理介绍 Hive CBO原理介绍 CBO，全称是Cost Based Optimization，即基于代价的优化器。其优化目标是：在编译阶段，根据查询语句中涉及到的表和查询条件，计算出产生中间结果少的高效join顺序，从而减少查询时间和资源消耗。 Hive中实现CBO的总体过程如下：

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Hive
Doris建表规范 - MapReduce服务 MRS
Doris建表规范 - MapReduce服务 MRS

Doris建表规范该章节主要介绍创建Doris表时需遵循的规则和建议。 Doris建表规则在创建Doris表指定分桶buckets时，每个桶的数据大小应保持在100MB~3GB之间，单分区中最大分桶数量不超过5000。表数据超过5亿条以上必须设置分区分桶策略。表的分桶列不

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Doris应用开发规范
为什么从Yarn Web UI页面无法跳转到Spark Web UI界面 - MapReduce服务 MRS

P不能互通，所以导致访问Spark Web UI界面失败。修改方案：登录10.120.169.53客户端机器，修改/etc/hosts文件，将10.120.169.53更改为相对应的192网段的IP地址。再重新运行Spark应用，这时就可以打开Spark Web UI界面。父主题：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题
使用Hudi-Cli.sh操作Hudi表 - MapReduce服务 MRS

showpartitions --commit 20210127153356 20210127153356表示commit的时间戳，下同。查看指定commit写入的文件： commit showfiles --commit 20210127153356 比较两个表的commit信息差异： commits compare

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi
配置Kafka后进先出 - MapReduce服务 MRS

级最低。应用重新启动后C段时间的任务启用流控功能。配置描述在Spark Driver端的“spark-defaults.conf”配置文件中进行设置。表1 参数说明参数说明默认值 spark.streaming.kafka.direct.lifo 配置是否开启Kafka后进先出功能。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Streaming企业级能力增强
准备Spark本地应用开发环境 - MapReduce服务 MRS

Python开发环境的编辑器，用于编写Python程序。或者使用其他编写Python应用程序的IDE。 7-zip 用于解压“*.zip”和“*.rar”文件，支持7-Zip 16.04版本。安装Python 版本要求不低于3.6。父主题：准备Spark应用开发环境

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 准备Spark应用开发环境
内存不足导致HDFS NameNode启动失败 - MapReduce服务 MRS

查看NameNode的GC_OPTS参数配置 NameNode内存配置和数据量对应关系参考表1。表1 NameNode内存配置和数据量对应关系文件对象数量参考值 10,000,000 “-Xms6G -Xmx6G -XX:NewSize=512M -XX:MaxNewSize=512M”

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
ALM-24004 Flume读取数据异常（2.x及以前版本） - MapReduce服务 MRS

Source是否故障。确认Flume Source是否是spooldir类型。是，执行1.b。否，执行1.c。查看设置的spoolDir目录，是否所有的文件均已传输完毕。是，处理完毕。否，执行1.e。确认Flume Source是否是Kafka类型。是，执行1.d。否，执行1.e。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
配置Spark Streaming对接Kafka时数据后进先出功能 - MapReduce服务 MRS

级最低。应用重新启动后C段时间的任务启用流控功能。配置描述在Spark Driver端的“spark-defaults.conf”配置文件中进行设置。表1 参数说明参数说明默认值 spark.streaming.kafka.direct.lifo 配置是否开启Kafka后进先出功能。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Streaming企业级能力增强
查看FlinkServer作业健康状况 - MapReduce服务 MRS

集群运行正常，并已安装集群客户端。提交作业前，需配置“客户端安装路径/Flink/flink/conf/flink-conf.yaml”文件，开启作业注册到FlinkServer功能和作业告警功能，参数设置如下：表1 开启作业注册和作业告警功能参数值描述 job.register

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 管理FlinkServer作业
使用Hudi-Cli.sh操作Hudi表 - MapReduce服务 MRS

showpartitions --commit 20210127153356 20210127153356表示commit的时间戳，下同。查看指定commit写入的文件： commit showfiles --commit 20210127153356 比较两个表的commit信息差异： commits compare

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi
Set Digest函数 - MapReduce服务 MRS
Set Digest函数 - MapReduce服务 MRS

Set Digest函数概述 HetuEngine提供了几个处理MinHash技术的函数。 MinHash用于估计两个集合的Jaccard相似系数。它通常用于数据挖掘，用于大规模检测近乎相同的网页。通过使用这些信息，搜索引擎有效地避免了在搜索结果中显示两个几乎相同的网页。以下示例展示了如何使用Set

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
添加删除MRS集群组件 - MapReduce服务 MRS

添加删除MRS集群组件创建MRS集群时，用户可自行选择集群内包含的服务组件，集群创建成功后，管理员可通过管理控制台手动为MRS添加新的组件或者已删除的组件。仅MRS 3.1.2及之后的普通版本和MRS 3.1.2-LTS.3及之后LTS版本的自定义类型集群支持添加和删除组件。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群组件
创建FlinkServer作业写入数据至Kafka消息队列 - MapReduce服务 MRS

创建FlinkServer作业写入数据至Kafka消息队列本章节适用于MRS 3.1.2及之后的版本。操作场景本章节介绍Kafka作为source表或者sink表的DDL定义，以及创建表时使用的WITH参数和代码示例，并指导如何在FlinkServer作业管理页面操作。本示例以安全模式Kafka为例。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业
Spark从Hive读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序开发思路场景说明假定Hive的person表存储用户当天消费的金额信息，HBase的table2表存储用户历史消费的金额信息。现person表有记录name=1,account=100，表示用户1在当天消费金额为100元。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序
Spark Core内存调优 - MapReduce服务 MRS

Spark Core内存调优操作场景 Spark是内存计算框架，计算过程中内存不够对Spark的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存中RDD的大小来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的GC情况（在客户端的conf/spark-default

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优

总条数： 2544

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink性能调优规则 - MapReduce服务 MRS

Flume业务模型配置说明 - MapReduce服务 MRS

Flume业务配置指南 - MapReduce服务 MRS

十进制函数和操作符 - MapReduce服务 MRS

Hive CBO原理介绍 - MapReduce服务 MRS

Doris建表规范 - MapReduce服务 MRS

为什么从Yarn Web UI页面无法跳转到Spark Web UI界面 - MapReduce服务 MRS

使用Hudi-Cli.sh操作Hudi表 - MapReduce服务 MRS

配置Kafka后进先出 - MapReduce服务 MRS

准备Spark本地应用开发环境 - MapReduce服务 MRS

内存不足导致HDFS NameNode启动失败 - MapReduce服务 MRS

ALM-24004 Flume读取数据异常（2.x及以前版本） - MapReduce服务 MRS

配置Spark Streaming对接Kafka时数据后进先出功能 - MapReduce服务 MRS

查看FlinkServer作业健康状况 - MapReduce服务 MRS

使用Hudi-Cli.sh操作Hudi表 - MapReduce服务 MRS

Set Digest函数 - MapReduce服务 MRS

添加删除MRS集群组件 - MapReduce服务 MRS

创建FlinkServer作业写入数据至Kafka消息队列 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线