搜索_华为云

Spark Streaming性能调优 - MapReduce服务 MRS

Spark Streaming性能调优操作场景 Streaming作为一种mini-batch方式的流式处理框架，它主要的特点是：秒级时延和高吞吐量。因此Streaming调优的目标：在秒级延迟的情景下，提高Streaming的吞吐能力，在单位时间处理尽可能多的数据。本章节适用于输入数据源为Kafka的使用场景。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
添加MRS节点引导操作安装第三方软件 - MapReduce服务 MRS

添加MRS节点引导操作安装第三方软件引导操作安装第三方软件前提条件已参考准备MRS节点引导操作脚本准备好引导操作脚本。创建集群时添加引导操作进入购买MRS集群页面。在购买集群页面，选择“自定义购买”。参考自定义购买MRS集群配置集群软件配置和硬件配置信息。在“高级配

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群节点 > 配置MRS集群节点引导操作
配置SparkSQL的分块个数 - MapReduce服务 MRS

配置SparkSQL的分块个数配置场景 SparkSQL在进行shuffle操作时默认的分块数为200。在数据量特别大的场景下，使用默认的分块数就会造成单个数据块过大。如果一个任务产生的单个shuffle数据块大于2G，该数据块在被fetch的时候还会报类似错误： Adjusted

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
配置对接Kafka可靠性 - MapReduce服务 MRS

配置对接Kafka可靠性配置场景 Spark Streaming对接Kafka时，当Spark Streaming应用重启后，应用根据上一次读取的topic offset作为起始位置和当前topic最新的offset作为结束位置从Kafka上读取数据的。 Kafka服务的top

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Streaming企业级能力增强
配置矢量化读取ORC数据 - MapReduce服务 MRS

配置矢量化读取ORC数据配置场景 ORC文件格式是一种Hadoop生态圈中的列式存储格式，它最初产生自Apache Hive，用于降低Hadoop数据存储空间和加速Hive查询速度。和Parquet文件格式类似，它并不是一个单纯的列式存储格式，仍然是首先根据行组分割整个表，在每

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
配置Hive表分区动态覆盖 - MapReduce服务 MRS

配置Hive表分区动态覆盖配置场景在旧版本中，使用insert overwrite语法覆写分区表时，只支持对指定的分区表达式进行匹配，未指定表达式的分区将被全部删除。在spark2.3版本中，增加了对未指定表达式的分区动态匹配的支持，此种语法与Hive的动态分区匹配语法行为一致。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
配置基于HTTPS/HTTP协议的REST接口 - MapReduce服务 MRS

配置基于HTTPS/HTTP协议的REST接口操作场景 WebHCat为Hive提供了对外可用的REST接口，开源社区版本默认使用HTTP协议。 MRS Hive支持使用更安全的HTTPS协议，并且可以在两种协议间自由切换。安全模式支持HTTPS和HTTP协议，普通模式只支持HTTP协议。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive企业级能力增强
FlinkSQL JSON_VALUE函数性能优化 - MapReduce服务 MRS

FlinkSQL JSON_VALUE函数性能优化本章节适用于MRS 3.5.0及以后版本。使用场景内置JSON_VALUE函数解析一个JSON item的多个字段时，复用上次JSON item的解析结果，提升算子性能。使用方法配置Flink作业时，可通过在FlinkServer

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
配置HBase冷热数据分离存储 - MapReduce服务 MRS

配置HBase冷热数据分离存储在海量大数据场景下，HBase表中的部分业务数据随着时间的推移仅作为归档数据或者访问频率很低，同时这部分历史数据体量非常大，比如订单数据或者监控数据，如果降低这部分数据的存储成本将会极大的节省企业的成本。 HBase支持冷热分离功能，将数据分类存储

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 配置HBase冷热分离
HBase冷热分离相关命令介绍 - MapReduce服务 MRS

HBase冷热分离相关命令介绍此章节主要介绍HBase冷热分离相关命令的使用，包括Shell命令和Java API命令。 Shell命令在HBase客户端执行，需提前安装HBase客户端，详情请参见安装MRS客户端。设置HBase表的冷热分界线 Shell 创建冷热分离表。 create

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 配置HBase冷热分离
配置Spark小文件自动合并 - MapReduce服务 MRS

配置Spark小文件自动合并配置场景小文件自动合并特性开启后，Spark将数据先写入临时目录，再去检测每个分区的平均文件大小是否小于16MB（默认值）。如果发现平均文件大小小于16MB，则认为分区下有小文件，Spark会启动一个Job合并这些小文件，并将合并后的大文件写入到最终的表目录下。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
配置ClickHouse对接开源ClickHouse - MapReduce服务 MRS

配置ClickHouse对接开源ClickHouse 本章节适用于MRS 3.3.0-LTS.1及之后版本。操作场景在普通模式（未开启Kerberos认证）下对接开源或其他厂商ClickHouse时候，需设置参数“CLICKHOUSE_OPENSOURCE_COMMUNITY

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse企业级能力增强
配置Spark HA增强高可用 - MapReduce服务 MRS

配置Spark HA增强高可用配置多主实例模式配置Spark多租户模式配置多主实例与多租户模式切换父主题： Spark Core企业级能力增强

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
配置Hive目录旧数据自动移除至回收站 - MapReduce服务 MRS

配置Hive目录旧数据自动移除至回收站操作场景此功能适用于Hive组件。开启此功能后，执行写目录：insert overwrite directory "/path1" ...，写成功之后，会将旧数据移除到回收站，并且同时限制该目录不能为Hive元数据库中已经存在的数据库路径。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive企业级能力增强
配置Hive插入数据到不存在的目录中 - MapReduce服务 MRS

配置Hive插入数据到不存在的目录中操作场景此功能适用于Hive组件。开启此功能后，在执行写目录：insert overwrite directory “/path1/path2/path3” ...时，其中“/path1/path2”目录权限为700且属主为当前用户，“p

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive企业级能力增强
配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

配置Spark SQL开启Adaptive Execution特性配置场景 Spark SQL Adaptive Execution特性用于使Spark SQL在运行过程中，根据中间结果优化后续执行流程，提高整体执行效率。当前已实现的特性如下：自动设置shuffle partition数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
配置Spark读写Doris数据 - MapReduce服务 MRS

配置Spark读写Doris数据 Spark Doris Connector可以支持通过Spark读取Doris中存储的数据，也支持通过Spark写入数据到Doris中。支持从Doris中读取数据支持Spark DataFrame批量/流式写入Doris。可以将Doris表

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris企业级能力增强 > 配置Doris支持多源数据
配置Hive插入数据到不存在的目录中 - MapReduce服务 MRS

配置Hive插入数据到不存在的目录中开启Hive能插入数据到不存在的目录中的功能，可以执行写目录insert overwrite directory “/path1/path2/path3” ...命令，“/path1/path2”目录权限为700且属主为当前用户，“path3

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive企业级能力增强
配置Hive任务的最大map数 - MapReduce服务 MRS

配置Hive任务的最大map数 “hive.mapreduce.per.task.max.splits”参数可用于从服务端限定Hive任务的最大map数，避免HiveSever服务过载而引发的性能问题。操作步骤登录FusionInsight Manager页面，选择“集群 >

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive企业级能力增强 > Hive负载均衡
查看ClickHouse复制表数据同步监控 - MapReduce服务 MRS

查看ClickHouse复制表数据同步监控操作场景 Replicated*MergeTree系列引擎表同分片下的多个副本数据相互进行同步，MRS针对该场景下的表数据同步进行了状态监控。约束限制当前只支持Replicated*MergeTree系列引擎表并且建表语句携带ON CLUSTER关键字的表监控查询。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse企业级能力增强

总条数： 1402

上一页
1
...
13
14
15
...
71
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Streaming性能调优 - MapReduce服务 MRS

添加MRS节点引导操作安装第三方软件 - MapReduce服务 MRS

配置SparkSQL的分块个数 - MapReduce服务 MRS

配置对接Kafka可靠性 - MapReduce服务 MRS

配置矢量化读取ORC数据 - MapReduce服务 MRS

配置Hive表分区动态覆盖 - MapReduce服务 MRS

配置基于HTTPS/HTTP协议的REST接口 - MapReduce服务 MRS

FlinkSQL JSON_VALUE函数性能优化 - MapReduce服务 MRS

配置HBase冷热数据分离存储 - MapReduce服务 MRS

HBase冷热分离相关命令介绍 - MapReduce服务 MRS

配置Spark小文件自动合并 - MapReduce服务 MRS

配置ClickHouse对接开源ClickHouse - MapReduce服务 MRS

配置Spark HA增强高可用 - MapReduce服务 MRS

配置Hive目录旧数据自动移除至回收站 - MapReduce服务 MRS

配置Hive插入数据到不存在的目录中 - MapReduce服务 MRS

配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

配置Spark读写Doris数据 - MapReduce服务 MRS

配置Hive插入数据到不存在的目录中 - MapReduce服务 MRS

配置Hive任务的最大map数 - MapReduce服务 MRS

查看ClickHouse复制表数据同步监控 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线