搜索_华为云

FlinkSQL Lookup算子复用 - MapReduce服务 MRS

5.0及以后版本。使用场景将Lookup Join的结果写入到多个sink端时，无需为每个sink复制一个Lookup join算子，提高作业的执行效率。使用方法配置Flink作业时，可通过在FlinkServer WebUI的Flink作业开发界面添加自定义参数“table

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
ClickHouse集群配置说明 - MapReduce服务 MRS

的高可用，每个集群定义多个分片，每个分片具有2个或2个以上副本。当某节点故障时，分片内其他主机节点上的副本可替代工作，保证服务能正常运行，提高集群的稳定性。本章节仅适用于MRS 3.1.0版本。集群配置登录集群Manager页面，选择“集群 > 服务 > ClickHouse

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse运维管理 > ClickHouse集群管理
配置HBase主备集群容灾 - MapReduce服务 MRS

配置HBase主备集群容灾操作场景 HBase集群容灾作为提高HBase集群系统高可用性的一个关键特性，为HBase提供了实时的异地数据容灾功能。它对外提供了基础的运维工具，包含灾备关系维护，重建，数据校验，数据同步进展查看等功能。为了实现数据的实时容灾，可以把本HBase集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase运维管理 > HBase集群容灾高可用
Storm Flux开发指引 - MapReduce服务 MRS

本章节只适用于MRS产品中Storm组件使用Flux框架提交和部署拓扑的场景。本章中描述的jar包的具体版本信息请以实际情况为准。 Flux框架是Storm提供的提高拓扑部署易用性的框架。通过Flux框架，用户可以使用yaml文件来定义和部署拓扑，并且最终通过storm jar命令来提交拓扑的一种方式，

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（安全模式） > Storm应用开发常见问题
Flink作业大小表Join能力增强 - MapReduce服务 MRS

Flink作业双流Join时存在大小表数据，通过内核broadcast策略确保小表数据发送到Join的task中，通过rebalance策略将大表数据打散到Join中，提高Flink SQL易用性，增强作业稳定性。图1 Flink作业大小表Join 在使用Flink SQL时，该特性通过hints方法指定J

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
配置HBase主备集群容灾 - MapReduce服务 MRS

配置HBase主备集群容灾操作场景 HBase集群容灾作为提高HBase集群系统高可用性的一个关键特性，为HBase提供了实时的异地数据容灾功能。对外提供了基础的运维工具，包含灾备关系维护、重建、数据校验、查看数据同步进展等功能。为了实现数据的实时容灾，可以把本HBase集群中

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase运维管理 > HBase集群容灾高可用
Storm Flux开发指引 - MapReduce服务 MRS

本章节只适用于Storm组件使用Flux框架提交和部署拓扑的场景。本章中描述的jar包的具体版本信息请以实际情况为准。 Flux框架是Storm提供的提高拓扑部署易用性的框架。通过Flux框架，用户可以使用yaml文件来定义和部署拓扑，并且最终通过storm jar命令来提交拓扑的一种方式，

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发常见问题
配置AM自动调整分配内存 - MapReduce服务 MRS

启动该配置的过程中，ApplicationMaster在创建container时，分配的内存会根据任务总数的浮动自动调整，资源利用更加灵活，提高了客户端应用运行的容错性。配置描述参数入口：在Manager系统中，选择“集群 > 待操作集群的名称 > 服务 > Yarn > 配

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn企业级能力增强
快速创建和使用ClickHouse列式数据库集群 - MapReduce服务 MRS

集群实际使用时长计费。区域华北-北京四选择区域。不同区域的云服务产品之间内网互不相通。请就近选择靠近您业务的区域，可减少网络时延，提高访问速度。集群名称 mrs_demo 待创建的MRS集群名称。集群类型自定义根据业务实际需要选择待创建的MRS集群类型。“自定义”

帮助中心 > MapReduce服务 MRS > 快速入门
HBase JVM参数优化说明 - MapReduce服务 MRS

当集群数据量达到一定规模后，JVM的默认配置将无法满足集群的业务需求，轻则集群变慢，重则集群服务不可用。所以需要根据实际的业务情况进行合理的JVM参数配置，提高集群性能。操作步骤参数入口： HBase角色相关的JVM参数需要配置在安装有HBase服务的节点的“${BIGDATA_HOME}/F

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase性能调优
Spark SQL join优化 - MapReduce服务 MRS

SQL中，当对两个表进行join操作时，利用Broadcast特性（请参见使用广播变量），将小表BroadCast到各个节点上，从而转变成非shuffle操作，提高任务执行性能。这里join操作，只指inner join。操作步骤在Spark SQL中进行Join操作时，可以按照以下步骤进行优化

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > SQL和DataFrame调优
Spark SQL join优化 - MapReduce服务 MRS

SQL中，当对两个表进行join操作时，利用Broadcast特性（见“使用广播变量”章节），将被广播的表BroadCast到各个节点上，从而转变成非shuffle操作，提高任务执行性能。这里join操作，只指inner join。操作步骤在Spark SQL中进行Join操作时，可以按照以下步骤进行优化

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
CarbonData - MapReduce服务 MRS
CarbonData - MapReduce服务 MRS

CarbonData CarbonData是一种新型的Apache Hadoop本地文件格式，使用先进的列式存储、索引、压缩和编码技术，以提高计算效率，有助于加速超过PB数量级的数据查询，可用于更快的交互查询。同时，CarbonData也是一种将数据源与Spark集成的高性能分析引擎。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
聚合算法优化 - MapReduce服务 MRS

聚合算法优化操作场景在Spark SQL中支持基于行的哈希聚合算法，即使用快速聚合hashmap作为缓存，以提高聚合性能。hashmap替代了之前的ColumnarBatch支持，从而避免拥有聚合表的宽模式（大量key字段或value字段）时产生的性能问题。操作步骤要启动

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
Spark SQL join优化 - MapReduce服务 MRS

SQL中，当对两个表进行join操作时，利用Broadcast特性（见“使用广播变量”章节），将被广播的表BroadCast到各个节点上，从而转变成非shuffle操作，提高任务执行性能。这里join操作，只指inner join。操作步骤在Spark SQL中进行Join操作时，可以按照以下步骤进行优化

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
配置ClickHouse元数据预先缓存到内存 - MapReduce服务 MRS

1-LTS及之后版本。操作场景在业务表数量以及表数据量比较大的场景下，滚动重启过程中加载元数据比较耗时，可通过RocksDB将元数据预先缓存到内存，从而提高元数据的加载效率。开启表元数据预先缓存能力用户可以设置参数use_metadata_cache值为1或者为true，通过RocksDB将元数据预先缓存到内存。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse企业级能力增强
建立Hive表分区提升查询效率 - MapReduce服务 MRS

Hive在做Select查询时，一般会扫描整个表内容，会消耗较多时间去扫描不关注的数据。此时，可根据业务需求及其查询维度，建立合理的表分区，从而提高查询效率。操作步骤以root用户登录已安装Hive客户端的节点。执行以下命令，进入客户端安装目录，例如“/opt/client”。 cd

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
HBase JVM参数优化说明 - MapReduce服务 MRS

当集群数据量达到一定规模后，JVM的默认配置将无法满足集群的业务需求，轻则集群变慢，重则集群服务不可用。所以需要根据实际的业务情况进行合理的JVM参数配置，提高集群性能。操作步骤参数入口： HBase角色相关的JVM参数需要配置在安装有HBase服务的节点的“${BIGDATA_HOME}/F

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase性能调优
聚合算法优化 - MapReduce服务 MRS

聚合算法优化操作场景在Spark SQL中支持基于行的哈希聚合算法，即使用快速聚合hashmap作为缓存，以提高聚合性能。hashmap替代了之前的ColumnarBatch支持，从而避免拥有聚合表的宽模式（大量key字段或value字段）时产生的性能问题。操作步骤要启动

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
使用Hive CBO功能优化查询效率 - MapReduce服务 MRS

在Hive中执行多表Join时，Hive支持开启CBO（Cost Based Optimization），系统会自动根据表的统计信息，例如数据量、文件数等，选出合适计划提高多表Join的效率。Hive需要先收集表的统计信息后才能使CBO正确的优化。 CBO优化器会基于统计信息和查询条件，尽可能地使join顺序

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优

总条数： 473

上一页
1
2
3
4
5
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

FlinkSQL Lookup算子复用 - MapReduce服务 MRS

ClickHouse集群配置说明 - MapReduce服务 MRS

配置HBase主备集群容灾 - MapReduce服务 MRS

Storm Flux开发指引 - MapReduce服务 MRS

Flink作业大小表Join能力增强 - MapReduce服务 MRS

配置HBase主备集群容灾 - MapReduce服务 MRS

Storm Flux开发指引 - MapReduce服务 MRS

配置AM自动调整分配内存 - MapReduce服务 MRS

快速创建和使用ClickHouse列式数据库集群 - MapReduce服务 MRS

HBase JVM参数优化说明 - MapReduce服务 MRS

Spark SQL join优化 - MapReduce服务 MRS

Spark SQL join优化 - MapReduce服务 MRS

CarbonData - MapReduce服务 MRS

聚合算法优化 - MapReduce服务 MRS

Spark SQL join优化 - MapReduce服务 MRS

配置ClickHouse元数据预先缓存到内存 - MapReduce服务 MRS

建立Hive表分区提升查询效率 - MapReduce服务 MRS

HBase JVM参数优化说明 - MapReduce服务 MRS

聚合算法优化 - MapReduce服务 MRS

使用Hive CBO功能优化查询效率 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线