搜索_华为云

CarbonData调优思路 - MapReduce服务 MRS

要再加载其索引数据。在CarbonData中执行查询时，查询任务会被分成几个扫描任务。即，基于CarbonData数据存储的HDFS block对扫描任务进行分割。扫描任务由集群中的执行器执行。扫描任务可以并行、部分并行，或顺序处理，具体采用的方式取决于执行器的数量以及配置的执行器核数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData性能调优
配置HetuEngine SQL诊断功能 - MapReduce服务 MRS

HetuEngine SQL诊断功能介绍 HetuEngine QAS实例可对用户的SQL执行历史记录提供自动感知、自动学习、自动诊断服务，提升在线SQL运维能力，自动加速在线SQL分析任务，开启SQL诊断能力后，系统可实现如下能力：自动感知并向集群管理员展现不同时间周期范围内的租户级、用户级的S

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine
提升HBase实时读数据效率 - MapReduce服务 MRS

对于可以压缩的数据，配置压缩算法可以有效减少磁盘的IO，从而达到提高性能的目的。说明：并非所有数据都可以进行有效压缩。例如一张图片的数据，因为图片一般已经是压缩后的数据，所以压缩效果有限。常用的压缩算法是SNAPPY，因为它有较好的Encoding/Decoding速度和可以接受的压缩率。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase性能调优
CarbonData调优思路 - MapReduce服务 MRS

要再加载其索引数据。在CarbonData中执行查询时，查询任务会被分成几个扫描任务。即，基于CarbonData数据存储的HDFS block对扫描任务进行分割。扫描任务由集群中的执行器执行。扫描任务可以并行、部分并行，或顺序处理，具体采用的方式取决于执行器的数量以及配置的执行器核数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData性能调优
HBase启动后原生页面显示RegionServer个数多于实际个数 - MapReduce服务 MRS

HBase启动后，HMaster原生页面显示RegionServer个数多于实际RegionServer个数。查看HMaster原生页面，显示有4个RegionServer在线，如下图示：原因分析如下图可以看出，第三行hostname为controller-192-168-1-3节点和第四行hostname为

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HBase
优化小文件场景下的Spark SQL性能 - MapReduce服务 MRS

单位：byte。 134217728（即128M） spark.files.openCostInBytes 打开文件的预估成本，按照同一时间能够扫描的字节数来测量。当一个分区写入多个文件时使用。高估更好，这样小文件分区将比大文件分区更先被调度。 4M 父主题： Spark SQL性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
配置HetuEngine物化视图推荐能力 - MapReduce服务 MRS

务，开启物化视图推荐能力后，系统能自动学习并推荐对业务最有价值的物化视图SQL，使HetuEngine具备自动预计算加速能力，在相关场景下在线查询效率获得倍数提升，同时有效降低系统负载压力。前提条件集群运行正常并至少安装一个QAS实例。已创建用于访问HetuEngine W

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 配置HetuEngine物化视图
提升HBase实时读数据效率 - MapReduce服务 MRS

对于可以压缩的数据，配置压缩算法可以有效减少磁盘的IO，从而达到提高性能的目的。说明：并非所有数据都可以进行有效压缩。例如一张图片的数据，因为图片一般已经是压缩后的数据，所以压缩效果有限。常用的压缩算法是SNAPPY，因为它有较好的Encoding/Decoding速度和可以接受的压缩率。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase性能调优
使用TableIndexer工具生成HBase本地二级索引 - MapReduce服务 MRS

index：表示创建索引的表名称。 indexspecs.to.add：表示索引名对应表的列的映射关系。 scan.caching（可选）：包含一个整数值，表示在扫描数据表时将传递给扫描器的缓存行数。上述命令中的参数描述如下： idx_1：表示索引名称 cf_0：表示列族名称 q_0：表示列名称 string：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase企业级能力增强 > 配置HBase本地二级索引提升查询效率
使用TableIndexer工具生成HBase本地二级索引 - MapReduce服务 MRS

indexspecs.to.add：表示索引名与对应表的列的映射关系。 scan.caching（可选）：包含一个整数值，表示在扫描数据表时将传递给扫描器的缓存行数。上述命令中的参数描述如下： idx_1：表示索引名称。 cf_0：表示列族名称。 q_0：表示列名称。 stri

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 配置HBase本地二级索引提升查询效率
配置Hive SQL防御规则 - MapReduce服务 MRS

动态规则dynamic_0001（SQL语句扫描的文件数超过阈值），当Spark与Tez引擎达到提示阈值时拦截日志会在Yarn任务日志中打印，不支持在Beeline客户端输出。熔断规则存在统计误差，例如规则running_0004，扫描数据量阈值配置10GB，但是因为判断周期和任

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群SQL防御规则
查看MRS作业详情和日志 - MapReduce服务 MRS

查看MRS作业详情和日志用户通过管理控制台可在线查看当前MRS集群内所有作业的状态详情，以及作业的详细配置信息和运行日志信息。由于Spark SQL和Distcp作业在后台无日志，因此运行中的Spark SQL和Distcp作业不能在线查看运行日志信息。查看作业状态登录MRS管理控制台。

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业
Doris支持审计日志表功能 - MapReduce服务 MRS

query_time bigint 查询执行时间，单位为ms。 scan_bytes bigint 查询总共扫描的字节数。 scan_rows bigint 查询总共扫描的行数。 return_rows bigint 查询结果返回的行数。 stmt_id int 自增ID。 is_query

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris运维管理
添加MRS SQL防御规则 - MapReduce服务 MRS

table testtb1 on cluster default_cluster; dynamic_0001 扫描文件数超限制。 Hive Spark HetuEngine 计划/已经扫描的文件数量阈值。建议配置值：100000 SELECT ss_ticket_number FROM store_sales

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群SQL防御规则
运行SparkSubmit作业 - MapReduce服务 MRS

Spark是一个开源的并行数据处理框架，能够帮助用户简单、快速的开发，统一的大数据应用，对数据进行离线处理、流式处理、交互式分析等。用户可以在MRS管理控制台在线创建一个作业并提交运行，也可以通过MRS集群客户端来以命令行形式提交作业。前提条件用户已经将运行作业所需的程序包和数据文件上传至OBS系统或HDFS中。

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
Yarn运维管理 - MapReduce服务 MRS
Yarn运维管理 - MapReduce服务 MRS

Yarn常用配置参数 Yarn日志介绍配置Yarn本地化日志级别检测Yarn内存使用情况更改NodeManager的存储目录配置Yarn大作业扫描父主题：使用Yarn

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn
ClickHouse基本原理 - MapReduce服务 MRS

ClickHouse是一款使用列式存储的数据库，数据按列进行组织，属于同一列的数据会被保存在一起，列与列之间也会由不同的文件分别保存。在执行数据查询时，列式存储可以减少数据扫描范围和数据传输时的大小，提高了数据查询的效率。例如在传统的行式数据库系统中，数据按如下表1顺序存储：表1 行式数据库 row ID Flag

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > ClickHouse
增加Hive表字段超时 - MapReduce服务 MRS

在SQL前加explain (analyze,verbose,timing,costs,buffers)分析执行计划，发现执行时需要全表扫描。查看索引，发现不满足最左匹配原则。处理步骤重建索引。 su - omm gsql -p 20051 -U omm -W password

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

配置使用分布式缓存执行MapReduce任务配置场景本章节操作适用于MRS 3.x及之后版本。分布式缓存在两种情况下非常有用。滚动升级在升级过程中，应用程序必须保持文字内容（jar文件或配置文件）不变。而这些内容并非基于当前版本的Yarn，而是要基于其提交时的版本。一般情况下，应用程序（例如MapRedu

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce
配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

配置使用分布式缓存执行MapReduce任务配置场景本章节操作适用于MRS 3.x及之后版本。分布式缓存在两种情况下非常有用。滚动升级在升级过程中，应用程序必须保持文字内容（jar文件或配置文件）不变。而这些内容并非基于当前版本的Yarn，而是要基于其提交时的版本。一般情况下，应用程序（例如MapRedu

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce

总条数： 247

上一页
1
2
3
4
5
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CarbonData调优思路 - MapReduce服务 MRS

配置HetuEngine SQL诊断功能 - MapReduce服务 MRS

提升HBase实时读数据效率 - MapReduce服务 MRS

CarbonData调优思路 - MapReduce服务 MRS

HBase启动后原生页面显示RegionServer个数多于实际个数 - MapReduce服务 MRS

优化小文件场景下的Spark SQL性能 - MapReduce服务 MRS

配置HetuEngine物化视图推荐能力 - MapReduce服务 MRS

提升HBase实时读数据效率 - MapReduce服务 MRS

使用TableIndexer工具生成HBase本地二级索引 - MapReduce服务 MRS

使用TableIndexer工具生成HBase本地二级索引 - MapReduce服务 MRS

配置Hive SQL防御规则 - MapReduce服务 MRS

查看MRS作业详情和日志 - MapReduce服务 MRS

Doris支持审计日志表功能 - MapReduce服务 MRS

添加MRS SQL防御规则 - MapReduce服务 MRS

运行SparkSubmit作业 - MapReduce服务 MRS

Yarn运维管理 - MapReduce服务 MRS

ClickHouse基本原理 - MapReduce服务 MRS

增加Hive表字段超时 - MapReduce服务 MRS

配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线