搜索_华为云

配置Yarn大作业扫描 - MapReduce服务 MRS

配置Yarn大作业扫描 Yarn大作业扫描功能主要用于监控Hive、HetuEngine、Spark等作业的本地临时文件（例如shuffle文件是否过大）、监控Hive、HetuEngine、Spark的关键HDFS目录（不支持OBS）是否过大。对于占用存储资源（本地磁盘或者关键HDFS目录）过大的作业上报事件。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn运维管理
SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

from test where b=xxx 原因分析按照设定，任务应该只扫描b=xxx的分区，但是查看任务日志可以发现，实际上任务却扫描了所有的分区再来计算b=xxx的数据，因此任务计算的很慢。并且因为需要扫描所有文件，会有大量的OBS请求发送。 MRS默认开启基于分区统计信息的执

 帮助中心 > MapReduce服务 MRS > 常见问题 > 作业管理类
在线检索MRS集群日志 - MapReduce服务 MRS

在线检索MRS集群日志 MRS集群Manager支持在线检索并显示组件的日志内容，用于问题定位等其他日志查看场景，管理员可在线按照节点范围或者组件角色范围快速检视所有日志，通过关键字分析快速定位问题。本章节操作仅支持MRS 3.x及之后的版本。在线检索日志登录FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 查看MRS集群日志
使用Spark小文件合并工具说明 - MapReduce服务 MRS

大量内存，还会大幅降低读写性能，延长作业运行时间。因此，小文件问题是制约Hadoop集群规模扩展的关键问题。本工具主要有如下两个功能：扫描表中有多少低于用户设定阈值的小文件，返回该表目录中所有数据文件的平均大小。对表文件提供合并功能，用户可设置合并后的平均文件大小。支持的表类型

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强
集群在线扩缩容 - MapReduce服务 MRS

集群在线扩缩容大数据集群的处理能力通常可以通过增加集群的节点数来横向扩展，当集群规模不符合业务要求时，用户可以通过该功能进行集群节点规模的调整，进行扩容或者缩容；在缩容节点时，MRS会智能地选择负载最少或者迁移数据量最小节点，并且在缩容过程中，缩容节点不再接收新的任务，正在执行

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能 > 集群管理
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

单位：byte。 134217728（即128M） spark.files.openCostInBytes 打开文件的预估成本，按照同一时间能够扫描的字节数来测量。当一个分区写入多个文件时使用。高估更好，这样小文件分区将比大文件分区更先被调度。 4M 父主题： Spark SQL性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
分布式Scan HBase表 - MapReduce服务 MRS

方式去操作HBase，使用hbaseRDD方法以特定的规则扫描HBase表。数据规划使用操作Avro格式数据章节中创建的hbase数据表。开发思路设置scan的规则，例如：setCaching。使用特定的规则扫描Hbase表。运行前置操作安全模式下Spark Core样例代码需要读取两个文件（user

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
分布式Scan HBase表 - MapReduce服务 MRS

方式去操作HBase，使用hbaseRDD方法以特定的规则扫描HBase表。数据规划使用操作Avro格式数据章节中创建的HBase数据表。开发思路设置scan的规则，例如：setCaching。使用特定的规则扫描Hbase表。打包项目通过IDEA自带的Maven工具

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
分布式Scan HBase表 - MapReduce服务 MRS

方式去操作HBase，使用hbaseRDD方法以特定的规则扫描HBase表。数据规划使用操作Avro格式数据章节中创建的hbase数据表。开发思路设置scan的规则，例如：setCaching。使用特定的规则扫描Hbase表。运行前置操作安全模式下Spark Core样例代码需要读取两个文件（user

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
分布式Scan HBase表 - MapReduce服务 MRS

方式去操作HBase，使用hbaseRDD方法以特定的规则扫描HBase表。数据规划使用操作Avro格式数据章节中创建的HBase数据表。开发思路设置scan的规则，例如：setCaching。使用特定的规则扫描Hbase表。打包项目通过IDEA自带的Maven工具

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
建立Hive表分区提升查询效率 - MapReduce服务 MRS

建立Hive表分区提升查询效率操作场景 Hive在做Select查询时，一般会扫描整个表内容，会消耗较多时间去扫描不关注的数据。此时，可根据业务需求及其查询维度，建立合理的表分区，从而提高查询效率。操作步骤以root用户登录已安装Hive客户端的节点。执行以下命令，进入客

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
建立Hive表分区提升查询效率 - MapReduce服务 MRS

建立Hive表分区提升查询效率操作场景 Hive在做Select查询时，一般会扫描整个表内容，会消耗较多时间去扫描不关注的数据。此时，可根据业务需求及其查询维度，建立合理的表分区，从而提高查询效率。操作步骤 MRS 3.x之前版本：登录MRS控制台，在左侧导航栏选择“现有集群”，单击集群名称。选择“节点管理

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
ALM-12015 设备分区文件系统只读 - MapReduce服务 MRS

ALM-12015 设备分区文件系统只读告警解释系统按60秒周期进行扫描，如果检测到挂载服务目录的设备分区变为只读模式（如设备有坏扇区、文件系统存在故障等原因），则触发此告警。系统如果检测到挂载服务目录的设备分区的只读模式消失（比如文件系统修复为读写模式、设备拔出、设备被重新格式化等原因），则告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12014 设备分区丢失 - MapReduce服务 MRS

ALM-12014 设备分区丢失告警解释系统按60秒周期进行扫描，如果检测到挂载服务目录的设备分区丢失（如由于设备拔出、设备离线、删除分区等原因）时，产生此告警。告警属性告警ID 告警级别是否自动清除 12014 重要是：MRS 3.3.0及之后版本、MRS 3.1.0

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12015 设备分区文件系统只读（2.x及以前版本） - MapReduce服务 MRS

ALM-12015 设备分区文件系统只读（2.x及以前版本）告警解释系统周期性进行扫描，如果检测到挂载服务目录的设备分区变为只读模式（如设备有坏扇区、文件系统存在故障等原因），则触发此告警。系统如果检测到挂载服务目录的设备分区的只读模式消失（比如文件系统修复为读写模式、设备

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
HBase本地二级索引介绍 - MapReduce服务 MRS

owkey查询数据，或者扫描指定rowkey范围内的数据，HBase可以快速查找到需要读取的数据，从而提高效率。在大多数实际情况下，会需要查询列值为XXX的数据。HBase提供了Filter功能来查询具有特定列值的数据：所有数据按RowKey的顺序进行扫描，然后将数据与特定的列值

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase企业级能力增强 > 配置HBase本地二级索引提升查询效率
ALM-12014 设备分区丢失（2.x及以前版本） - MapReduce服务 MRS

ALM-12014 设备分区丢失（2.x及以前版本）告警解释系统周期性进行扫描，如果检测到挂载服务目录的设备分区丢失（如由于设备拔出、设备离线、删除分区等原因）时，产生此告警。告警属性告警ID 告警级别可自动清除 12014 严重是：MRS 1.9.3.10及之后补丁版本

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
MERGE INTO - MapReduce服务 MRS
MERGE INTO - MapReduce服务 MRS

INTO命令，根据一张表或子查询的连接条件对另外一张表进行查询，连接条件匹配上的进行UPDATE或DELETE，无法匹配的执行INSERT。这个语法仅需要一次全表扫描就完成了全部同步工作，执行效率要高于INSERT＋UPDATE。命令格式 MERGE INTO tableIdentifier AS target_alias

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi DML语法说明
HBase开源增强特性 - MapReduce服务 MRS

式存储数据库。每张表的数据按照RowKey的字典顺序排序，因此，如果按照某个指定的RowKey去查询数据，或者指定某一个RowKey范围去扫描数据时，HBase可以快速定位到需要读取的数据位置，从而可以高效地获取到所需要的数据。在实际应用中，很多场景是查询某一个列值为“XXX”

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HBase
Broker Load导入任务的数据量超过阈值 - MapReduce服务 MRS

要通过调整Broker Load的导入参数来实现大文件的导入。处理步骤根据当前BE实例的个数和待导入文件的大小修改单个BE的任务的最大扫描量和最大并发数。操作如下：登录FusionInsight Manager，选择“集群 > 服务 > Doris”，在概览界面查看“Lea

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doirs故障排除

总条数： 231

上一页
1
2
3
4
5
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置Yarn大作业扫描 - MapReduce服务 MRS

SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

在线检索MRS集群日志 - MapReduce服务 MRS

使用Spark小文件合并工具说明 - MapReduce服务 MRS

集群在线扩缩容 - MapReduce服务 MRS

小文件优化 - MapReduce服务 MRS

分布式Scan HBase表 - MapReduce服务 MRS

分布式Scan HBase表 - MapReduce服务 MRS

分布式Scan HBase表 - MapReduce服务 MRS

分布式Scan HBase表 - MapReduce服务 MRS

建立Hive表分区提升查询效率 - MapReduce服务 MRS

建立Hive表分区提升查询效率 - MapReduce服务 MRS

ALM-12015 设备分区文件系统只读 - MapReduce服务 MRS

ALM-12014 设备分区丢失 - MapReduce服务 MRS

ALM-12015 设备分区文件系统只读（2.x及以前版本） - MapReduce服务 MRS

HBase本地二级索引介绍 - MapReduce服务 MRS

ALM-12014 设备分区丢失（2.x及以前版本） - MapReduce服务 MRS

MERGE INTO - MapReduce服务 MRS

HBase开源增强特性 - MapReduce服务 MRS

Broker Load导入任务的数据量超过阈值 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线