搜索_华为云

配置parquet表的压缩格式 - MapReduce服务 MRS

配置parquet表的压缩格式配置场景当前版本对于parquet表的压缩格式分以下两种情况进行配置：对于分区表，需要通过parquet本身的配置项“parquet.compression”设置parquet表的数据压缩格式。如在建表语句中设置tblproperties："parquet.compression

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强
配置Hive表分区动态覆盖 - MapReduce服务 MRS

配置Hive表分区动态覆盖配置场景在旧版本中，使用insert overwrite语法覆写分区表时，只支持对指定的分区表达式进行匹配，未指定表达式的分区将被全部删除。在spark2.3版本中，增加了对未指定表达式的分区动态匹配的支持，此种语法与Hive的动态分区匹配语法行为一致

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
配置通过ELB访问ClickHouse - MapReduce服务 MRS

配置通过ELB访问ClickHouse 当前ClickHouse不管是多分片还是多副本都是以集群方式部署，如果对外直接提供服务，将暴露多个节点服务，没有统一的访问入口。ClickHouse官方虽然提供了BalancedClickhouseDataSource的驱动方案，可以支持多节点的随机分配

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse企业级能力增强
Spark Distinct聚合优化 - MapReduce服务 MRS

配置场景当SQL中存在多个count(distinct)聚合函数，且存在cube，rollup等导致数据膨胀的算子时，使用该特性可以有效减少数据的膨胀倍数，且减少shuffle落盘的数据，从而获得性能提升。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
Spark Core样例程序（Scala） - MapReduce服务 MRS

Spark Core样例程序（Scala）功能简介统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。代码样例下面代码片段仅为演示，具体代码参见com.huawei.bigdata.spark.examples.FemaleInfoCollection：样例：类

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Core样例程序
BulkLoad工具配置文件说明 - MapReduce服务 MRS

BulkLoad工具配置文件说明配置自定义的组合rowkey 使用BulkLoad工具批量导入HBase数据时，支持用户自定义组合rowkey。BulkLoad组合rowkey即通过一些规则将多个列名经过一些自定义处理，组合生成新的rowkey。列的名称不能包含特殊字符，只能由字母

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase企业级能力增强 > 增强HBase BulkLoad工具数据迁移能力
配置ResourceManager重启后自动加载Container信息 - MapReduce服务 MRS

配置ResourceManager重启后自动加载Container信息配置场景 YARN Restart特性包含两部分内容：ResourceManager Restart和NodeManager Restart。当启用ResourceManager Restart时，升主后的ResourceManager

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn企业级能力增强
配置Hive单表动态视图的访问控制权限 - MapReduce服务 MRS

配置Hive单表动态视图的访问控制权限操作场景 MRS中安全模式下Hive可以创建一个视图并控制用户访问权限，支持授权给不同的用户访问，又可以限定不同用户只能访问的不同数据。在视图中，Hive可以通过获取当前客户端提交任务的用户的内置函数“current_user()”来进行过滤

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive企业级能力增强
配置ResourceManager重启后自动加载Container信息 - MapReduce服务 MRS

配置ResourceManager重启后自动加载Container信息配置场景 YARN Restart特性包含两部分内容：ResourceManager Restart和NodeManager Restart。当启用ResourceManager Restart时，升主后的ResourceManager

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn企业级能力增强
配置Hive单表动态视图的访问控制权限 - MapReduce服务 MRS

配置Hive单表动态视图的访问控制权限操作场景 MRS安全模式下Hive可以创建一个视图并控制用户访问权限，支持授权给不同的用户访问，又可以限定不同用户只能访问的不同数据。在视图中，Hive可以通过获取当前客户端提交任务的用户的内置函数“current_user()”来进行过滤

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive企业级能力增强
BulkLoad工具配置文件说明 - MapReduce服务 MRS

BulkLoad工具配置文件说明该章节主要介绍使用BulkLoad工具的其他配置操作以获取需要查看的数据。配置自定义的组合rowkey 使用BulkLoad工具批量导入HBase数据时，支持用户自定义组合rowkey。BulkLoad组合rowkey即通过一些规则将多个列名经过一些自定义处理

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 增强HBase BulkLoad工具数据迁移能力
配置流式读取Spark Driver执行结果 - MapReduce服务 MRS

配置流式读取Spark Driver执行结果配置场景在执行查询语句时，返回结果有可能会很大（10万数量以上），此时很容易导致JDBCServer OOM（Out of Memory）。因此，提供数据汇聚功能特性，在基本不牺牲性能的情况下尽力避免OOM。配置描述提供两种不同的数据汇聚功能配置选项

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
Oozie - MapReduce服务 MRS
Oozie - MapReduce服务 MRS

Tomcat Tomcat服务器是免费的开放源代码的Web应用服务器。 Hadoop组件底层执行Oozie编排流程的各个组件，包括MapReduce、Hive等。 Oozie原理 Oozie是一个工作流引擎服务器，用于运行MapReduce任务工作流。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
快速开发HBase应用 - MapReduce服务 MRS

下载样例工程的Maven工程源码和配置文件，并在本地配置好相关开发工具，可参考通过开源镜像站获取样例工程。根据集群版本选择对应的分支，下载并获取MRS相关样例工程。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
配置基于HTTPS/HTTP协议的REST接口 - MapReduce服务 MRS

配置基于HTTPS/HTTP协议的REST接口操作场景 WebHCat为Hive提供了对外可用的REST接口，开源社区版本默认使用HTTP协议。 MRS Hive支持使用更安全的HTTPS协议，并且可以在两种协议间自由切换。安全模式支持HTTPS和HTTP协议，普通模式只支持HTTP

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive企业级能力增强
配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

配置Spark SQL开启Adaptive Execution特性配置场景 Spark SQL Adaptive Execution特性用于使Spark SQL在运行过程中，根据中间结果优化后续执行流程，提高整体执行效率。当前已实现的特性如下：自动设置shuffle partition

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
使用Spark小文件合并工具说明 - MapReduce服务 MRS

使用Spark小文件合并工具说明工具介绍在Hadoop大规模生产集群中，由于HDFS的元数据都保存在NameNode的内存中，集群规模受制于NameNode单点的内存限制。如果HDFS中有大量的小文件，会消耗NameNode大量内存，还会大幅降低读写性能，延长作业运行时间。因此

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强
使用Flume客户端加密工具 - MapReduce服务 MRS

使用Flume客户端加密工具安装Flume客户端后，配置文件的部分参数可能需要填写加密的字符，Flume客户端中提供了加密工具。安装Flume客户端。登录安装Flume客户端的节点，并切换到客户端安装目录。例如“/opt/FlumeClient”。切换到以下目录 cd fusioninsight-flume-Flume

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > Flume企业级能力增强
配置自定义调度器的WebUI - MapReduce服务 MRS

配置自定义调度器的WebUI 配置场景如果用户在ResourceManager中配置了自定义的调度器，可以通过以下配置项为其配置相应的Web展示页面及其他Web应用。配置描述参考修改集群服务配置参数进入Yarn服务参数“全部配置”界面，在搜索框中输入参数名称。表1 配置自定义调度器的

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn企业级能力增强
配置DataNode预留磁盘百分比 - MapReduce服务 MRS

配置DataNode预留磁盘百分比配置场景当Yarn本地目录和DataNode目录配置在同一个磁盘时，具有较大容量的磁盘可以运行更多的任务，因此将有更多的中间数据存储在Yarn本地目录。目前DataNode支持通过配置“dfs.datanode.du.reserved”来配置预留磁盘空间大小

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS企业级能力增强

总条数： 656

上一页
1
...
13
14
15
...
33
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置parquet表的压缩格式 - MapReduce服务 MRS

配置Hive表分区动态覆盖 - MapReduce服务 MRS

配置通过ELB访问ClickHouse - MapReduce服务 MRS

Spark Distinct聚合优化 - MapReduce服务 MRS

Spark Core样例程序（Scala） - MapReduce服务 MRS

BulkLoad工具配置文件说明 - MapReduce服务 MRS

配置ResourceManager重启后自动加载Container信息 - MapReduce服务 MRS

配置Hive单表动态视图的访问控制权限 - MapReduce服务 MRS

配置ResourceManager重启后自动加载Container信息 - MapReduce服务 MRS

配置Hive单表动态视图的访问控制权限 - MapReduce服务 MRS

BulkLoad工具配置文件说明 - MapReduce服务 MRS

配置流式读取Spark Driver执行结果 - MapReduce服务 MRS

Oozie - MapReduce服务 MRS

快速开发HBase应用 - MapReduce服务 MRS

配置基于HTTPS/HTTP协议的REST接口 - MapReduce服务 MRS

配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

使用Spark小文件合并工具说明 - MapReduce服务 MRS

使用Flume客户端加密工具 - MapReduce服务 MRS

配置自定义调度器的WebUI - MapReduce服务 MRS

配置DataNode预留磁盘百分比 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线