搜索_华为云

Hive Group By语句优化 - MapReduce服务 MRS

Hive Group By语句优化操作场景优化Group by语句，可提升命令执行速度和查询速度。 Group by的时候， Map端会先进行分组，分组完后分发到Reduce端， Reduce端再进行分组。可采用Map端聚合的方式来进行Group by优化，开启Map端初步聚合，减少Map的输出数据量。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
Hive SQL逻辑优化 - MapReduce服务 MRS

Hive SQL逻辑优化操作场景在Hive上执行SQL语句查询时，如果语句中存在“(a&b) or (a&c)”逻辑时，建议将逻辑改为“a & (b or c)”。样例假设条件a为“p_partkey = l_partkey”，优化前样例如下所示： select

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
Flink Scala API接口介绍 - MapReduce服务 MRS

DataStream[String] 获取用户定义的Socket数据，作为输入流数据。 hostname是指Socket的服务器端的主机名称。 port指的是服务器的监测端口。 delimiter和maxRetry两个参数scala接口暂时不支持设置。 def addSource[T:

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > Flink应用开发常见问题 > Flink常用API介绍
Hive SQL扩展语法说明 - MapReduce服务 MRS

) [ROW FORMAT row_format] [STORED AS file_format] | STORED BY 'storage.handler.class.name' [WITH SERDEPROPERTIES (...) ] ...... [TBLPROPERTIES

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive常见SQL语法说明
ClickHouse日志介绍 - MapReduce服务 MRS

err.log ClickHouseServer服务运行错误日志文件路径。 /var/log/Bigdata/clickhouse/clickhouseServer/checkService.log ClickHouseServer服务运行关键日志文件路径。 /var/log/Bi

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse运维管理
SELECT查询表数据 - MapReduce服务 MRS

SELECT查询表数据本章节主要介绍ClickHouse查询表数据的SQL基本语法和使用说明。基本语法 SELECT [DISTINCT] expr_list [FROM [database_name.]table | (subquery) | table_function]

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse常用SQL语法
加速TTL操作 - MapReduce服务 MRS
加速TTL操作 - MapReduce服务 MRS

> ClickHouseServer > 自定义 > clickhouse-config-customize”，添加如下配置，保存配置，重启服务。配置项参考值作用 merge_tree.max_replicated_merges_with_ttl_in_queue CPU核数一半

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse性能调优
Hive负载均衡 - MapReduce服务 MRS
Hive负载均衡 - MapReduce服务 MRS

Hive负载均衡配置Hive任务的最大map数配置用户租约隔离访问指定节点的HiveServer 父主题： Hive企业级能力增强

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive企业级能力增强
Ranger权限策略配置示例 - MapReduce服务 MRS

Ranger权限策略配置示例添加HDFS的Ranger访问权限策略添加HBase的Ranger访问权限策略添加Hive的Ranger访问权限策略添加Impala的Ranger访问权限策略添加Yarn的Ranger访问权限策略添加Spark2x的Ranger访问权限策略

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Ranger（MRS 3.x）
开发Oozie应用 - MapReduce服务 MRS
开发Oozie应用 - MapReduce服务 MRS

开发Oozie应用开发Oozie配置文件 Oozie代码样例说明通过Java API提交Oozie作业使用Oozie调度Spark2x访问HBase以及Hive 父主题： Oozie开发指南（安全模式）

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（安全模式）
开发HDFS应用 - MapReduce服务 MRS
开发HDFS应用 - MapReduce服务 MRS

开发HDFS应用 HDFS样例程序开发思路初始化HDFS 创建HDFS目录创建HDFS文件并写入内容追加信息到HDFS指定文件读取HDFS指定文件内容删除HDFS指定文件删除HDFS指定目录创建HDFS多线程任务配置HDFS存储策略配置HDFS同分布策略（Colocation）

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（普通模式）
使用Presto客户端执行查询语句 - MapReduce服务 MRS

使用Presto客户端执行查询语句用户可以根据业务需要，在MRS集群的客户端中进行交互式查询。启用Kerberos认证的集群，需要提交拓扑的用户属于“presto”组。 MRS 3.x版本Presto组件暂不支持开启Kerberos认证。前提条件获取用户“admin”账号密

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Presto
使用Spark客户端 - MapReduce服务 MRS

使用Spark客户端 MRS集群创建完成后，可以通过客户端去创建和提交作业。客户端可以安装在集群内部节点或集群外部节点上：集群内部节点：MRS集群创建完成后，集群内的master和core节点默认已经安装好客户端，详情请参见集群内节点使用MRS客户端章节，登录安装客户端的节点。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark（MRS 3.x之前版本）
登录Ranger WebUI界面 - MapReduce服务 MRS

Admin：Ranger安全管理员，可查看Ranger所有管理页面内容，进行服务权限管理插件及权限访问控制策略的管理操作，可查看审计信息内容，可进行用户类型设置。 Auditor：Ranger审计管理员，可查看服务权限管理插件及权限访问控制策略的内容。 User：普通用户，可以被Ranger管理员赋予具体权限。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Ranger（MRS 3.x）
配置Flume加密传输数据采集任务 - MapReduce服务 MRS

配置Flume加密传输数据采集任务配置Flume加密传输使用多级agent串联从本地采集静态日志保存到HDFS 父主题：使用Flume

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume
Flume日志介绍 - MapReduce服务 MRS
Flume日志介绍 - MapReduce服务 MRS

如果您需要修改日志级别，请执行如下操作：请参考修改集群服务配置参数，进入Flume的“全部配置”页面。左边菜单栏中选择所需修改的角色所对应的日志菜单。选择所需修改的日志级别。保存配置，在弹出窗口中单击“确定”使配置生效。配置完成后即生效，不需要重启服务。日志格式 Flume的日志格式如下所示：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > Flume运维管理
Hudi数据表Archive规范 - MapReduce服务 MRS

Hudi数据表Archive规范 Archive（归档）是为了减轻Hudi读写元数据的压力，所有的元数据都存放在这个路径：Hudi表根目录/.hoodie目录，如果.hoodie目录下的文件数量超过10000就会发现Hudi表有非常明显的读写时延。规则 Hudi表必须执行Archive。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表管理操作规范
Spark读写Hudi资源配置建议 - MapReduce服务 MRS

Spark读写Hudi资源配置建议 Spark读写Hudi任务资源配置规则，内存和CPU核心的比例2:1，堆外内存和CPU核心比例0.5:1；即一个核心，需要2G堆内存，0.5G堆外内存 Spark初始化入库场景，由于处理的数据量比较大，上述资源配比需要调整，内存和Core的比例

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Spark on Hudi开发规范
开发Impala应用 - MapReduce服务 MRS

开发Impala应用 Impala样例程序开发思路创建Impala表加载Impala数据查询Impala数据开发Impala用户自定义函数 Impala样例程序指导父主题： Impala开发指南（安全模式）

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Impala开发指南（安全模式）
开发Alluxio应用 - MapReduce服务 MRS

开发Alluxio应用 Alluxio样例程序开发思路 Alluxio初始化写Alluxio文件读Alluxio文件父主题： Alluxio开发指南

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Alluxio开发指南

总条数： 6691

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hive Group By语句优化 - MapReduce服务 MRS

Hive SQL逻辑优化 - MapReduce服务 MRS

Flink Scala API接口介绍 - MapReduce服务 MRS

Hive SQL扩展语法说明 - MapReduce服务 MRS

ClickHouse日志介绍 - MapReduce服务 MRS

SELECT查询表数据 - MapReduce服务 MRS

加速TTL操作 - MapReduce服务 MRS

Hive负载均衡 - MapReduce服务 MRS

Ranger权限策略配置示例 - MapReduce服务 MRS

开发Oozie应用 - MapReduce服务 MRS

开发HDFS应用 - MapReduce服务 MRS

使用Presto客户端执行查询语句 - MapReduce服务 MRS

使用Spark客户端 - MapReduce服务 MRS

登录Ranger WebUI界面 - MapReduce服务 MRS

配置Flume加密传输数据采集任务 - MapReduce服务 MRS

Flume日志介绍 - MapReduce服务 MRS

Hudi数据表Archive规范 - MapReduce服务 MRS

Spark读写Hudi资源配置建议 - MapReduce服务 MRS

开发Impala应用 - MapReduce服务 MRS

开发Alluxio应用 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线