搜索_华为云

Spark SQL join优化 - MapReduce服务 MRS

、B表都有个名为name的列。对A、B表进行join操作。估计表的大小。根据每次加载数据的大小，来估计表大小。也可以在Hive的数据库存储路径下直接查看表的大小。首先在Spark的配置文件“hive-site.xml”中，查看Hive的数据库路径的配置，默认为“/user/

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
使用CDL从Hudi同步数据到DWS - MapReduce服务 MRS

作业参数配置完成后，拖拽图标将作业进行关联，然后单击“保存”，作业配置完成。在“作业管理”的作业列表中，找到创建的作业名称，单击操作列的“启动”，等待作业启动。观察数据传输是否生效，例如在Hudi中对表进行插入数据操作，查看DWS导入的文件内容。父主题：创建CDL作业

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > 创建CDL作业
配置Doris冷热分离 - MapReduce服务 MRS

委托名称：填写委托名称，例如：agency-MRS-to-OBS。委托类型：选择“普通账号”。委托的账号：填写本用户的云账号，即使用手机号开通的账号，不能是联邦用户或者IAM用户。持续时间：选择“永久”。在弹出授权页面的搜索框内，搜索3新建的自定义策略，并勾选该策略，例如“doris-policy”。单击

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris企业级能力增强 > Doris冷热分离
场景说明 - MapReduce服务 MRS
场景说明 - MapReduce服务 MRS

场景说明场景说明假定用户有某个周末网民网购停留时间的日志文本，基于某些业务要求，要求开发Spark应用程序实现如下功能：统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。周末两天的日志文件第一列为姓名，第二列为性别，第三列为本次停留时间，单位为分钟，分隔符为“

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark Core程序
Tez日志介绍 - MapReduce服务 MRS
Tez日志介绍 - MapReduce服务 MRS

log TezUI进程的运行日志 tezui-omm-<日期>-gc.log.<编号> TezUI进程的GC日志 prestartDetail.log TezUI启动前的工作日志 check-serviceDetail.log TezUI服务启动是否成功的检查日志 postinstallDetail

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Tez
管理Kafka集群 - MapReduce服务 MRS
管理Kafka集群 - MapReduce服务 MRS

添加集群到KafkaManager的WebUI界面更新集群参数删除KafkaManager的WebUI界面的集群添加集群到KafkaManager的WebUI界面首次创建Kafka集群后会在KafkaManager的WebUI界面创建名为my-cluster的默认Kafka集群，用户

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用KafkaManager
Hive应用开发环境简介 - MapReduce服务 MRS

若使用Oracle JDK，请确保Eclipse中的JDK配置为Oracle JDK。不同的Eclipse不要使用相同的workspace和相同路径下的示例工程。网络确保客户端与Hive服务主机在网络上互通。父主题：准备Hive应用开发环境

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Hive开发指南 > 准备Hive应用开发环境
安全加固 - MapReduce服务 MRS
安全加固 - MapReduce服务 MRS

务器和应用的威胁。出于安全考虑，更改“maxHttpHeaderSize”的取值，给服务器管理员更大的可控性，以控制客户端不正常的请求行为。安装Tomcat后，修改Tomcat版本描述文件。为了避免暴露Tomcat自身的信息，更改Connector的Server属性值，使攻击者不易获知服务器的相关信息。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 安全
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

Int)相同，会将数据通过Shuffle的方式重新分区；当shuffle为false的时候，则只是简单的将父RDD的多个partition合并到同一个task进行计算，shuffle为false时，如果numPartitions大于父RDD的切片数，那么分区不会重新调整。遇到下列场景，可选择使用coalesce算子：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
配置并导入Flink样例工程 - MapReduce服务 MRS

Files”页面，选中“lib”目录下的所有Jar包，然后单击“OK”。 Flink相关的依赖包：选择“lib”目录下的所有Jar包。或者可以根据不同样例工程，最小化选择其对应的Jar包。当样例代码使用其他MRS组件时，请去对应MRS组件的服务端安装目录查找并添加依赖包。图19

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > 准备Flink应用开发环境
合并CBO优化 - MapReduce服务 MRS
合并CBO优化 - MapReduce服务 MRS

SQL默认支持基于规则的优化，但仅仅基于规则优化不能保证Spark选择合适的查询计划。CBO（Cost-Bsed Optimizer）是一种为SQL智能选择查询计划的技术。通过配置开启CBO后，CBO优化器可以基于表和列的统计信息，进行一系列的估算，最终选择出合适的查询计划。操作步骤要使用CBO优化，可以按照以下步骤进行优化。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
合并CBO优化 - MapReduce服务 MRS
合并CBO优化 - MapReduce服务 MRS

SQL默认支持基于规则的优化，但仅仅基于规则优化不能保证Spark选择合适的查询计划。CBO（Cost-Bsed Optimizer）是一种为SQL智能选择查询计划的技术。通过配置开启CBO后，CBO优化器可以基于表和列的统计信息，进行一系列的估算，最终选择出合适的查询计划。操作步骤要使用CBO优化，可以按照以下步骤进行优化。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
场景说明 - MapReduce服务 MRS
场景说明 - MapReduce服务 MRS

场景说明场景说明假定用户有某个周末网民网购停留时间的日志文本，基于某些业务要求，要求开发Spark应用程序实现如下功能：实时统计连续网购时间超过半个小时的女性网民信息。周末两天的日志文件第一列为姓名，第二列为性别，第三列为本次停留时间，单位为分钟，分隔符为“,”。 log1

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark Streaming程序
场景说明 - MapReduce服务 MRS
场景说明 - MapReduce服务 MRS

场景说明场景说明假定用户有某个周末网民网购停留时间的日志文本，基于某些业务要求，要求开发Spark应用程序实现如下功能：统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。周末两天的日志文件第一列为姓名，第二列为性别，第三列为本次停留时间，单位为分钟，分隔符为“

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark SQL程序
Ranger界面添加或者修改HBase策略时，无法使用通配符搜索已存在的HBase表 - MapReduce服务 MRS

Ranger界面添加或者修改HBase策略时，无法使用通配符搜索已存在的HBase表问题添加HBase的Ranger访问权限策略时，在策略中使用通配符搜索已存在的HBase表时，搜索不到已存在的表，并且在/var/log/Bigdata/ranger/rangeradmin/

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Ranger（MRS 3.x） > Ranger常见问题
MRS 2.1.0.2补丁说明 - MapReduce服务 MRS

1.0.2补丁安装后，需要重新下载安装全量的客户端，包含Master节点的原始客户端和虚拟私有云的其他节点使用的客户端（即您自行搭建的客户端）。主备Master节点的原始客户端全量更新，请参见更新客户端配置（2.x及之前版本）。自行搭建的客户端全量安装方法，请参见安装客户端（2

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明
配置HBase权限策略时无法使用通配符搜索已存在的HBase表 - MapReduce服务 MRS

配置HBase权限策略时无法使用通配符搜索已存在的HBase表问题添加HBase的Ranger访问权限策略时，在策略中使用通配符搜索已存在的HBase表时，搜索不到已存在的表，并且在/var/log/Bigdata/ranger/rangeradmin/ranger-admin-*log中报以下错误

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Ranger > Ranger故障排除
Presto应用开发环境简介 - MapReduce服务 MRS

若使用Oracle JDK，请确保Eclipse中的JDK配置为Oracle JDK。不同的Eclipse不要使用相同的workspace和相同路径下的示例工程。网络确保客户端与Presto服务主机在网络上互通。父主题：准备Presto应用开发环境

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Presto开发指南 > 准备Presto应用开发环境
准备本地应用开发环境 - MapReduce服务 MRS

在弹性云服务器管理控制台，申请一个新的弹性云服务器，用于用户应用程序开发、运行、调测。弹性云服务器的安全组需要和MRS集群Master节点的安全组相同。弹性云服务器的VPC需要与MRS集群在同一个VPC中。弹性云服务器的网卡需要与MRS集群在同一个网段中。申请弹性IP，绑定新申请的弹性云主机IP，并配置安全组出入规则。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Hive开发指南 > 准备Hive应用开发环境
使用HDFS - MapReduce服务 MRS
使用HDFS - MapReduce服务 MRS

通过公网IP连接使用HDFS客户端报错使用Python远程连接HDFS的端口失败 HDFS容量达到100%导致上层服务HBase、Spark等不可用启动HDFS和Yarn服务报错“Permission denied” HDFS用户可在其他用户目录下创建或删除文件 HDFS的DataNode一直显示退服中内存不足导致HDFS

帮助中心 > MapReduce服务 MRS > 故障排除

总条数： 4569

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark SQL join优化 - MapReduce服务 MRS

使用CDL从Hudi同步数据到DWS - MapReduce服务 MRS

配置Doris冷热分离 - MapReduce服务 MRS

场景说明 - MapReduce服务 MRS

Tez日志介绍 - MapReduce服务 MRS

管理Kafka集群 - MapReduce服务 MRS

Hive应用开发环境简介 - MapReduce服务 MRS

安全加固 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

配置并导入Flink样例工程 - MapReduce服务 MRS

合并CBO优化 - MapReduce服务 MRS

合并CBO优化 - MapReduce服务 MRS

场景说明 - MapReduce服务 MRS

场景说明 - MapReduce服务 MRS

Ranger界面添加或者修改HBase策略时，无法使用通配符搜索已存在的HBase表 - MapReduce服务 MRS

MRS 2.1.0.2补丁说明 - MapReduce服务 MRS

配置HBase权限策略时无法使用通配符搜索已存在的HBase表 - MapReduce服务 MRS

Presto应用开发环境简介 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

使用HDFS - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线