搜索_华为云

优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

spark.sql.adaptive.skewJoin.enabled 当此配置为true且spark.sql.adaptive.enabled设置为true时，启用运行时自动处理join运算中的数据倾斜功能。 true spark.sql.adaptive.skewJoin.skewedPartitionFactor

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
Spark从Hive读取数据再写入HBase样例程序（Java） - MapReduce服务 MRS

int resultValue = hiveValue + Integer.valueOf(hbaseValue); // 设置结果到put对象 put.addColumn(Bytes.toBytes(columnFamily), Bytes.toBytes("cid")

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序
Spark Java API接口介绍 - MapReduce服务 MRS

rk的各种功能，如连接Spark集群，创建RDD，累积量和广播量等。它的作用相当于一个容器。 SparkConf：Spark应用配置类，如设置应用名称，执行模式，executor内存等。 JavaRDD：用于在java应用中定义JavaRDD的类，功能类似于scala中的RDD(Resilient

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
使用Hive CBO功能优化多表查询效率 - MapReduce服务 MRS

使用Hive CBO功能优化多表查询效率操作场景在Hive中执行多表Join时，Hive支持开启CBO（Cost Based Optimization），系统会自动根据表的统计信息，例如数据量、文件数等，选出合适计划提高多表Join的效率。Hive需要先收集表的统计信息后才能使CBO正确的优化。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
ImportTsv工具执行失败报“Permission denied”异常 - MapReduce服务 MRS

用户，例如admin用户）不具备该目录的rwx权限。上述问题可通过执行以下步骤解决：在客户端将“hbase.fs.tmp.dir”参数设置为当前kerberos用户的目录（如“/user/admin/hbase-staging”），或者为客户端（kerberos用户）提供已配置的目录所必需的rwx权限。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase故障排除
Spark应用开发规则 - MapReduce服务 MRS

分布式模式下，应注意Driver和Executor之间的参数传递在Spark编程时，总是有一些代码逻辑中需要根据输入参数来判断，这种时候往往会使用这种方式，将参数设置为全局变量，先给定一个空值（null），在main函数中，实例化SparkContext对象之前对这个变量赋值。然而，在分布式模式下，执行

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Spark应用开发规范
如何采用Java命令提交Spark应用 - MapReduce服务 MRS

println(s"Finished! Exit code is $exitCode") } 根据业务逻辑，开发对应的Spark应用程序，并设置用户编写的Spark应用程序的主类等常数。如果您使用的是普通模式，准备业务应用代码及其相关配置即可。调用org.apache.spark

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题
安全集群中使用Python3.x对接Kafka - MapReduce服务 MRS

Python3.x的tgz包也可以去Python官网下载。推荐使用Python-3.6.X版本，3.7版本无法使用rdd的take函数。执行如下命令，设置Python3.x的配置信息及编译安装，安装到/opt/Bigdata/python3目录下。 ./configure --prefix=

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
Spark Java API接口介绍 - MapReduce服务 MRS

rk的各种功能，如连接Spark集群，创建RDD，累积量和广播量等。它的作用相当于一个容器。 SparkConf：Spark应用配置类，如设置应用名称，执行模式，executor内存等。 JavaRDD：用于在java应用中定义JavaRDD的类，功能类似于scala中的RDD(Resilient

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Java API接口介绍 - MapReduce服务 MRS

rk的各种功能，如连接Spark集群，创建RDD，累积量和广播量等。它的作用相当于一个容器。 SparkConf：Spark应用配置类，如设置应用名称，执行模式，executor内存等。 JavaRDD：用于在java应用中定义JavaRDD的类，功能类似于scala中的RDD(Resilient

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Kudu应用开发简介 - MapReduce服务 MRS

Kudu应用开发简介 Kudu简介 Kudu是专为Apache Hadoop平台开发的列式存储管理器，具有Hadoop生态系统应用程序的共同技术特性：在通用的商用硬件上运行，可水平扩展，提供高可用性。 Kudu的设计具有以下优点：能够快速处理OLAP工作负载。支持与MapRe

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kudu开发指南（安全模式） > Kudu应用开发概述
补丁基本信息说明 - MapReduce服务 MRS

补丁基本信息说明表1 补丁基本信息补丁号 MRS 3.2.0-LTS.1.9 发布时间 2024-06-30 解决的问题 MRS 3.2.0-LTS.1.9修复问题列表：解决HetuEngine查询gauss date字段报错的问题。解决HetuEngine计算实例在Yarn上启动失败的问题。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.2.0-LTS.1.9补丁说明
通过Hue执行HetuEngine SQL - MapReduce服务 MRS

通过Hue执行HetuEngine SQL 操作场景用户需要使用图形化界面在集群中执行HetuEngine语句时，可以通过Hue完成任务。本章节适用于MRS 3.3.0及之后版本。前提条件需要MRS集群已安装HetuEngine组件并添加HSFabric实例。HSFabr

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hue > 创建Hue操作任务
Sqoop常用命令及参数介绍 - MapReduce服务 MRS

--lines-terminated-by 设定行分隔符，和hive表或hdfs文件保持一致 --mysql-delimiters MySQL默认分隔符设置 export参数 --input-fields-terminated-by 字段分隔符 --input-lines-terminated-by

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Sqoop
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

得task大小合理化。修改并行度。优化数据结构把数据按列存放，读取数据时就可以只扫描需要的列。使用Hash Shuffle时，通过设置spark.shuffle.consolidateFiles为true，来合并shuffle中间文件，减少shuffle文件的数量，减少文

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
快速开发Hive HCatalog应用 - MapReduce服务 MRS

工程。根据集群版本选择对应的分支，下载并获取MRS相关样例工程。例如本章节场景对应示例为“hcatalog-example”样例，获取地址：https://github.com/huaweicloud/huaweicloud-mrs-example/tree/mrs-3.1.

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

得task大小合理化。修改并行度。优化数据结构把数据按列存放，读取数据时就可以只扫描需要的列。使用Hash Shuffle时，通过设置spark.shuffle.consolidateFiles为true，来合并shuffle中间文件，减少shuffle文件的数量，减少文

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

得task大小合理化。修改并行度。优化数据结构把数据按列存放，读取数据时就可以只扫描需要的列。使用Hash Shuffle时，通过设置spark.shuffle.consolidateFiles为true，来合并shuffle中间文件，减少shuffle文件的数量，减少文

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
Sqoop常用命令及参数介绍 - MapReduce服务 MRS

--lines-terminated-by 设定行分隔符，和Hive表或HDFS文件保持一致 --mysql-delimiters MySQL默认分隔符设置 export参数 --input-fields-terminated-by 字段分隔符 --input-lines-terminated-by

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Sqoop
ImportTsv工具执行失败报“Permission denied”异常 - MapReduce服务 MRS

用户，例如admin用户）不具备该目录的rwx权限。上述问题可通过执行以下步骤解决：在客户端将“hbase.fs.tmp.dir”参数设置为当前kerberos用户的目录（如“/user/admin/hbase-staging”），或者为客户端（kerberos用户）提供已配置的目录所必须的rwx权限。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase故障排除

总条数： 3197

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序（Java） - MapReduce服务 MRS

Spark Java API接口介绍 - MapReduce服务 MRS

使用Hive CBO功能优化多表查询效率 - MapReduce服务 MRS

ImportTsv工具执行失败报“Permission denied”异常 - MapReduce服务 MRS

Spark应用开发规则 - MapReduce服务 MRS

如何采用Java命令提交Spark应用 - MapReduce服务 MRS

安全集群中使用Python3.x对接Kafka - MapReduce服务 MRS

Spark Java API接口介绍 - MapReduce服务 MRS

Spark Java API接口介绍 - MapReduce服务 MRS

Kudu应用开发简介 - MapReduce服务 MRS

补丁基本信息说明 - MapReduce服务 MRS

通过Hue执行HetuEngine SQL - MapReduce服务 MRS

Sqoop常用命令及参数介绍 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

快速开发Hive HCatalog应用 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

Sqoop常用命令及参数介绍 - MapReduce服务 MRS

ImportTsv工具执行失败报“Permission denied”异常 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线