搜索_华为云

配置Spark Executor堆内存参数 - MapReduce服务 MRS

配置Spark Executor堆内存参数配置场景当分配的内存太小或者被更高优先级的进程抢占资源时，会出现物理内存超限的情况。调整如下参数，可以防止物理内存超限。配置描述参数入口：在应用提交时通过“--conf”设置这些参数，或者在客户端的“spark-defaults

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
如何查看MRS集群配置信息？ - MapReduce服务 MRS

如何查看MRS集群配置信息？集群创建完成后在MRS控制台单击集群名称进入集群基本信息页面，可以查看到集群的基本配置信息，包括集群的名称、ID、付费类型、工作地域、创建时间、Hadoop组件版本及节点的实例规格、容量。节点的实例规格和容量决定了该集群对数据的分析处理能力。节点

 帮助中心 > MapReduce服务 MRS > 常见问题 > 集群管理类
配置Spark Executor堆内存参数 - MapReduce服务 MRS

配置Spark Executor堆内存参数配置场景当分配的内存太小或者被更高优先级的进程抢占资源时，会出现物理内存超限的情况。调整如下参数，可以防止物理内存超限。配置描述参数入口：在应用提交时通过“--conf”设置这些参数，或者在客户端的“spark-defaults

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
导入并配置Spark样例工程 - MapReduce服务 MRS

导入并配置Spark样例工程操作场景 Spark针对多个场景提供样例工程，包含Java样例工程和Scala样例工程等，帮助客户快速学习Spark工程。针对Java和Scala不同语言的工程，其导入方式相同。使用Python开发的样例工程不需要导入，直接打开Python文件（*

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 准备Spark应用开发环境
导入并配置Spark样例工程 - MapReduce服务 MRS

导入并配置Spark样例工程操作场景 Spark针对多个场景提供样例工程，包含Java样例工程和Scala样例工程等，帮助客户快速学习Spark工程。针对Java和Scala不同语言的工程，其导入方式相同。使用Python开发的样例工程不需要导入，直接打开Python文件（*

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 准备Spark应用开发环境
新建Spark应用开发工程（可选） - MapReduce服务 MRS

新建Spark应用开发工程（可选）操作场景除了导入Spark样例工程，您还可以使用IDEA新建一个Spark工程。如下步骤以创建一个Scala工程为例进行说明。操作步骤打开IDEA工具，选择“Create New Project”。图1 创建工程在“New Proje

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 准备Spark应用开发环境
MetaStore动态分区数超出阈值导致SQL报错 - MapReduce服务 MRS

MetaStore动态分区数超出阈值导致SQL报错现象描述执行SparkSQL或HiveSQL命令时，系统报错如下： Number of dynamic partitions created is 2001, which is more than 2000. To slove

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
HDFS常见问题 - MapReduce服务 MRS
HDFS常见问题 - MapReduce服务 MRS

HDFS常见问题执行distcp命令报错如何处理 HDFS执行Balance时被异常停止如何处理访问HDFS WebUI时，界面提示无法显示此页 HDFS WebUI无法正常刷新损坏数据的信息 NameNode节点长时间满负载导致客户端无响应为什么主NameNode重启后系统出现双备现象

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
配置HBase/Phoenix对接SpringBoot样例 - MapReduce服务 MRS

配置HBase/Phoenix对接SpringBoot样例操作场景为了运行MRS产品HBase/Phoenix组件的SpringBoot接口样例代码，需要完成下面的操作。该章节内容适用于MRS 3.3.0及之后版本。前提条件已获取样例工程运行所需的配置文件，详细操作请参见准备HBase应用开发和运行环境。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（普通模式） > 准备HBase应用开发环境
HBase数据读写样例程序 - MapReduce服务 MRS

HBase数据读写样例程序 HBase数据读写样例程序开发思路初始化HBase配置创建HBase客户端连接创建HBase表创建HBase表Region 向HBase表中插入数据创建HBase表二级索引基于二级索引查询HBase表数据修改HBase表使用Get API读取HBase表数据

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > 开发HBase应用
如何对Hive表大小数据进行监控 - MapReduce服务 MRS

如何对Hive表大小数据进行监控问题如何对Hive中的表大小数据进行监控？回答当用户要对Hive表大小数据进行监控时，可以通过HDFS的精细化监控对指定表目录进行监控，从而到达监控指定表大小数据的目的。前提条件 Hive、HDFS组件功能正常 HDFS精细化监控功能正常

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive常见问题
Spark从Hive读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序（Python）功能介绍在Spark应用中，通过使用Spark调用Hive接口来操作hive表，然后把Hive表的数据经过分析后写到HBase表。代码样例由于pyspark不提供Hbase相关api，本样例使用Python调用Java的方式实现。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序
Spark从Hive读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序（Python）功能介绍在Spark应用中，通过使用Spark调用Hive接口来操作hive表，然后把Hive表的数据经过分析后写到HBase表。代码样例由于pyspark不提供Hbase相关api，本样例使用Python调用Java的方式实现。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序
使用Hue提交Oozie Java作业 - MapReduce服务 MRS

使用Hue提交Oozie Java作业操作场景该任务指导用户通过Hue界面提交Java类型的Oozie作业。操作步骤创建工作流，请参考使用Hue创建工作流。在工作流编辑页面，选择“Java 程序”按钮，将其拖到操作区中。在弹出的“Java program”窗口中配置“Jar

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Oozie > 使用Hue提交Oozie作业
场景说明 - MapReduce服务 MRS
场景说明 - MapReduce服务 MRS

场景说明场景说明假定用户有某个周末网民网购停留时间的日志文本，基于某些业务要求，要求开发Spark应用程序实现如下功能：统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。周末两天的日志文件第一列为姓名，第二列为性别，第三列为本次停留时间，单位为分钟，分隔符为“

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark SQL程序
MRS组件应用开发简介 - MapReduce服务 MRS

MRS组件应用开发简介 MRS是企业级大数据存储、查询、分析的统一平台，能够帮助企业快速构建海量数据信息处理系统，通过对海量信息数据的分析挖掘，发现全新价值点和企业商机。 MRS提供了各组件的常见业务场景样例程序，开发者用户可基于样例工程进行相关数据应用的开发与编译，样例工程依赖

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版）
HBase数据读写样例程序 - MapReduce服务 MRS

HBase数据读写样例程序 HBase样例程序开发思路初始化HBase配置创建HBase客户端连接创建HBase表创建HBase表Region 向HBase表中插入数据创建HBase表二级索引基于二级索引查询HBase表数据修改HBase表使用Get API读取HBase表数据

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > 开发HBase应用
cache table使用指导 - MapReduce服务 MRS

cache table使用指导问题 cache table的作用是什么？cache table时需要注意哪些方面？回答 Spark SQL可以将表cache到内存中，并且使用压缩存储来尽量减少内存压力。通过将表cache，查询可以直接从内存中读取数据，从而减少读取磁盘带来的内存开销。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
使用Hue提交Oozie Java作业 - MapReduce服务 MRS

使用Hue提交Oozie Java作业操作场景该任务指导用户通过Hue界面提交Java类型的Oozie作业。操作步骤创建工作流，请参考使用Hue创建工作流。在工作流编辑页面，选择“Java 程序”按钮，将其拖到操作区中。在弹出的“Java program”窗口中配置“Jar

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Oozie > 使用Hue提交Oozie作业
配置SparkSQL的分块个数 - MapReduce服务 MRS

配置SparkSQL的分块个数配置场景 SparkSQL在进行shuffle操作时默认的分块数为200。在数据量特别大的场景下，使用默认的分块数就会造成单个数据块过大。如果一个任务产生的单个shuffle数据块大于2G，该数据块在被fetch的时候还会报类似错误： Adjusted

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强

总条数： 5458

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置Spark Executor堆内存参数 - MapReduce服务 MRS

如何查看MRS集群配置信息？ - MapReduce服务 MRS

配置Spark Executor堆内存参数 - MapReduce服务 MRS

导入并配置Spark样例工程 - MapReduce服务 MRS

导入并配置Spark样例工程 - MapReduce服务 MRS

新建Spark应用开发工程（可选） - MapReduce服务 MRS

MetaStore动态分区数超出阈值导致SQL报错 - MapReduce服务 MRS

HDFS常见问题 - MapReduce服务 MRS

配置HBase/Phoenix对接SpringBoot样例 - MapReduce服务 MRS

HBase数据读写样例程序 - MapReduce服务 MRS

如何对Hive表大小数据进行监控 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

使用Hue提交Oozie Java作业 - MapReduce服务 MRS

场景说明 - MapReduce服务 MRS

MRS组件应用开发简介 - MapReduce服务 MRS

HBase数据读写样例程序 - MapReduce服务 MRS

cache table使用指导 - MapReduce服务 MRS

使用Hue提交Oozie Java作业 - MapReduce服务 MRS

配置SparkSQL的分块个数 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线