搜索_华为云

Spark从HBase读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

import java_import from pyspark.sql import SparkSession # 创建SparkSession，设置kryo序列化 spark = SparkSession\ .builder\ .appName("SparkHbasetoHbase")

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark从HBase读取数据再写入HBase样例程序
Spark从HBase读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

import java_import from pyspark.sql import SparkSession # 创建SparkSession，设置kryo序列化 spark = SparkSession\ .builder\ .appName("SparkHbasetoHbase")

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark从HBase读取数据再写入HBase样例程序
为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

分配的用户需配置以下特性。使用参数“spark.dynamicAllocation.executorIdleTimeout”并将此参数值设置为15min（或平均查询时间）。正确配置参数“spark.dynamicAllocation.maxExecutors”，不推荐使用默认

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData常见问题
为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

分配的用户需配置以下特性。使用参数“spark.dynamicAllocation.executorIdleTimeout”并将此参数值设置为15min（或平均查询时间）。正确配置参数“spark.dynamicAllocation.maxExecutors”，不推荐使用默认

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData故障排除
Flink Kafka样例程序（Java） - MapReduce服务 MRS

env = StreamExecutionEnvironment.getExecutionEnvironment(); // 设置并发度 env.setParallelism(1); // 解析运行参数 ParameterTool

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > 开发Flink应用 > Flink Kafka样例程序
管理MRS集群用户组 - MapReduce服务 MRS

在“用户”，单击“添加”选择指定的用户并添加。单击“确定”完成用户组创建。 MRS 2.x及之前版本：在MRS Manager，单击“系统设置”。在“权限配置”区域，单击“用户组管理”。在组列表上方，单击“添加用户组”。填写“组名”和“描述”。 “组名”为必选参数，字符长度

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群用户
ALM-12033 慢盘故障 - MapReduce服务 MRS

否，执行6。执行lsblk命令，是否可以查到“磁盘名”字段值与磁盘设备的映射关系。是，执行7。否，执行22。以root用户登录上报告警的节点，执行lsscsi | grep "/dev/sd[x]"命令查看磁盘的设备信息，判断磁盘是否建立了RAID，用户密码为安装前用户自定义，请咨询系统管理员。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
CarbonData常见问题 - MapReduce服务 MRS

如何在不同的namespaces上逻辑地分割数据为什么在Spark Shell中不能执行更新命令？如何在CarbonData中配置非安全内存？设置了HDFS存储目录的磁盘空间配额，CarbonData为什么会发生异常？为什么数据查询/加载失败，且发生“org.apache.carbondata

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本）
Spark从HBase读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

import java_import from pyspark.sql import SparkSession # 创建SparkSession，设置kryo序列化 spark = SparkSession\ .builder\ .appName("SparkHbasetoHbase")

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark从HBase读取数据再写入HBase样例程序
如何给集群内用户添加租户管理权限？ - MapReduce服务 MRS

分析集群和混合集群支持添加租户管理权限，流式集群不支持添加租户管理权限。给新建账号添加租户管理权限方法如下： MRS 3.x之前版本：登录MRS Manager。在“系统设置 > 用户管理”中选择新建的用户，单击“操作”列中的“修改”。在“分配角色权限”中单击“选择并绑定角色”。绑定Manager_tena

帮助中心 > MapReduce服务 MRS > 常见问题 > 用户认证及权限类
降低MapReduce客户端运行任务失败率 - MapReduce服务 MRS

reduce.shuffle.max-host-failures MR任务在reduce过程中读取远端shuffle数据允许失败的次数。当设置次数大于5时，可以降低客户端应用的失败率。该参数适用于MRS 3.x版本。 5 mapreduce.client.submit.file.replication

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce性能调优
Python样例代码 - MapReduce服务 MRS

print "Usage: CollectFemaleInfo <file>" exit(-1) # 创建SparkContext，设置AppName sc = SparkContext(appName = "CollectFemaleInfo")? """ 以下程序主要实现以下几步功能：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark Core程序
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

如图1所示。图1 小文件合并操作步骤要启动小文件优化，在Spark客户端的“spark-defaults.conf”配置文件中进行设置。表1 参数介绍参数描述默认值 spark.sql.files.maxPartitionBytes 在读取文件时，将单个分区打包的最大字节数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

如图1所示。图1 小文件合并操作步骤要启动小文件优化，在Spark客户端的“spark-defaults.conf”配置文件中进行设置。表1 参数介绍参数描述默认值 spark.sql.files.maxPartitionBytes 在读取文件时，将单个分区打包的最大字节数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
Flink Kafka样例程序（Java） - MapReduce服务 MRS

env = StreamExecutionEnvironment.getExecutionEnvironment(); // 设置并发度 env.setParallelism(1); // 解析运行参数 ParameterTool

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > Flink Kafka样例程序
Hudi数据表Compaction规范 - MapReduce服务 MRS

paction执行合并的过程必须和实时任务解耦，通过周期调度Spark任务来完成异步Compaction，这个方案的关键之处在于如何合理的设置这个周期，周期如果太短意味着Spark任务可能会空跑，周期如果太长可能会积压太多的Compaction Plan没有去执行而导致Spark

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表管理操作规范
配置过滤掉分区表中路径不存在的分区 - MapReduce服务 MRS

可以通过以下两种方式配置是否过滤掉分区表分区路径不存在的分区。在Spark Driver端的“spark-defaults.conf”配置文件中进行设置。表1 参数说明参数说明默认值 spark.sql.hive.verifyPartitionPath 配置读取HIVE分区表时，是否过滤掉分区表分区路径不存在的分区。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
Spark Distinct聚合优化 - MapReduce服务 MRS

配置参数在Spark客户端的“{客户端安装目录}/Spark/spark/conf/spark-defaults.conf”配置文件中进行设置，修改如下参数：参数说明默认值 spark.sql.keep.distinct.expandThreshold 由cube等引起的数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
配置过滤掉分区表中路径不存在的分区 - MapReduce服务 MRS

可以通过以下两种方式配置是否过滤掉分区表分区路径不存在的分区。在Spark Driver端的“spark-defaults.conf”配置文件中进行设置。表1 参数说明参数说明默认值 spark.sql.hive.verifyPartitionPath 配置读取Hive分区表时，是否过滤掉分区表分区路径不存在的分区。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
Kafka Old Consumer API使用样例 - MapReduce服务 MRS

kafka.example.Old_Consumer类中，作用在于订阅指定Topic的消息。（注意：旧Consumer API仅支持访问未设置ACL的Topic，安全接口说明见Kafka安全接口介绍）样例代码 Old Consumer API线程run方法中的消费逻辑。 /**

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Kafka开发指南 > 开发Kafka应用

总条数： 3252

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark从HBase读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

Spark从HBase读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

Flink Kafka样例程序（Java） - MapReduce服务 MRS

管理MRS集群用户组 - MapReduce服务 MRS

ALM-12033 慢盘故障 - MapReduce服务 MRS

CarbonData常见问题 - MapReduce服务 MRS

Spark从HBase读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

如何给集群内用户添加租户管理权限？ - MapReduce服务 MRS

降低MapReduce客户端运行任务失败率 - MapReduce服务 MRS

Python样例代码 - MapReduce服务 MRS

小文件优化 - MapReduce服务 MRS

小文件优化 - MapReduce服务 MRS

Flink Kafka样例程序（Java） - MapReduce服务 MRS

Hudi数据表Compaction规范 - MapReduce服务 MRS

配置过滤掉分区表中路径不存在的分区 - MapReduce服务 MRS

Spark Distinct聚合优化 - MapReduce服务 MRS

配置过滤掉分区表中路径不存在的分区 - MapReduce服务 MRS

Kafka Old Consumer API使用样例 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线