搜索_华为云

准备Spark应用开发环境 - MapReduce服务 MRS

准备Spark应用开发环境准备Spark本地应用开发环境准备Spark连接集群配置文件导入并配置Spark样例工程新建Spark样例工程（可选）配置Spark Python3样例工程父主题： Spark2x开发指南（普通模式）

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式）
Flink开启Checkpoint样例程序 - MapReduce服务 MRS

Flink开启Checkpoint样例程序 Flink开启Checkpoint样例程序开发思路 Flink开启Checkpoint样例程序（Java） Flink开启Checkpoint样例程序（Scala）父主题：开发Flink应用

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > 开发Flink应用
HBase应用开发流程介绍 - MapReduce服务 MRS

HBase应用开发流程介绍本文档主要基于Java API对HBase进行应用开发。开发流程中各阶段的说明如图1和表1所示。图1 HBase应用程序开发流程表1 HBase应用开发的流程说明阶段说明参考文档准备开发环境在进行应用开发前，需首先准备开发环境，推荐使用

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > HBase应用开发概述
HDFS样例程序开发思路 - MapReduce服务 MRS

HDFS样例程序开发思路场景说明 HDFS的业务操作对象是文件，代码样例中所涉及的文件操作主要包括创建文件夹、写文件、追加文件内容、读文件和删除文件/文件夹；HDFS还有其他的业务处理，例如设置文件权限等，其他操作可以在掌握本代码样例之后，再扩展学习。本代码样例讲解顺序为： HDFS初始化

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式） > 开发HDFS应用
追加信息到HDFS指定文件 - MapReduce服务 MRS

追加信息到HDFS指定文件功能简介追加文件内容，是指在HDFS的某个指定文件后面，追加指定的内容。过程为：使用FileSystem实例的append方法获取追加写入的输出流。使用该输出流将待追加内容添加到HDFS的指定文件后面。在完成后，需关闭所申请资源。代码样例如下是代码片段，详细代码请参考com

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式） > 开发HDFS应用
TezUI HiveQueries界面表格数据为空 - MapReduce服务 MRS

WebUI展示的Hive Queries任务数据，需要设置以下3个参数：在FusionInsight Manager页面，选择“集群 > 服务 > Hive > 配置 > 全部配置 > HiveServer > 自定义”，在hive-site.xml中增加以下配置：属性名属性值

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Tez > Tez常见问题
Hue WebUI中Oozie编辑器的时区设置问题 - MapReduce服务 MRS

Hue WebUI中Oozie编辑器的时区设置问题问题在Hue设置Oozie工作流调度器的时区时，部分时区设置会导致任务提交失败。回答部分时区存在适配问题，建议时区选择“Asia/Shanghai”，如图1所示。图1 时区选择支持的时区可以参考Oozie WebUI页

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hue > Hue常见问题
使用ZSTD_JNI压缩算法压缩Hive ORC表 - MapReduce服务 MRS

使用ZSTD_JNI压缩算法压缩Hive ORC表操作场景 ZSTD_JNI是ZSTD压缩算法的native实现，相较于ZSTD而言，压缩读写效率和压缩率更优，并允许用户设置压缩级别，以及对特定格式的数据列指定压缩方式。目前仅ORC格式的表支持ZSTD_JNI压缩方式，而普通

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive数据存储及加密配置
使用CDL同步drs-oracle-avro数据到Hudi（ThirdKafka） - MapReduce服务 MRS

录认证，则需先登录Manager界面，选择“集群 > 服务 > Kafka > 配置”，在搜索框中搜索“sasl.enabled.mechanisms”，为该参数值增加“PLAIN”，单击“保存”保存配置，并重启Kafka服务使配置生效：再在CDL WebUI界面配置使用MRS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > 创建CDL作业
Bitwise函数 - MapReduce服务 MRS
Bitwise函数 - MapReduce服务 MRS

Bitwise函数 bit_count(x, bits) → bigint 计算2的补码表示法中x中设置的位数（视为有符号位的整数）。 SELECT bit_count(9, 64); -- 2 SELECT bit_count(9, 8); -- 2 SELECT bit_count(-7

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
HyperLogLog函数 - MapReduce服务 MRS
HyperLogLog函数 - MapReduce服务 MRS

HyperLogLog函数 HetuEngine使用HyperLogLog数据结构实现rox_distinct（）函数。数据结构 HyperLogLog（hll）是一种统计基数的算法。它实际上不会存储每个元素出现的次数，它使用的是概率算法，通过存储元素的32位hash值的第一个

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
Loader作业导入大量数据至HDFS时报错 - MapReduce服务 MRS

Loader作业导入大量数据至HDFS时报错问题大量数据写入HDFS时偶现“NotReplicatedYet Exception: Not replicated yet”错误。图1 报错信息回答以下原因可能造成该报错： HDFS客户端向NameNode发送新Block申

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader常见问题
配置DataNode预留磁盘百分比 - MapReduce服务 MRS

datanode.du.reserved”或者“dfs.datanode.du.reserved.percentage”。配置描述请参考修改集群服务配置参数，进入HDFS的“全部配置”页面，在搜索框中输入参数名称。表1 参数描述参数描述默认值 dfs.datanode.du.reserved

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS企业级能力增强
配置HDFS客户端元数据缓存提高读取性能 - MapReduce服务 MRS

此功能仅用于读取不经常修改的文件。因为在服务器端由某些其他客户端完成的数据修改，对于高速缓存的客户端将是不可见的，这可能导致从缓存中拿到的元数据是过期的。本章节适用于MRS 3.x及后续版本。操作步骤设置参数的路径：在FusionInsight Manager页面中，选择“集群 > 服务 > HDFS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS性能调优
未安装HBase时Hive on Spark任务卡顿如何处理 - MapReduce服务 MRS

HBase低版本环境升级上来的，升级完成之后可不进行设置。操作步骤登录FusionInsight Manager 。选择“集群 > 服务 > Hive > 配置 > 全部配置”。选择“HiveServer（角色） > 自定义”，对参数文件“spark-defaults.c

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive常见问题
MapReduce任务长时间无进展 - MapReduce服务 MRS

MapReduce任务长时间无进展问题 MapReduce任务长时间无进展。回答一般是因为内存太少导致的。当内存较小时，任务中拷贝map输出的时间将显著增加。为了减少等待时间，您可以适当增加堆内存空间。任务的配置可根据mapper的数量和各mapper的数据大小来进行优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce常见问题
设置Spark Core并行度 - MapReduce服务 MRS

设置Spark Core并行度操作场景并行度控制任务的数量，影响shuffle操作后数据被切分成的块数。调整并行度让任务的数量和每个任务处理的数据与机器的处理能力达到更优。查看CPU使用情况和内存占用情况，当任务和数据不是平均分布在各节点，而是集中在个别节点时，可以增大并行

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
为什么Driver进程不能退出 - MapReduce服务 MRS

为什么Driver进程不能退出问题运行Spark Streaming任务，然后使用yarn application -kill applicationID命令停止任务，为什么Driver进程不能退出？回答使用yarn application -kill applicati

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
Executor进程Crash导致Stage重试 - MapReduce服务 MRS

Executor进程Crash导致Stage重试问题在执行大数据量的Spark任务（如100T的TPCDS测试套）过程中，有时会出现Executor丢失从而导致Stage重试的现象。查看Executor的日志，出现“Executor 532 is lost rpc with driver

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
Repartition时有部分Partition没数据 - MapReduce服务 MRS

Repartition时有部分Partition没数据问题在repartition操作时，分块数“spark.sql.shuffle.partitions”设置为4500，repartition用到的key列中有超过4000个的不同key值。期望不同key对应的数据能分到不同

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame

总条数： 6725

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备Spark应用开发环境 - MapReduce服务 MRS

Flink开启Checkpoint样例程序 - MapReduce服务 MRS

HBase应用开发流程介绍 - MapReduce服务 MRS

HDFS样例程序开发思路 - MapReduce服务 MRS

追加信息到HDFS指定文件 - MapReduce服务 MRS

TezUI HiveQueries界面表格数据为空 - MapReduce服务 MRS

Hue WebUI中Oozie编辑器的时区设置问题 - MapReduce服务 MRS

使用ZSTD_JNI压缩算法压缩Hive ORC表 - MapReduce服务 MRS

使用CDL同步drs-oracle-avro数据到Hudi（ThirdKafka） - MapReduce服务 MRS

Bitwise函数 - MapReduce服务 MRS

HyperLogLog函数 - MapReduce服务 MRS

Loader作业导入大量数据至HDFS时报错 - MapReduce服务 MRS

配置DataNode预留磁盘百分比 - MapReduce服务 MRS

配置HDFS客户端元数据缓存提高读取性能 - MapReduce服务 MRS

未安装HBase时Hive on Spark任务卡顿如何处理 - MapReduce服务 MRS

MapReduce任务长时间无进展 - MapReduce服务 MRS

设置Spark Core并行度 - MapReduce服务 MRS

为什么Driver进程不能退出 - MapReduce服务 MRS

Executor进程Crash导致Stage重试 - MapReduce服务 MRS

Repartition时有部分Partition没数据 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线