搜索_华为云

使用sqoop-shell工具导入数据到HBase - MapReduce服务 MRS

配置参数说明配置参数说明示例 server.url Loader服务的浮动IP地址和端口（21351）。为了兼容性，此处支持配置多个IP地址和端口，并以“,”进行分隔。其中第一个必须是Loader服务的浮动IP地址和端口（21351），其余的可根据业务需求配置。 10.0

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
配置DataNode预留磁盘百分比 - MapReduce服务 MRS

datanode.du.reserved”或者“dfs.datanode.du.reserved.percentage”。配置描述请参考修改集群服务配置参数，进入HDFS的“全部配置”页面，在搜索框中输入参数名称。表1 参数描述参数描述默认值 dfs.datanode.du.reserved

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS企业级能力增强
配置HDFS客户端元数据缓存提高读取性能 - MapReduce服务 MRS

此功能仅用于读取不经常修改的文件。因为在服务器端由某些其他客户端完成的数据修改，对于高速缓存的客户端将是不可见的，这可能导致从缓存中拿到的元数据是过期的。本章节适用于MRS 3.x及后续版本。操作步骤设置参数的路径：在FusionInsight Manager页面中，选择“集群 > 服务 > HDFS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS性能调优
未安装HBase时Hive on Spark任务卡顿如何处理 - MapReduce服务 MRS

HBase低版本环境升级上来的，升级完成之后可不进行设置。操作步骤登录FusionInsight Manager 。选择“集群 > 服务 > Hive > 配置 > 全部配置”。选择“HiveServer（角色） > 自定义”，对参数文件“spark-defaults.c

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive常见问题
MapReduce任务长时间无进展 - MapReduce服务 MRS

MapReduce任务长时间无进展问题 MapReduce任务长时间无进展。回答一般是因为内存太少导致的。当内存较小时，任务中拷贝map输出的时间将显著增加。为了减少等待时间，您可以适当增加堆内存空间。任务的配置可根据mapper的数量和各mapper的数据大小来进行优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce常见问题
设置Spark Core并行度 - MapReduce服务 MRS

设置Spark Core并行度操作场景并行度控制任务的数量，影响shuffle操作后数据被切分成的块数。调整并行度让任务的数量和每个任务处理的数据与机器的处理能力达到更优。查看CPU使用情况和内存占用情况，当任务和数据不是平均分布在各节点，而是集中在个别节点时，可以增大并行

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
为什么Driver进程不能退出 - MapReduce服务 MRS

为什么Driver进程不能退出问题运行Spark Streaming任务，然后使用yarn application -kill applicationID命令停止任务，为什么Driver进程不能退出？回答使用yarn application -kill applicati

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
Repartition时有部分Partition没数据 - MapReduce服务 MRS

Repartition时有部分Partition没数据问题在repartition操作时，分块数“spark.sql.shuffle.partitions”设置为4500，repartition用到的key列中有超过4000个的不同key值。期望不同key对应的数据能分到不同

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
HyperLogLog函数 - MapReduce服务 MRS
HyperLogLog函数 - MapReduce服务 MRS

HyperLogLog函数 HetuEngine使用HyperLogLog数据结构实现rox_distinct（）函数。数据结构 HyperLogLog（hll）是一种统计基数的算法。它实际上不会存储每个元素出现的次数，它使用的是概率算法，通过存储元素的32位hash值的第一个

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
Loader作业导入大量数据至HDFS时报错 - MapReduce服务 MRS

Loader作业导入大量数据至HDFS时报错问题大量数据写入HDFS时偶现“NotReplicatedYet Exception: Not replicated yet”错误。图1 报错信息回答以下原因可能造成该报错： HDFS客户端向NameNode发送新Block申

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader常见问题
初始化存量表的分区 - MapReduce服务 MRS

初始化存量表的分区命令功能计算每个历史分区的最后修改时间，以“lastUpdateTime=最后修改时间”的格式将每个分区的最后修改时间写入每个分区下的“.hoodie_partition_metadata”文件中。TTL会依据“当前系统时间 - 分区最后修改时间”来判断每个分区是否老化。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > HudiTTL语法说明
Spark2x如何访问外部集群组件 - MapReduce服务 MRS

则需要修改本应用配置目录中的对应文件，并注意需要将配置文件上传到executor端。由于hdfs和hbase客户端访问服务端时，使用hostname配置服务端地址，因此，客户端的/etc/hosts需要保存有所有需要访问节点的hosts配置。用户可预先将对端集群节点的host添

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark故障排除
TezUI HiveQueries界面表格数据为空 - MapReduce服务 MRS

WebUI展示的Hive Queries任务数据，需要设置以下3个参数：在FusionInsight Manager页面，选择“集群 > 服务 > Hive > 配置 > 全部配置 > HiveServer > 自定义”，在hive-site.xml中增加以下配置：属性名属性值

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Tez > Tez常见问题
Hue WebUI中Oozie编辑器的时区设置问题 - MapReduce服务 MRS

Hue WebUI中Oozie编辑器的时区设置问题问题在Hue设置Oozie工作流调度器的时区时，部分时区设置会导致任务提交失败。回答部分时区存在适配问题，建议时区选择“Asia/Shanghai”，如图1所示。图1 时区选择支持的时区可以参考Oozie WebUI页

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hue > Hue常见问题
使用ZSTD_JNI压缩算法压缩Hive ORC表 - MapReduce服务 MRS

使用ZSTD_JNI压缩算法压缩Hive ORC表操作场景 ZSTD_JNI是ZSTD压缩算法的native实现，相较于ZSTD而言，压缩读写效率和压缩率更优，并允许用户设置压缩级别，以及对特定格式的数据列指定压缩方式。目前仅ORC格式的表支持ZSTD_JNI压缩方式，而普通

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive数据存储及加密配置
使用CDL同步drs-oracle-avro数据到Hudi（ThirdKafka） - MapReduce服务 MRS

录认证，则需先登录Manager界面，选择“集群 > 服务 > Kafka > 配置”，在搜索框中搜索“sasl.enabled.mechanisms”，为该参数值增加“PLAIN”，单击“保存”保存配置，并重启Kafka服务使配置生效：再在CDL WebUI界面配置使用MRS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > 创建CDL作业
Bitwise函数 - MapReduce服务 MRS
Bitwise函数 - MapReduce服务 MRS

Bitwise函数 bit_count(x, bits) → bigint 计算2的补码表示法中x中设置的位数（视为有符号位的整数）。 SELECT bit_count(9, 64); -- 2 SELECT bit_count(9, 8); -- 2 SELECT bit_count(-7

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
使用Flume客户端加密工具 - MapReduce服务 MRS

使用Flume客户端加密工具安装Flume客户端后，配置文件的部分参数可能需要填写加密的字符，Flume客户端中提供了加密工具。安装Flume客户端。登录安装Flume客户端的节点，并切换到客户端安装目录。例如“/opt/FlumeClient”。切换到以下目录 cd f

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > Flume企业级能力增强
配置自定义调度器的WebUI - MapReduce服务 MRS

如果用户在ResourceManager中配置了自定义的调度器，可以通过以下配置项为其配置相应的Web展示页面及其他Web应用。配置描述参考修改集群服务配置参数进入Yarn服务参数“全部配置”界面，在搜索框中输入参数名称。表1 配置自定义调度器的WebUI 参数描述默认值 hadoop.http

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn企业级能力增强
使用Oozie客户端提交DistCp任务 - MapReduce服务 MRS

用户同时还需要至少有manager_viewer权限的角色。已获取运行状态的Oozie服务器（任意实例）URL，如“https://10.1.130.10:21003/oozie”。已获取运行状态的Oozie服务器主机名，如“10-1-130-10”。已获取Yarn ResourceManager主节点IP，如“10

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Oozie > 使用Oozie客户端提交作业

总条数： 6684

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用sqoop-shell工具导入数据到HBase - MapReduce服务 MRS

配置DataNode预留磁盘百分比 - MapReduce服务 MRS

配置HDFS客户端元数据缓存提高读取性能 - MapReduce服务 MRS

未安装HBase时Hive on Spark任务卡顿如何处理 - MapReduce服务 MRS

MapReduce任务长时间无进展 - MapReduce服务 MRS

设置Spark Core并行度 - MapReduce服务 MRS

为什么Driver进程不能退出 - MapReduce服务 MRS

Repartition时有部分Partition没数据 - MapReduce服务 MRS

HyperLogLog函数 - MapReduce服务 MRS

Loader作业导入大量数据至HDFS时报错 - MapReduce服务 MRS

初始化存量表的分区 - MapReduce服务 MRS

Spark2x如何访问外部集群组件 - MapReduce服务 MRS

TezUI HiveQueries界面表格数据为空 - MapReduce服务 MRS

Hue WebUI中Oozie编辑器的时区设置问题 - MapReduce服务 MRS

使用ZSTD_JNI压缩算法压缩Hive ORC表 - MapReduce服务 MRS

使用CDL同步drs-oracle-avro数据到Hudi（ThirdKafka） - MapReduce服务 MRS

Bitwise函数 - MapReduce服务 MRS

使用Flume客户端加密工具 - MapReduce服务 MRS

配置自定义调度器的WebUI - MapReduce服务 MRS

使用Oozie客户端提交DistCp任务 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线