搜索_华为云

管理Loader算子的字段配置信息 - MapReduce服务 MRS

登录“Loader WebUI”界面。登录FusionInsight Manager系统，具体请参见访问集群Manager。选择“集群 > 服务 > Loader”。单击“LoaderServer(节点名称，主)”打开“Loader WebUI”界面。图1 Loader WebUI界面

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助
配置DataNode预留磁盘百分比 - MapReduce服务 MRS

datanode.du.reserved”或者“dfs.datanode.du.reserved.percentage”。配置描述请参考修改集群服务配置参数，进入HDFS的“全部配置”页面，在搜索框中输入参数名称。表1 参数描述参数描述默认值 dfs.datanode.du.reserved

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS企业级能力增强
如何在Hive自定义函数中操作本地文件 - MapReduce服务 MRS

如何在Hive自定义函数中操作本地文件问题在Hive自定义函数中需要操作本地文件，例如读取文件的内容，需要如何操作？回答默认情况下，可以在UDF中用文件的相对路径来操作文件，如下示例代码： public String evaluate(String text) { //

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive常见问题
MapReduce任务长时间无进展 - MapReduce服务 MRS

MapReduce任务长时间无进展问题 MapReduce任务长时间无进展。回答一般是因为内存太少导致的。当内存较小时，任务中拷贝map输出的时间将显著增加。为了减少等待时间，您可以适当增加堆内存空间。任务的配置可根据mapper的数量和各mapper的数据大小来进行优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce常见问题
为什么Driver进程不能退出 - MapReduce服务 MRS

为什么Driver进程不能退出问题运行Spark Streaming任务，然后使用yarn application -kill applicationID命令停止任务，为什么Driver进程不能退出？回答使用yarn application -kill applicati

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
Executor进程Crash导致Stage重试 - MapReduce服务 MRS

Executor进程Crash导致Stage重试问题在执行大数据量的Spark任务（如100T的TPCDS测试套）过程中，有时会出现Executor丢失从而导致Stage重试的现象。查看Executor的日志，出现“Executor 532 is lost rpc with driver

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
Repartition时有部分Partition没数据 - MapReduce服务 MRS

Repartition时有部分Partition没数据问题在repartition操作时，分块数“spark.sql.shuffle.partitions”设置为4500，repartition用到的key列中有超过4000个的不同key值。期望不同key对应的数据能分到不同

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
使用Flume客户端加密工具 - MapReduce服务 MRS

使用Flume客户端加密工具安装Flume客户端后，配置文件的部分参数可能需要填写加密的字符，Flume客户端中提供了加密工具。安装Flume客户端。登录安装Flume客户端的节点，并切换到客户端安装目录。例如“/opt/FlumeClient”。切换到以下目录 cd f

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > Flume企业级能力增强
通过Slow Start调优MapReduce任务 - MapReduce服务 MRS

Start参数值小于1，比如0.8，则Reduce就可以利用集群剩余资源。操作步骤参数入口：进入Mapreduce服务参数“全部配置”界面，在搜索框中输入参数名称。具体操作请参考修改集群服务配置参数章节。参数描述默认值 mapreduce.job.reduce.slowstart.completedmaps

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce性能调优
MapReduce任务commit阶段优化 - MapReduce服务 MRS

version”配置为“2”，来提升MR Job commit阶段的性能。操作步骤参数入口：进入Yarn服务参数“全部配置”界面，在搜索框中输入参数名称。具体操作请参考修改集群服务配置参数章节。表1 参数说明参数描述默认值 mapreduce.fileoutputcommitter

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce性能调优
TezUI HiveQueries界面表格数据为空 - MapReduce服务 MRS

WebUI展示的Hive Queries任务数据，需要设置以下3个参数：在FusionInsight Manager页面，选择“集群 > 服务 > Hive > 配置 > 全部配置 > HiveServer > 自定义”，在hive-site.xml中增加以下配置：属性名属性值

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Tez > Tez常见问题
创建FlinkServer作业写入数据至ClickHouse表 - MapReduce服务 MRS

DateTime DECIMAL Decimal 前提条件集群中已安装ClickHouse、HDFS、Yarn、Flink和Kafka等服务。客户端已安装，例如安装路径为：/opt/client。创建作业步骤使用root用户登录安装客户端的节点。执行以下命令，切换到客户端安装目录。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业
使用ZSTD_JNI压缩算法压缩Hive ORC表 - MapReduce服务 MRS

使用ZSTD_JNI压缩算法压缩Hive ORC表操作场景 ZSTD_JNI是ZSTD压缩算法的native实现，相较于ZSTD而言，压缩读写效率和压缩率更优，并允许用户设置压缩级别，以及对特定格式的数据列指定压缩方式。目前仅ORC格式的表支持ZSTD_JNI压缩方式，而普通

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive数据存储及加密配置
使用CDL同步drs-oracle-avro数据到Hudi（ThirdKafka） - MapReduce服务 MRS

录认证，则需先登录Manager界面，选择“集群 > 服务 > Kafka > 配置”，在搜索框中搜索“sasl.enabled.mechanisms”，为该参数值增加“PLAIN”，单击“保存”保存配置，并重启Kafka服务使配置生效：再在CDL WebUI界面配置使用MRS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > 创建CDL作业
Bitwise函数 - MapReduce服务 MRS
Bitwise函数 - MapReduce服务 MRS

Bitwise函数 bit_count(x, bits) → bigint 计算2的补码表示法中x中设置的位数（视为有符号位的整数）。 SELECT bit_count(9, 64); -- 2 SELECT bit_count(9, 8); -- 2 SELECT bit_count(-7

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
Loader作业导入大量数据至HDFS时报错 - MapReduce服务 MRS

Loader作业导入大量数据至HDFS时报错问题大量数据写入HDFS时偶现“NotReplicatedYet Exception: Not replicated yet”错误。图1 报错信息回答以下原因可能造成该报错： HDFS客户端向NameNode发送新Block申

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader常见问题
初始化存量表的分区 - MapReduce服务 MRS

初始化存量表的分区命令功能计算每个历史分区的最后修改时间，以“lastUpdateTime=最后修改时间”的格式将每个分区的最后修改时间写入每个分区下的“.hoodie_partition_metadata”文件中。TTL会依据“当前系统时间 - 分区最后修改时间”来判断每个分区是否老化。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > HudiTTL语法说明
ClickHouse分布式表设计 - MapReduce服务 MRS

ClickHouse分布式表设计建议分布式表建表参考： CREATE TABLE default.my_table_dis ON CLUSTER default_cluster AS mybase.my_table_local ENGINE = Distributed(default_cluster

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse宽表设计
ClickHouse日志管理规则 - MapReduce服务 MRS

ClickHouse日志管理规则日志路径 ClickHouse相关日志的默认存储路径为：“${BIGDATA_LOG_HOME}/clickhouse”。 ClickHouseServer运行相关日志：“/var/log/Bigdata/clickhouse/clickhouseServer/

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse数据库运维
Hudi表模型设计规范 - MapReduce服务 MRS

API或者Flin写Hudi表的场景，通过这两种方式写Hudi时需要增加向Hive同步元数据的配置项；该配置的目的是将Hudi表的元数据统一托管到Hive元数据服务中，为后续的跨引擎操作数据以及数据管理提供便利。父主题： Hudi数据表设计规范

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表设计规范

总条数： 6725

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理Loader算子的字段配置信息 - MapReduce服务 MRS

配置DataNode预留磁盘百分比 - MapReduce服务 MRS

如何在Hive自定义函数中操作本地文件 - MapReduce服务 MRS

MapReduce任务长时间无进展 - MapReduce服务 MRS

为什么Driver进程不能退出 - MapReduce服务 MRS

Executor进程Crash导致Stage重试 - MapReduce服务 MRS

Repartition时有部分Partition没数据 - MapReduce服务 MRS

使用Flume客户端加密工具 - MapReduce服务 MRS

通过Slow Start调优MapReduce任务 - MapReduce服务 MRS

MapReduce任务commit阶段优化 - MapReduce服务 MRS

TezUI HiveQueries界面表格数据为空 - MapReduce服务 MRS

创建FlinkServer作业写入数据至ClickHouse表 - MapReduce服务 MRS

使用ZSTD_JNI压缩算法压缩Hive ORC表 - MapReduce服务 MRS

使用CDL同步drs-oracle-avro数据到Hudi（ThirdKafka） - MapReduce服务 MRS

Bitwise函数 - MapReduce服务 MRS

Loader作业导入大量数据至HDFS时报错 - MapReduce服务 MRS

初始化存量表的分区 - MapReduce服务 MRS

ClickHouse分布式表设计 - MapReduce服务 MRS

ClickHouse日志管理规则 - MapReduce服务 MRS

Hudi表模型设计规范 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线