搜索_华为云

Hudi数据表Compaction规范 - MapReduce服务 MRS

Hudi数据表Compaction规范 mor表更新数据以行存log的形式写入，log读取时需要按主键合并，并且是行存的，导致log读取效率比parquet低很多。为了解决log读取的性能问题，Hudi通过compaction将log压缩成parquet文件，大幅提升读取性能。规则

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表管理操作规范
使用CDM服务迁移数据至MRS HDFS时任务运行失败 - MapReduce服务 MRS

使用CDM服务迁移数据至MRS HDFS时任务运行失败用户问题使用CDM从旧的集群迁移数据至新集群的HDFS过程失败。问题现象使用CDM从源HDFS导入目的端HDFS，发现目的端MRS集群故障，NameNode无法启动。查看日志发现在启动过程中存在“Java heap

帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
Flink应用开发常用概念 - MapReduce服务 MRS

Flink应用开发常用概念 DataStream 数据流，是指Flink系统处理的最小数据单元。该数据单元最初由外部系统导入，可以通过socket、Kafka和文件等形式导入，在Flink系统处理后，通过Socket、Kafka和文件等输出到外部系统，这是Flink的核心概念。 Data

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发概述
SHOW_COMMIT_FILES - MapReduce服务 MRS
SHOW_COMMIT_FILES - MapReduce服务 MRS

SHOW_COMMIT_FILES 本章节仅适用于MRS 3.3.0及之后版本。命令功能查看指定的instant一共更新或者插入了多个文件。命令格式 call show_commit_files(table=>'[table]', instant_time=>'[instant_time]'

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
Flume客户端安装失败 - MapReduce服务 MRS

Flume客户端安装失败问题现象安装Flume客户端失败，提示JAVA_HOME is null或flume has been installed。 CST 2016-08-31 17:02:51 [flume-client install]: JAVA_HOME is null

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Flume
Hue中的输入框输入中文会出现混乱 - MapReduce服务 MRS

Hue中的输入框输入中文会出现混乱用户问题 Hue中的输入框输入中文会出现混乱。问题现象 Hue的输入框中输入中文时，会出现混乱，第一次输入不了的情况，也即输入的中文会首先出现英文，中文并未输入，再次输入会带上之前的内容，示例如下：原因分析 Hue对中文的处理存在混乱的情况，需要进行修正。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hue
同步Hive表配置 - MapReduce服务 MRS

同步Hive表配置参数描述默认值 hoodie.datasource.hive_sync.enable 是否同步hudi表信息到hive metastore。注意：建议该值设置为true，统一使用hive管理hudi表。 false hoodie.datasource.hive_sync

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见配置参数
SHOW - MapReduce服务 MRS
SHOW - MapReduce服务 MRS

SHOW_FS_PATH_DETAIL 本章节仅适用于MRS 3.3.0及之后版本。命令功能查看指定的FS路径的统计数据命令格式 call show_fs_path_detail(path=>'[path]', is_sub=>'[is_sub]', sort=>'[sort]');

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
使用curl命令操作OpenTSDB - MapReduce服务 MRS

使用curl命令操作OpenTSDB 写入数据例如，录入一个指标名称为testdata，时间戳为1524900185，值为true，标签为key，value的指标数据。 curl -ki -X POST -d '{"metric":"testdata", "timestamp":1524900185

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用OpenTSDB
Hive Group By语句优化 - MapReduce服务 MRS

Hive Group By语句优化操作场景优化Group by语句，可提升命令执行速度和查询速度。 Group by的时候， Map端会先进行分组，分组完后分发到Reduce端， Reduce端再进行分组。可采用Map端聚合的方式来进行Group by优化，开启Map端初步聚合，减少Map的输出数据量。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
Flink on Hudi作业参数规则 - MapReduce服务 MRS

Flink on Hudi作业参数规则 Flink作业参数配置规范 Flink作业参数配置规范如下表所示。表1 Flink作业参数配置规范参数名称是否必填参数描述建议值 -c 必填指定主类名。根据实际情况而定 -ynm 必填 Flink Yarn作业名称。根据实际情况而定

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink on Hudi开发规范
调整Hive元数据超时 - MapReduce服务 MRS

调整Hive元数据超时大分区表包含过多分区，导致任务超时，同时大量分区可能需要更多时间来加载与元存储缓存同步。因此，为了在更大规模存储中获得更好的性能，建议相应地调整加载元数据缓存最大超时时间和加载元数据连接池最大等待时间。使用HetuEngine管理员用户登录FusionInsight

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine性能调优
EditLog不连续导致NameNode启动失败 - MapReduce服务 MRS

EditLog不连续导致NameNode启动失败问题在JournalNode节点有断电，数据目录磁盘占满，网络异常时，会导致JournalNode上的EditLog不连续。此时如果重启NameNode，很可能会失败。现象重启NameNode会失败。在NameNode运行日志中会报如下的错误：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS故障排除
MapReduce基本原理 - MapReduce服务 MRS

MapReduce基本原理如需使用MapReduce，请确保MRS集群内已安装Hadoop服务。 MapReduce是Hadoop的核心，是Google提出的一个软件架构，用于大规模数据集（大于1TB）的并行运算。概念“Map（映射）”和“Reduce（化简）”及其主要思想，均取自于函数式编程语言及矢量编程语言。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MapReduce
Hive Group By语句优化 - MapReduce服务 MRS

Hive Group By语句优化操作场景优化Group by语句，可提升命令执行速度和查询速度。 Group by的时候， Map端会先进行分组，分组完后分发到Reduce端， Reduce端再进行分组。可采用Map端聚合的方式来进行Group by优化，开启Map端初步聚合，减少Map的输出数据量。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

SparkSQL访问Hive分区表启动Job前耗时较长如何处理？问题背景使用SparkSql访问Hive的一个数据存放于OBS的一个分区表，但是运行速度却很慢，并且会大量调用OBS的查询接口。 SQL样例： select a,b,c from test where b=xxx

帮助中心 > MapReduce服务 MRS > 常见问题 > 作业管理类
EditLog不连续导致NameNode启动失败 - MapReduce服务 MRS

EditLog不连续导致NameNode启动失败问题在JournalNode节点有断电，数据目录磁盘占满，网络异常时，会导致JournalNode上的EditLog不连续。此时如果重启NameNode，很可能会失败。现象重启NameNode会失败。在NameNode运行日志中会报如下的错误：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS故障排除
导入并配置Flink样例工程 - MapReduce服务 MRS

导入并配置Flink样例工程操作场景 Flink针对多个场景提供样例工程，包含Java样例工程和Scala样例工程等，帮助客户快速学习Flink工程。针对Java和Scala不同语言的工程，其导入方式相同。以下操作步骤以导入Java样例代码为例。操作流程如图1所示。图1 导入样例工程流程

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > 准备Flink应用开发环境
Oozie应用开发简介 - MapReduce服务 MRS

Oozie应用开发简介 Oozie简介 Oozie是一个用来管理Hadoop job任务的工作流引擎，Oozie流程基于有向无环图（Directed Acyclical Graph）来定义和描述，支持多种工作流模式及流程定时触发机制。易扩展、易维护、可靠性高，与Hadoop生态系统各组件紧密结合。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Oozie开发指南（普通模式）
扩容ClickHouse节点磁盘 - MapReduce服务 MRS

扩容ClickHouse节点磁盘随着业务量的增长，ClickHouse节点数据盘的磁盘容量已不能满足业务需求，需要扩容数据盘磁盘容量。如果购买MRS集群的计费模式为按需计费，扩容磁盘容量后MRS集群不支持转包周期。前提条件 ClickHouse集群和实例状态正常。已评估好

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse运维管理

总条数： 5320

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi数据表Compaction规范 - MapReduce服务 MRS

使用CDM服务迁移数据至MRS HDFS时任务运行失败 - MapReduce服务 MRS

Flink应用开发常用概念 - MapReduce服务 MRS

SHOW_COMMIT_FILES - MapReduce服务 MRS

Flume客户端安装失败 - MapReduce服务 MRS

Hue中的输入框输入中文会出现混乱 - MapReduce服务 MRS

同步Hive表配置 - MapReduce服务 MRS

SHOW - MapReduce服务 MRS

使用curl命令操作OpenTSDB - MapReduce服务 MRS

Hive Group By语句优化 - MapReduce服务 MRS

Flink on Hudi作业参数规则 - MapReduce服务 MRS

调整Hive元数据超时 - MapReduce服务 MRS

EditLog不连续导致NameNode启动失败 - MapReduce服务 MRS

MapReduce基本原理 - MapReduce服务 MRS

Hive Group By语句优化 - MapReduce服务 MRS

SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

EditLog不连续导致NameNode启动失败 - MapReduce服务 MRS

导入并配置Flink样例工程 - MapReduce服务 MRS

Oozie应用开发简介 - MapReduce服务 MRS

扩容ClickHouse节点磁盘 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线