搜索_华为云

准备Impala开发和运行环境 - MapReduce服务 MRS

不同的IntelliJ IDEA不要使用相同的workspace和相同路径下的示例工程。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。准备开发用户参考准备MRS应用开发用户进行操作，准备用于应用开发的集群用户并授予相应权限。 7-zip 用于解压“*.zip”和“*.rar”文件，支持7-zip

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Impala开发指南（安全模式） > 准备Impala应用开发环境
检测Yarn内存使用情况 - MapReduce服务 MRS

检测Yarn内存使用情况配置场景针对所提交应用的内存使用无法预估的情况，可以通过修改服务端的配置项控制是否对内存使用进行检测。若不检测内存使用，Container会占用内存直到内存溢出；若检测内存使用，当内存使用超过配置的内存大小时，相应的Container会被kill掉。配置描述

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn运维管理
检测Yarn内存使用情况 - MapReduce服务 MRS

检测Yarn内存使用情况配置场景针对所提交应用的内存使用无法预估的情况，可以通过修改服务端的配置项控制是否对内存使用进行检测。如果不检测内存使用，Container会占用内存直到内存溢出；如果检测内存使用，当内存使用超过配置的内存大小时，相应的Container会被kill掉。配置描述

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn运维管理
Hive配置类问题 - MapReduce服务 MRS

alias or column reference 'xxx'. 解决方案：set hive.cbo.enable=true; Hive SQL子查询编译报错：Unsupported SubQuery Expression 'xxx': Only SubQuery expressions

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive常见问题
配置Yarn大作业扫描 - MapReduce服务 MRS

pool 获取NodeManager的监控的大作业的信息的线程数。 50 max.job.count 事件中显示大作业的数量。 10 job.monitor.local.dir.threshold 监控NodeManager本地磁盘作业目录的大小，超过当前阈值就会上报事件。单位：GB。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn运维管理
完整迁移Storm业务 - MapReduce服务 MRS

该任务指导用户通过Storm业务完整迁移的方式转换并运行完整的由Storm API开发的Storm拓扑。操作步骤打开Storm业务工程，修改工程的pom文件，增加“flink-storm” 、“flink-core”和“flink-streaming-java_2.11”的引用。如下：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Storm > 迁移Storm业务至Flink
Flink作业提交时报错端口范围不足 - MapReduce服务 MRS

MRS集群上服务众多，如果不限制端口范围可能导致其他服务端口被占用而导致异常，因此MRS集群给每个服务分配的端口范围是固定的，Flink端口范围是[32326-32390]。当Flink作业单个taskmanager分配的slot数过多时会导致分配端口不足，可通过在“客户端安装路径/Flink/flink/conf/flink-conf

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink常见开发问题
创建Bucket索引表调优 - MapReduce服务 MRS

方法三：数据老化，按照业务逻辑分析大的维度表是否可以通过数据老化清理无效的维度数据从而降低数据规模。数据量非常小的事实表这种可以在预估很长一段时间的数据增长量的前提下使用非分区表预留稍宽裕一些的桶数来提升读写性能。确认表内桶数 Hudi表的桶数设置，关系到表的性能，需要格外引起注意。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Bucket调优示例
Flume基本原理 - MapReduce服务 MRS
Flume基本原理 - MapReduce服务 MRS

Flume是一个高可用、高可靠，分布式的海量日志采集、聚合和传输的系统。Flume支持在日志系统中定制各类数据发送方，用于收集数据；同时，Flume提供对数据进行简单处理，并写到各种数据接收方（可定制）的能力。其中Flume-NG是Flume的一个分支，其特点是明显简单，体积更小，更容易部署，其最基本的架构如下图所示：

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flume
配置HDFS文件回收站机制 - MapReduce服务 MRS

配置场景在HDFS中，如果删除HDFS的文件，删除的文件将被移动到回收站（trash）中，不会被立即清除，以便在误操作的情况下恢复被删除的数据。被删除的文件在超过老化时间后将变为老化文件，会基于系统机制清除或用户手动清除。您可以设置文件保留在回收站中的时间阈值，一旦文件保存时间超过此

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
使用UDF函数时提示“Invalid function” - MapReduce服务 MRS

中使用HiverServer2创建的UDF，如果不及时同步元数据信息，连接HiveServer1的客户端也会提示上述错误信息。可能原因多个HiveServer之间或者Hive与Spark之间共用的元数据未同步，导致不同HiveServer实例内存数据不一致，造成UDF不生效。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
Spark从Hive读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

在Spark应用中，通过使用Spark调用Hive接口来操作hive表，然后把Hive表的数据经过分析后写到HBase表。代码样例由于pyspark不提供Hbase相关api，本样例使用Python调用Java的方式实现。下面代码片段仅为演示，具体代码参见SparkHivetoHbasePythonExample:

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序
读取Hudi mor表视图 - MapReduce服务 MRS

直接读取Hive里面存储的后缀为_ro的hudi表即可。 select count(*) from ${table_name}_ro; 读优化视图读取（Spark dataSource API为例）：和读普通的dataSource表类似。必须指定查询类型QUERY_TYPE_OPT_KEY

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi读操作
读取Hudi mor表视图 - MapReduce服务 MRS

直接读取Hive里面存储的后缀为_ro的hudi表即可。 select count(*) from ${table_name}_ro; 读优化视图读取（Spark dataSource API为例）：和读普通的dataSource表类似。必须指定查询类型QUERY_TYPE_

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi读操作
SHOW SEGMENTS - MapReduce服务 MRS
SHOW SEGMENTS - MapReduce服务 MRS

SHOW SEGMENTS 命令功能 SHOW SEGMENTS命令是用来向用户展示CarbonData table的Segment。命令格式 SHOW SEGMENTS FOR TABLE [db_name.]table_name LIMIT number_of_loads;

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DML
SHOW SEGMENTS - MapReduce服务 MRS
SHOW SEGMENTS - MapReduce服务 MRS

SHOW SEGMENTS 命令功能 SHOW SEGMENTS命令是用来向用户展示CarbonData table的Segment。命令格式 SHOW SEGMENTS FOR TABLE [db_name.]table_name LIMIT number_of_loads;

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
FlinkSQL Kafka Connector支持消费drs-json格式数据 - MapReduce服务 MRS

本章节适用于MRS 3.3.0及以后版本。使用场景 FlinkSQL需要消费Kafka中drs-json格式（一种CDC消息格式）的数据。使用方法在创建的Kafka Connector Source流表中，设置 'format' = 'drs-json'。 SQL示例如下： CREATE

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
Hudi数据表Compaction规范 - MapReduce服务 MRS

生新版本的Parquet文件，那旧版本的文件就不能被Clean清理，增加存储压力。 CPU与内存比例为1:4~1:8。 Compaction作业是将存量的parquet文件内的数据与新增的log中的数据进行合并，需要消耗较高的内存资源，按照之前的表设计规范以及实际流量的波动结合考

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表管理操作规范
HDFS日志介绍 - MapReduce服务 MRS
HDFS日志介绍 - MapReduce服务 MRS

日志）。日志归档规则：HDFS的日志启动了自动压缩归档功能，默认情况下，当日志大小超过100MB的时候，会自动压缩，压缩后的日志文件名规则为：“<原有日志名>-<yyyy-mm-dd_hh-mm-ss>.[编号].log.zip”。最多保留最近的100个压缩文件，压缩文件保留个数可以在Manager界面中配置。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS运维管理
Kafka日志介绍 - MapReduce服务 MRS
Kafka日志介绍 - MapReduce服务 MRS

DEBUG表示记录系统及系统的调试信息。如果您需要修改日志级别，请执行如下操作：请参考修改集群服务配置参数，进入Kafka的“全部配置”页面。左边菜单栏中选择所需修改的角色所对应的日志菜单。选择所需修改的日志级别。保存配置，在弹出窗口中单击“确定”使配置生效。日志格式 Kafka的日志格式如下所示

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kafka > Kafka运维管理

总条数： 6113

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备Impala开发和运行环境 - MapReduce服务 MRS

检测Yarn内存使用情况 - MapReduce服务 MRS

检测Yarn内存使用情况 - MapReduce服务 MRS

Hive配置类问题 - MapReduce服务 MRS

配置Yarn大作业扫描 - MapReduce服务 MRS

完整迁移Storm业务 - MapReduce服务 MRS

Flink作业提交时报错端口范围不足 - MapReduce服务 MRS

创建Bucket索引表调优 - MapReduce服务 MRS

Flume基本原理 - MapReduce服务 MRS

配置HDFS文件回收站机制 - MapReduce服务 MRS

使用UDF函数时提示“Invalid function” - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

读取Hudi mor表视图 - MapReduce服务 MRS

读取Hudi mor表视图 - MapReduce服务 MRS

SHOW SEGMENTS - MapReduce服务 MRS

SHOW SEGMENTS - MapReduce服务 MRS

FlinkSQL Kafka Connector支持消费drs-json格式数据 - MapReduce服务 MRS

Hudi数据表Compaction规范 - MapReduce服务 MRS

HDFS日志介绍 - MapReduce服务 MRS

Kafka日志介绍 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线