搜索_华为云

配置MapReduce任务日志归档和清理机制 - MapReduce服务 MRS

rver解析以后用于查看作业执行的详细信息。任务日志记录了每个运行在Container中的任务输出的日志信息。默认情况下，任务日志只会存放在各NodeManager的本地磁盘上。打开日志聚合功能后，NodeManager会在作业运行完成后将本地的任务日志进行合并，写入到HDFS中。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce
配置MapReduce任务日志归档和清理机制 - MapReduce服务 MRS

rver解析以后用于查看作业执行的详细信息。任务日志记录了每个运行在Container中的任务输出的日志信息。默认情况下，任务日志只会存放在各NodeManager的本地磁盘上。打开日志聚合功能后，NodeManager会在作业运行完成后将本地的任务日志进行合并，写入到HDFS中。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce
合并CarbonData表Segments - MapReduce服务 MRS

操作场景频繁的数据获取导致在存储目录中产生许多零碎的CarbonData文件。由于数据排序只在每次加载时进行，所以，索引也只在每次加载时执行。这意味着，对于每次加载都会产生一个索引，随着数据加载数量的增加，索引的数量也随之增加。由于每个索引只在一次加载时工作，索引的性能被降低。C

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData数据分析
合并CarbonData表Segments - MapReduce服务 MRS

操作场景频繁的数据获取导致在存储目录中产生许多零碎的CarbonData文件。由于数据排序只在每次加载时进行，所以，索引也只在每次加载时执行。这意味着，对于每次加载都会产生一个索引，随着数据加载数量的增加，索引的数量也随之增加。由于每个索引只在一次加载时工作，索引的性能被降低。C

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData数据分析
创建Hive表 - MapReduce服务 MRS
创建Hive表 - MapReduce服务 MRS

一个表可以拥有一个或者多个分区，每个分区以文件夹的形式单独存在表文件夹的目录下。对分区内数据进行查询，可缩小查询范围，加快数据的检索速度和可对数据按照一定的条件进行管理。分区是在创建表的时候用PARTITIONED BY子句定义的。 CREATE EXTERNAL TABLE

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式） > 开发Hive应用 > Hive JDBC访问样例程序
Yarn节点配置调优 - MapReduce服务 MRS

有设置的目录中，一般会是在不同的设备中。为保证磁盘IO负载均衡，需要提供几个路径且每个路径都对应一个单独的磁盘。应用程序的本地化后的日志目录存在于相对路径/application_%{appid}中。单独容器的日志目录，即container_{$contid}，是该路径下的子目录

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn性能调优
Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

用程序结果备份到HDFS的路径，<brokers>指获取元数据的Kafka地址，<topic>指读取Kafka上的topic名称，<batchTime>指Streaming分批的处理间隔。由于Spark Streaming Kafka的依赖包在客户端的存放路径与其他依赖包不同，

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Streaming对接Kafka0-10样例程序
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

Int)相同，会将数据通过Shuffle的方式重新分区；当shuffle为false的时候，则只是简单的将父RDD的多个partition合并到同一个task进行计算，shuffle为false时，如果numPartitions大于父RDD的切片数，那么分区不会重新调整。遇到下列场景，可选择使用coalesce算子：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
MRS安全增强 - MapReduce服务 MRS
MRS安全增强 - MapReduce服务 MRS

MRS作为一个海量数据管理和分析的平台，具备高安全性。MRS主要从以下几个方面保障用户的数据和业务运行安全。网络隔离整个系统部署在公有云上的虚拟私有云中，提供隔离的网络环境，保证集群的业务、管理的安全性。结合虚拟私有云的子网划分、路由控制、安全组等功能，为用户提供高安全、高可靠的网络隔离环境。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能
准备连接Kafka集群配置文件 - MapReduce服务 MRS

producer.properties Kafka的producer端配置信息。 server.properties Kafka的服务端的配置信息。复制解压目录下的“hosts”文件中的内容到本地hosts文件中。在应用开发过程中，如需在本地Windows系统中调测应用程序，

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（普通模式） > 准备Kafka应用开发环境
ALM-18002 NodeManager心跳丢失 - MapReduce服务 MRS

NodeManager心跳丢失告警解释系统每30秒周期性检测丢失的NodeManager节点，并把丢失的节点数和阈值相比较。“丢失的节点数”指标默认提供一个阈值。当检测到“丢失的节点数”的值超出阈值时产生该告警。用户可通过选择“集群 > 待操作集群的名称 > 服务 > Yarn > 配置 > 全部配置”，修改yarn

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
创建FlinkServer作业 - MapReduce服务 MRS

返回作业管理页面，可以查看到已创建的作业名称、类型、状态、作业种类和描述等信息。作业创建完成后，可在对应作业的“操作”列对作业进行启动、开发、停止、编辑、删除、查看作业详情和Checkpoint故障恢复等操作。若要使用其他用户在节点上读取已提交的作业相关文件，需确保该用户与提交作业的用户具有相同的用户组

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink
DBService超过最大连接数后导致Hive MetaStore异常 - MapReduce服务 MRS

DBService超过最大连接数后导致Hive MetaStore异常问题背景与现象 DBService默认最大连接数是300，如果当业务量比较大，导致连接DBService的最大连接数超过300时，MetaStore会出现异常，并报slots are reserved for

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
批量写入Hudi表 - MapReduce服务 MRS

datasource接口更新Mor表，Upsert写入小数据量时可能触发更新数据的小文件合并，使在Mor表的读优化视图中能查到部分更新数据。当update的数据对应的base文件是小文件时，insert中的数据和update中的数据会被合在一起和base文件直接做合并产生新的base文件，而不是写log。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi写操作
使用Flume服务端从本地采集静态日志保存到HDFS - MapReduce服务 MRS

到右侧的操作界面中并将其连接。采用SpoolDir Source、Memory Channel和HDFS Sink，如图3所示。图3 Flume配置工具示例双击对应的source、channel以及sink，根据实际环境并参考表1设置对应的配置参数。如果想在之前的“properties

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > 配置Flume非加密传输数据采集任务
使用Flume服务端从本地采集静态日志保存到HDFS - MapReduce服务 MRS

到右侧的操作界面中并将其连接。采用SpoolDir Source、Memory Channel和HDFS Sink，如图3所示。图3 Flume配置工具示例双击对应的source、channel以及sink，根据实际环境并参考表1设置对应的配置参数。如果想在之前的“properties

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > 配置Flume非加密传输数据采集任务
使用永洪BI访问MRS HetuEngine - MapReduce服务 MRS

参考表1。服务器登录：选择“用户名和密码”并填写相应的用户名及密码。单击“新建数据集”，在弹出的页面参考下图修改保存路径及文件名称，单击“确定”保存修改路径及文件名称。图3 修改路径及名称在“数据源”选择新建的数据集的文件名称，此处以默认文件名称“未命名-0”为例，选择“未命名-0

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
Storm Flux开发指引 - MapReduce服务 MRS

提交和部署拓扑的场景。本章中描述的jar包的具体版本信息请以实际情况为准。 Flux框架是Storm提供的提高拓扑部署易用性的框架。通过Flux框架，用户可以使用yaml文件来定义和部署拓扑，并且最终通过storm jar命令来提交拓扑的一种方式，极大地方便了拓扑的部署和提交，缩短了业务开发周期。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发常见问题
CDL作业数据DDL变更说明 - MapReduce服务 MRS

columns(columnName columnType); 在源端数据库中新增与Hudi新增的同样列名与数据类型。在CDL WebUI界面启动1停止的任务。修改字段类型字段类型转换时，需要确保源值的数据类型能够正确转换为目标类型。如果数据类型不兼容，转换可能会失败，进而导致任务失败。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL
MapReduce任务运行失败，ApplicationMaster出现物理内存溢出异常 - MapReduce服务 MRS

application. 回答这是性能规格的问题，MapReduce任务运行失败的根本原因是由于ApplicationMaster的内存溢出导致的，即物理内存溢出导致被NodeManager kill。解决方案：将ApplicationMaster的内存配置调大，在客户端“客户端安装

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce常见问题

总条数： 4277

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置MapReduce任务日志归档和清理机制 - MapReduce服务 MRS

配置MapReduce任务日志归档和清理机制 - MapReduce服务 MRS

合并CarbonData表Segments - MapReduce服务 MRS

合并CarbonData表Segments - MapReduce服务 MRS

创建Hive表 - MapReduce服务 MRS

Yarn节点配置调优 - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

MRS安全增强 - MapReduce服务 MRS

准备连接Kafka集群配置文件 - MapReduce服务 MRS

ALM-18002 NodeManager心跳丢失 - MapReduce服务 MRS

创建FlinkServer作业 - MapReduce服务 MRS

DBService超过最大连接数后导致Hive MetaStore异常 - MapReduce服务 MRS

批量写入Hudi表 - MapReduce服务 MRS

使用Flume服务端从本地采集静态日志保存到HDFS - MapReduce服务 MRS

使用Flume服务端从本地采集静态日志保存到HDFS - MapReduce服务 MRS

使用永洪BI访问MRS HetuEngine - MapReduce服务 MRS

Storm Flux开发指引 - MapReduce服务 MRS

CDL作业数据DDL变更说明 - MapReduce服务 MRS

MapReduce任务运行失败，ApplicationMaster出现物理内存溢出异常 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线