搜索_华为云

流式写入Hudi表 - MapReduce服务 MRS

本章节仅适用于MRS 3.3.1-LTS及之前版本。 HoodieDeltaStreamer流式写入 Hudi自带HoodieDeltaStreamer工具支持流式写入，也可以使用SparkStreaming以微批的方式写入。HoodieDeltaStreamer提供以下功能：支持Kafka，DFS多种数据源接入

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi写操作
Broker Load导入任务的数据量超过阈值 - MapReduce服务 MRS

该值的待导入文件需要通过调整Broker Load的导入参数来实现大文件的导入。处理步骤根据当前BE实例的个数和待导入文件的大小修改单个BE的任务的最大扫描量和最大并发数。操作如下：登录FusionInsight Manager，选择“集群 > 服务 > Doris”，在概

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doirs故障排除
ALM-26054 Storm Nimbus堆内存使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

m任务提交。可能原因该节点Storm Nimbus实例堆内存使用量过大，或分配的堆内存不合理，导致使用量超过阈值。处理步骤检查堆内存使用量。登录MRS集群详情页面，选择“告警管理”。单击“ALM-26054 Storm Nimbus堆内存使用率超过阈值 > 定位信息”

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
导入并配置Impala样例工程 - MapReduce服务 MRS

为了运行Impala组件的JDBC接口样例代码，需要完成下面的配置并导入样例工程操作。以在Windows环境下开发JDBC方式连接Impala服务的应用程序为例。操作步骤参考获取MRS应用开发样例工程，获取Impala示例工程。在Impala示例工程根目录impala-example

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Impala开发指南（普通模式） > 准备Impala应用开发环境
Spark Core内存调优 - MapReduce服务 MRS

GC，需要优化GC。把RDD做Cache操作，通过日志查看RDD在内存中的大小，如果数据太大，需要改变RDD的存储级别来优化。操作步骤优化GC，调整老年代和新生代的大小和比例。在客户端的conf/spark-default.conf配置文件中，在spark.driver.extraJavaOptions和spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
使用Hue提交Oozie Spark2x作业 - MapReduce服务 MRS

使用Hue提交Oozie Spark2x作业操作场景该任务指导用户通过Hue界面提交Spark2x类型的Oozie作业。操作步骤创建工作流，请参考使用Hue创建工作流。在工作流编辑页面，选择“Spark 程序”按钮，将其拖到操作区中。在弹出的“Spark”窗口配置“F

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Oozie > 使用Hue提交Oozie作业
还原DBService HA模块的SSL配置 - MapReduce服务 MRS

xml”，如果包含“<hadataprotocol value="ssl"></hadataprotocol>”，则已开启SSL。操作步骤以omm用户登录到需要还原的DBService节点。执行以下命令恢复DBService的“hacom_local.xml”配置文件： cd $B

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用DBService
ALM-45275 Ranger服务不可用 - MapReduce服务 MRS

anger原生UI无法访问。可能原因 Ranger服务所依赖内部服务DBService故障。 RangerAdmin角色实例异常。处理步骤检查DBService进程状态。在FusionInsight Manager首页，选择“运维 > 告警 > 告警”页面，查看系统是否上报“ALM-27001

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
配置Hive Python样例工程 - MapReduce服务 MRS

3.1.2及之后版本默认仅支持Python3。该样例仅支持在Linux节点上运行。操作步骤客户端机器必须安装有Python，其版本不低于2.6.6，最高不能超过2.7.13。在客户端机器的命令行终端输入python可查看Python版本号。如下显示Python版本为2.6

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（普通模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程
配置FlinkServer作业中添加第三方依赖jar - MapReduce服务 MRS

添加的依赖名称，需与上传的依赖包中connector的连接名一致。不支持上传同名依赖包。 kafka 注册jar jar包的上传方式：上传文件：添加本地的jar包指定路径：已准备好的依赖文件的HDFS路径上传文件上传文件注册jar选择为“上传文件”时，需通过该项上传本地jar文件。 - 指定路径

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 管理FlinkServer作业
ALM-38008 Kafka数据目录状态异常 - MapReduce服务 MRS

态异常，可能会导致部分Partition不可用。可能原因数据目录权限被篡改。数据目录所在磁盘故障。处理步骤检查故障的数据目录权限。根据告警提示的主机信息，登录到该节点上。查看告警详细信息中所提示的数据目录及其子目录，属组是否为omm:wheel。是，记录当前节点主机名，并执行4。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18009 MapReduce JobHistoryServer堆内存使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

该节点Mapreduce JobHistoryServer实例堆内存使用量过大，或分配的堆内存不合理，导致使用量超过阈值。处理步骤检查堆内存使用率。登录MRS集群详情页面，选择“告警管理”。选中“告警ID”为“18009”的告警，查看“定位信息”中的实例的IP地址及角色名。单击“组件管理

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-23003 Loader任务执行失败 - MapReduce服务 MRS

返回执行结果。故障修复后需重新执行任务。对Loader服务没有影响。可能原因任务参数没有正确设置。 Yarn执行任务时出现异常。处理步骤检查任务参数是否没有正确设置。打开FusionInsight Manager页面，选择“运维 > 告警 > 告警”在告警列表中，打开告警下拉页面，获取告警原因。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Hue连接HiveServer报错“over max user connections”如何处理？ - MapReduce服务 MRS

Hue连接HiveServer报错“over max user connections”如何处理？适用版本：MRS 3.1.0及之前的MRS 3.x版本。修改所有Hue节点上的以下配置文件： /opt/Bigdata/FusionInsight_Porter_8.*/inst

帮助中心 > MapReduce服务 MRS > 常见问题 > 组件配置类
使用Broker Load导入数据报错 - MapReduce服务 MRS

原因分析系统并发量较大或数据量大导致任务执行超时。处理步骤登录MySQL客户端，执行以下命令适当调大“query_timeout”参数值，默认为300秒。 SET GLOBAL query_timeout = xxx; 登录FusionInsight Manager，选择“集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris常见问题
MapReduce Java API接口介绍 - MapReduce服务 MRS

setJarByClass(Class< > cls) 核心接口，指定执行类所在的jar包本地位置。java通过class文件找到执行jar包，该jar包被上传到HDFS。 setJar(String jar) 指定执行类所在的jar包本地位置。直接设置执行jar包所在位置，该jar包被上传到HDFS。与

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > MapReduce开发指南 > MapReduce应用开发常见问题 > MapReduce接口介绍
Spark CBO调优 - MapReduce服务 MRS
Spark CBO调优 - MapReduce服务 MRS

conf”配置文件中增加配置项“spark.sql.cbo”，将其设置为true，默认为false。在客户端执行SQL语句set spark.sql.cbo=true进行配置。执行统计信息生成命令，得到统计信息。此步骤只需在运行所有SQL前执行一次。如果数据集发生了变化（插入、更新或删除），为保证

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优
SparkStreaming批量写入HBase表 - MapReduce服务 MRS

Put接口将流数据写入Hbase表中。数据规划在客户端执行hbase shell进入HBase命令行。在HBase命令执行下面的命令创建HBase表： create 'streamingTable','cf1' 在客户端另外一个session通过linux命令构造一个端口进

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
ALM-26053 Storm Slot使用率超过阈值 - MapReduce服务 MRS

用户无法执行新的Storm任务。可能原因集群中Supervisor处于异常状态。集群中Supervisor的状态正常，但是处理能力不足。处理步骤检查Supervisor状态选择“集群 > 待操作集群的名称 > 服务 > Storm > 实例”，进入Storm实例管理页面。查看

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Yarn日志介绍 - MapReduce服务 MRS
Yarn日志介绍 - MapReduce服务 MRS

Yarn日志列表日志类型日志文件名描述运行日志 hadoop-<SSH_USER>-<process_name>-<hostname>.log Yarn组件日志，记录Yarn组件运行时候所产生的大部分日志。 hadoop-<SSH_USER>-<process_name>-<hostname>

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn运维管理

总条数： 4478

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

流式写入Hudi表 - MapReduce服务 MRS

Broker Load导入任务的数据量超过阈值 - MapReduce服务 MRS

ALM-26054 Storm Nimbus堆内存使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

导入并配置Impala样例工程 - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

使用Hue提交Oozie Spark2x作业 - MapReduce服务 MRS

还原DBService HA模块的SSL配置 - MapReduce服务 MRS

ALM-45275 Ranger服务不可用 - MapReduce服务 MRS

配置Hive Python样例工程 - MapReduce服务 MRS

配置FlinkServer作业中添加第三方依赖jar - MapReduce服务 MRS

ALM-38008 Kafka数据目录状态异常 - MapReduce服务 MRS

ALM-18009 MapReduce JobHistoryServer堆内存使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-23003 Loader任务执行失败 - MapReduce服务 MRS

Hue连接HiveServer报错“over max user connections”如何处理？ - MapReduce服务 MRS

使用Broker Load导入数据报错 - MapReduce服务 MRS

MapReduce Java API接口介绍 - MapReduce服务 MRS

Spark CBO调优 - MapReduce服务 MRS

SparkStreaming批量写入HBase表 - MapReduce服务 MRS

ALM-26053 Storm Slot使用率超过阈值 - MapReduce服务 MRS

Yarn日志介绍 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线