搜索_华为云

Spark Streaming对接Kafka0-10样例程序（Scala） - MapReduce服务 MRS

toLong)) //配置Streaming的CheckPoint目录。 //由于窗口概念的存在，此参数是必需的。 ssc.checkpoint(checkPointDir) //获取kafka使用的topic列表。 val topicArr

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Streaming对接Kafka0-10样例程序
ClickHouse日志介绍 - MapReduce服务 MRS

迁移工具时产生的错误日志。日志级别 ClickHouse提供了如表2所示的日志级别。运行日志的级别优先级从高到低分别是error、warning、trace、information、debug，程序会打印高于或等于所设置级别的日志，设置的日志等级越高，打印出来的日志就越少。表2

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse运维管理
Spark应用开发流程介绍 - MapReduce服务 MRS

Streaming三个组件，其应用开发流程相同。开发流程中各阶段的说明如图1和表1所示。图1 Spark应用程序开发流程表1 Spark应用开发的流程说明阶段说明参考文档了解基本概念在开始开发应用前，需要了解Spark的基本概念，根据实际场景选择需要了解的概念，分为Spark Core基本概念、Spark

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
HBase Shell接口介绍 - MapReduce服务 MRS

hbase(main):001:0> 您可以在命令行运行模式中运行help命令获取HBase的命令参数的帮助信息。注意事项 count命令不支持条件统计，仅支持全表统计。获取HBase replication指标的命令通过Shell命令“status”可以获取到所有需要的指标。查看replication

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（普通模式） > HBase应用开发常见问题 > HBase对外接口介绍
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

Int)相同，会将数据通过Shuffle的方式重新分区；当shuffle为false的时候，则只是简单的将父RDD的多个partition合并到同一个task进行计算，shuffle为false时，如果numPartitions大于父RDD的切片数，那么分区不会重新调整。遇到下列场景，可选择使用coalesce算子：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
权限管理 - MapReduce服务 MRS
权限管理 - MapReduce服务 MRS

除MRS集群的权限策略，控制用户对MRS集群资源的使用范围。如果华为云账号已经能满足您的要求，不需要创建独立的IAM用户进行权限管理，您可以跳过本章节，不影响您使用MRS服务的其它功能。 IAM是华为云提供权限管理的基础服务，无需付费即可使用，您只需要为您账号中的资源进行付费。

帮助中心 > MapReduce服务 MRS > 产品介绍
Kafka日志介绍 - MapReduce服务 MRS
Kafka日志介绍 - MapReduce服务 MRS

DEBUG表示记录系统及系统的调试信息。如果您需要修改日志级别，请执行如下操作：请参考修改集群服务配置参数，进入Kafka的“全部配置”页面。左边菜单栏中选择所需修改的角色所对应的日志菜单。选择所需修改的日志级别。保存配置，在弹出窗口中单击“确定”使配置生效。日志格式 Kafka的日志格式如下所示：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka运维管理
GROUP BY - MapReduce服务 MRS
GROUP BY - MapReduce服务 MRS

GROUP BY GROUP BY GROUP BY将SELECT语句的输出行划分成包含匹配值的分组。简单的GROUP BY可以包含由输入列组成的任何表达式，也可以是按位置选择输出列的序号。以下查询是等效的： SELECT count(*), nationkey FROM customer

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DQL SQL语法说明
使用HDFS Colocation存储Hive表 - MapReduce服务 MRS

Colocation（同分布）是HDFS提供的数据分布控制功能，利用HDFS Colocation接口，可以将存在关联关系或者可能进行关联操作的数据存放在相同的存储节点上。Hive支持HDFS的Colocation功能，即在创建Hive表时，设置表文件分布的locator信息，当使用insert语句向该表中插入数据

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive数据存储及加密配置
ALM-26054 Storm Nimbus堆内存使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。 HostName 产生告警的主机名。 Trigger Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响 Storm Nimbus堆内存使用率过高时，可能造成频繁的内存垃圾回收，甚至

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
安全集群中使用Python3.x对接Kafka - MapReduce服务 MRS

/opt/Bigdata/python3/bin/pip3 /usr/bin/pip3 配置变量的目录需要跟4中安装的目录保持一致。配置成功后，执行如下命令，在Python3.x环境中安装Kafka组件。 cp /usr/include/gssapi/* /home/omm/ke

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
MapReduce任务运行失败，ApplicationMaster出现物理内存溢出异常 - MapReduce服务 MRS

application. 回答这是性能规格的问题，MapReduce任务运行失败的根本原因是由于ApplicationMaster的内存溢出导致的，即物理内存溢出导致被NodeManager kill。解决方案：将ApplicationMaster的内存配置调大，在客户端“客户端安装路径/Y

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce > MapReduce常见问题
读取HDFS文件失败，报错“FileNotFoundException” - MapReduce服务 MRS

exist，该日志说明文件在操作的过程中被删除了。搜索HDFS的NameNode的审计日志（Active NameNode的/var/log/Bigdata/audit/hdfs/nn/hdfs-audit-namenode.log）搜索文件名，确认文件的创建时间。搜索文件创建

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
HBase Shell接口介绍 - MapReduce服务 MRS

所示。 hbase(main):001:0> 您可以在命令行运行模式中运行help命令获取HBase的命令参数的帮助信息。获取HBase replication指标的命令通过Shell命令“status”可以获取到所有需要的指标。查看replication source指标的命令。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > HBase应用开发常见问题 > HBase接口介绍
MRS 3.0.5.1补丁说明 - MapReduce服务 MRS

zie作业无法提交问题解决Hue界面执行含变量的Hive SQL时变量值下拉框无法使用的问题解决Hue连接Hive服务查询时session没有正确关闭导致最终无法查询的问题解决鲲鹏机型Impala查询Kudu表偶现查询卡顿的问题解决Kudu组件客户端安装问题解决鲲鹏机型KuduMaster偶现自动重启问题

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明
MapReduce统计样例代码 - MapReduce服务 MRS

MapReduce统计样例代码功能介绍统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。主要分为三个部分：从原文件中筛选女性网民上网时间数据信息，通过类CollectionMapper继承Mapper抽象类实现。汇总每个女性上网时间，并输出时间大于两个小时的女性网民信息，通过类Coll

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > MapReduce开发指南（安全模式） > 开发MapReduce应用 > MapReduce统计样例程序
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

Int)相同，会将数据通过Shuffle的方式重新分区；当shuffle为false的时候，则只是简单的将父RDD的多个partition合并到同一个task进行计算，shuffle为false时，如果numPartitions大于父RDD的切片数，那么分区不会重新调整。遇到下列场景，可选择使用coalesce算子：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

Int)相同，会将数据通过Shuffle的方式重新分区；当shuffle为false的时候，则只是简单的将父RDD的多个partition合并到同一个task进行计算，shuffle为false时，如果numPartitions大于父RDD的切片数，那么分区不会重新调整。遇到下列场景，可选择使用coalesce算子

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
ALM-38000 Kafka服务不可用（2.x及以前版本） - MapReduce服务 MRS

RoleName 产生告警的角色名称。 HostName 产生告警的主机名。对系统的影响集群无法对外提供Kafka服务，用户无法执行新的Kafka任务。可能原因 KrbServer组件故障。 ZooKeeper组件故障或无响应。 Kafka集群中Broker节点异常。处理步骤

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Spark应用开发流程介绍 - MapReduce服务 MRS

Streaming三个组件，其应用开发流程都是相同的。开发流程中各阶段的说明如图1和表1所示。图1 Spark应用程序开发流程表1 Spark应用开发的流程说明阶段说明参考文档了解基本概念在开始开发应用前，需要了解Spark的基本概念，根据实际场景选择需要了解的概念，分为Spark Core基本概念、Spark

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式）

总条数： 4222

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Streaming对接Kafka0-10样例程序（Scala） - MapReduce服务 MRS

ClickHouse日志介绍 - MapReduce服务 MRS

Spark应用开发流程介绍 - MapReduce服务 MRS

HBase Shell接口介绍 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

权限管理 - MapReduce服务 MRS

Kafka日志介绍 - MapReduce服务 MRS

GROUP BY - MapReduce服务 MRS

使用HDFS Colocation存储Hive表 - MapReduce服务 MRS

ALM-26054 Storm Nimbus堆内存使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

安全集群中使用Python3.x对接Kafka - MapReduce服务 MRS

MapReduce任务运行失败，ApplicationMaster出现物理内存溢出异常 - MapReduce服务 MRS

读取HDFS文件失败，报错“FileNotFoundException” - MapReduce服务 MRS

HBase Shell接口介绍 - MapReduce服务 MRS

MRS 3.0.5.1补丁说明 - MapReduce服务 MRS

MapReduce统计样例代码 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

ALM-38000 Kafka服务不可用（2.x及以前版本） - MapReduce服务 MRS

Spark应用开发流程介绍 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线