搜索_华为云

Spark Core数据序列化 - MapReduce服务 MRS

进行配置，设置是否需要Kryo注册序列化。当参数设置为true时，如果工程中存在未被序列化的类，则会发生异常。如果设置为false（默认值），Kryo会自动将未注册的类名写到对应的对象中。此操作会对系统性能造成影响。设置为true时，用户需手动注册类，针对未序列化的类，系统不会

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
数据序列化 - MapReduce服务 MRS
数据序列化 - MapReduce服务 MRS

进行配置，设置是否需要Kryo注册序列化。当参数设置为true时，如果工程中存在未被序列化的类，则会抛出异常。如果设置为false（默认值），Kryo会自动将未注册的类名写到对应的对象中。此操作会对系统性能造成影响。设置为true时，用户需手动注册类，针对未序列化的类，系统不会

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
本地运行Spark程序连接MRS集群的Hive、HDFS - MapReduce服务 MRS

xml”放入工程的conf目录中。登录MRS Manager，选择“系统设置 > 用户管理”。在用户名中选择一个拥有Hive权限的用户，然后在右侧“操作”列中选择“更多 >下载认证凭据”，保存后解压得到用户的user.keytab文件与krb5.conf文件。将krb5.conf文件中Maste

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题
mapPartition接口使用 - MapReduce服务 MRS

场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用mapPartition接口并行遍历HBase表。数据规划使用foreachPartition接口使用章节创建的HBase数据表。开发思路构造需要遍历的HBase表中rowkey的RDD。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
BulkLoad接口使用 - MapReduce服务 MRS

BulkLoad接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的bulkLoad接口将rdd写入HFile中。将生成的HFile导入HBase表的操作

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
foreachPartition接口使用 - MapReduce服务 MRS

foreachPartition接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的mapPartition接口将rdd并发写入HBase表中。数据规划在客户端执行：hbase

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
BulkLoad接口使用 - MapReduce服务 MRS

BulkLoad接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的bulkLoad接口将rdd写入HFile中。将生成的HFile导入HBase表的操作

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
ALM-18010 ResourceManager进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

系统”。将“GC_OPTS”参数根据实际情况调大。集群中的NodeManager实例数量和ResourceManager内存大小的对应关系参考如下：集群中的NodeManager实例数量达到100，ResourceManager实例的JVM参数建议配置为：-Xms4G -Xmx4G

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
配置Hive表不同分区分别存储至OBS和HDFS - MapReduce服务 MRS

执行以下命令配置环境变量。 source bigdata_env 集群认证模式是否为安全模式。是，执行以下命令进行用户认证： kinit Hive业务用户否，执行5。执行以下命令登录Hive客户端。 beeline 执行如下命令创建Hive分区表“table_1”，指定分区“pt='2

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive企业级能力增强
配置Hive读取关系型数据库 - MapReduce服务 MRS

Hive支持创建与其他关系型数据库关联的外表。该外表可以从关联到的关系型数据库中读取数据，并与Hive的其他表进行Join操作。目前支持使用Hive读取DB2和Oracle两种关系型数据库的数据。前提条件已安装Hive客户端。操作步骤以Hive客户端安装用户登录安装客户端的节点。执行以下命令，切换到客户端安装目录。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive
ALM-18008 ResourceManager堆内存使用率超过阈值 - MapReduce服务 MRS

重启角色实例。重启主ResourceManager实例，会发生ResourceManager实例主备倒换，倒换过程中，Yarn无法提交新作业，已提交的作业不受影响。Yarn组件以及依赖Yarn的组件会出现短暂的服务不可用告警。重启备ResourceManager实例，服务业务不受影响。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14012 Journalnode数据不同步 - MapReduce服务 MRS

> 告警 > 告警”，在告警列表中单击此告警。查看“定位信息”，获取告警产生的JournalNode节点IP地址。选择“集群 > 待操作集群的名称 > 服务 > HDFS > 实例”，在实例列表中查看告警节点上是否存在JournalNode实例。是，执行5。否，执行4。选择“运维

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Spark Core数据序列化 - MapReduce服务 MRS

进行配置，设置是否需要Kryo注册序列化。当参数设置为true时，如果工程中存在未被序列化的类，则会发生异常。如果设置为false（默认值），Kryo会自动将未注册的类名写到对应的对象中。此操作会对系统性能造成影响。设置为true时，用户需手动注册类，针对未序列化的类，系统不会

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
ALM-38013 Produce请求在请求队列的时延超过阈值 - MapReduce服务 MRS

单击“实例”页签，勾选所有Broker实例，选择“更多 > 滚动重启实例”。重启期间服务业务可能受损或中断，请在业务低峰期重启该实例。等待5分钟，查看告警是否自动清除。是，操作结束。否，执行5。检查是否慢盘故障。在FusionInsight Manager界面，选择“运维 > 告警 >

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
分布式Scan HBase表 - MapReduce服务 MRS

分布式Scan HBase表场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用hbaseRDD方法以特定的规则扫描HBase表。数据规划使用操作Avro格式数据章节中创建的HBase数据表。开发思路设置scan的规则，例如：setCaching。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
分布式Scan HBase表 - MapReduce服务 MRS

分布式Scan HBase表场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用hbaseRDD方法以特定的规则扫描HBase表。数据规划使用操作Avro格式数据章节中创建的HBase数据表。开发思路设置scan的规则，例如：setCaching。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
ALM-17006 Oozie直接内存使用率超过阈值 - MapReduce服务 MRS

定位信息”检查该告警的“定位信息”。查看告警上报的实例主机名。在FusionInsight Manager首页，选择“集群 > 待操作集群的名称 > 服务 > Oozie > 实例”，选择上报告警实例主机名对应的角色，单击图表区域右上角的下拉菜单，选择“定制 > 内存”中的“Oozie直接内存使用率”，单击“确定”。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Apache Log4j2 远程代码执行漏洞（CVE-2021-44228）公告 - MapReduce服务 MRS

Apache Log4j2 远程代码执行漏洞（CVE-2021-44228）公告漏洞描述近日，华为云关注到Apache Log4j2存在一处远程代码执行漏洞（CVE-2021-44228），在引入Apache Log4j2处理日志时，会对用户输入的内容进行一些特殊的处理，攻击

 帮助中心 > MapReduce服务 MRS > 服务公告 > 漏洞公告
ALM-45282 UserSync直接内存使用率超过阈值 - MapReduce服务 MRS

”参数中“-XX:MaxDirectMemorySize”的值为“UserSync使用的直接内存大小”的两倍（可根据实际业务场景进行修改）。重新启动受影响的服务或实例，观察界面告警是否清除。是，处理完毕。否，执行6。重启服务期间服务不可用，业务中断。重启实例期间实例不可用，当前实例节点任务会执行失败。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-17004 Oozie堆内存使用率超过阈值 - MapReduce服务 MRS

在FusionInsight Manager首页，选择“集群 > 待操作集群的名称 > 服务 > Oozie > 实例”，选择上报告警实例主机名对应的角色，单击图表区域右上角的下拉菜单，选择“定制 > 内存”中的“Oozie堆内存使用率”，单击“确定”。图1 定制Oozie堆内存使用率查看Oozi

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 3675

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Core数据序列化 - MapReduce服务 MRS

数据序列化 - MapReduce服务 MRS

本地运行Spark程序连接MRS集群的Hive、HDFS - MapReduce服务 MRS

mapPartition接口使用 - MapReduce服务 MRS

BulkLoad接口使用 - MapReduce服务 MRS

foreachPartition接口使用 - MapReduce服务 MRS

BulkLoad接口使用 - MapReduce服务 MRS

ALM-18010 ResourceManager进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

配置Hive表不同分区分别存储至OBS和HDFS - MapReduce服务 MRS

配置Hive读取关系型数据库 - MapReduce服务 MRS

ALM-18008 ResourceManager堆内存使用率超过阈值 - MapReduce服务 MRS

ALM-14012 Journalnode数据不同步 - MapReduce服务 MRS

Spark Core数据序列化 - MapReduce服务 MRS

ALM-38013 Produce请求在请求队列的时延超过阈值 - MapReduce服务 MRS

分布式Scan HBase表 - MapReduce服务 MRS

分布式Scan HBase表 - MapReduce服务 MRS

ALM-17006 Oozie直接内存使用率超过阈值 - MapReduce服务 MRS

Apache Log4j2 远程代码执行漏洞（CVE-2021-44228）公告 - MapReduce服务 MRS

ALM-45282 UserSync直接内存使用率超过阈值 - MapReduce服务 MRS

ALM-17004 Oozie堆内存使用率超过阈值 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线