搜索_华为云

配置MapReduce应用安全认证 - MapReduce服务 MRS

在kerberos认证集群环境下，各个组件之间的相互通信不能够简单的互通，而需要在通信之前进行相互认证，以确保通信的安全性。用户在提交MapReduce应用程序时，需要与Yarn、HDFS等之间进行通信。那么提交MapReduce的应用程序中需要写入安全认证代码，确保MapReduce程序能够正常运行。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > MapReduce开发指南 > 准备MapReduce应用开发环境
下载MRS集群日志 - MapReduce服务 MRS

最大并发数：根据界面要求设置日志收集时的最大节点并发数量。（MRS 3.3.0及之后版本支持该参数）单击右上角的设置日志的起始收集时间“开始时间”和“结束时间”。单击“下载”完成日志下载。下载的日志压缩包中会包括对应开始时间和结束时间的拓扑信息，方便查看与定位。拓扑文件以“topo_<拓扑结构变化时间点>

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 查看MRS集群日志
HDFS目录配额不足导致写文件失败 - MapReduce服务 MRS

402653184 B = 384 MB 可能原因目录配置的剩余的空间小于写文件实际需要的空间。原因分析 HDFS支持设置某目录的配额，即限制某目录下的文件最多占用空间大小，例如如下命令是设置“/tmp/tquota”目录最多写入150MB的文件（文件大小*副本数）。 hadoop dfsadmin

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
如何获取Kafka Consumer Offset信息 - MapReduce服务 MRS

API，在下文中统称为新API。处理步骤旧Consumer API 前提条件系统管理员已明确业务需求，并准备一个Kafka管理员用户（属于kafkaadmin组）。已安装Kafka客户端。操作步骤以客户端安装用户，登录安装Kafka客户端的节点。切换到Kafka客户端安装目录，例如“/opt/kafkaclient”。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
使用Loader从Hive导出数据到SFTP服务器 - MapReduce服务 MRS

创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业中指定的Hive表的权限。获取SFTP服务器使用的用户和密码，且该用户具备SFTP服务器数据导出目录的写入权限。检查磁盘空间，确保没有出现告警且余量满足导入、导出数据的大小。如果设置的任务需要使用指定YARN

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导出作业
Spark2x多租户 - MapReduce服务 MRS
Spark2x多租户 - MapReduce服务 MRS

个目录下的ProxyServer实例。在连接的时候，会根据当前租户名的Hash值与Zookeeper下的Namespace实例个数取模获取连接的实例，详细URL参见URL连接介绍。客户端成功连接ProxyServer服务，ProxyServer服务首先确认是否有该租户的JDBC

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x
BulkLoad工具配置文件说明 - MapReduce服务 MRS

针对“<badlines>”标签中的算符和对应的参数类型如表2所示。表2 算符和对应的参数类型算符类型参数类型 && 对应的参数类型应为布尔型。 & 对应的参数类型应为整数。 | 对应的参数类型应为整数。 ^ 对应的参数类型应为整数。 / 对应的参数类型应为数字。 == 对应的参数类型应为字符串。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 增强HBase BulkLoad工具数据迁移能力
BulkDelete接口使用 - MapReduce服务 MRS

seContext的方式去使用HBase，将要删除的数据的rowKey构造成rdd，然后通过HBaseContext的bulkDelete接口对HBase表上这些rowKey对应的数据进行删除。数据规划基于BulkPut接口使用章节创建的HBase表及其中的数据进行操作。开发思路

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
Kafka客户端使用实践 - MapReduce服务 MRS

--create --topic 主题名称 --partitions 主题占用的分区数 --replication-factor 主题的备份数 --zookeeper ZooKeeper的任意一个节点的业务IP:clientPort/kafka ./kafka-topics.sh

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka
Spark Core内存调优 - MapReduce服务 MRS

Spark是内存计算框架，计算过程中内存不够对Spark的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存中RDD的大小来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的GC情况（在客户端的conf/spark-default.conf配置文件中，在spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
调整HetuEngine元数据缓存 - MapReduce服务 MRS

提供了元数据缓存的功能，当首次访问Hive数据源的库或表时，会将该库或表的元数据信息（数据库名、表名、表字段、分区信息、权限信息等）缓存起来，后续访问时不需要再次访问Hive metastore，在Hive数据源的表数据变化不频繁的场景下，可以一定程度上提升查询的性能。调整HetuEngine元数据缓存步骤

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine性能调优
ALM-14025 租户文件对象使用率超过阈值 - MapReduce服务 MRS

系统每小时周期性检测租户所关联的每个目录的文件对象使用率（每个目录已使用的文件对象个数/每个目录分配的文件对象个数），并把每个目录实际的文件对象使用率和该目录设置的阈值相比较。当检测到租户所关联的目录文件对象使用率高于该目录的阈值时，产生该告警。当上报告警的目录的文件对象使用率小于或等于该目录设置的阈值时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Hive WebHCat接口介绍 - MapReduce服务 MRS

jobid 删除的Job的ID 返回结果参数描述 user 提交Job的用户。 status 包含Job状态信息的JSON对象。 profile 包含job信息的json对象。WebHCat解析JobProfile对象中的信息，该对象因Hadoop版本不同而不同。 id Job的id。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（普通模式） > Hive应用开发常见问题 > Hive对外接口介绍
表输入 - MapReduce服务 MRS
表输入 - MapReduce服务 MRS

表列名”时，默认该表的所有列或者是“SQL语句”配置项里配置的查询条件中指明的列。配置的输入字段个数不能大于实际指定的列数，否则全部数据成为脏数据。当字段的值与实际的类型不匹配时，该行数据会成为脏数据。样例以sqlserver 2014为例，创建测试表test： create

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 算子帮助 > 输入算子
降低MapReduce客户端运行任务失败率 - MapReduce服务 MRS

当网络不稳定或者集群IO、CPU负载过高的情况下，通过调整如下参数值，降低客户端应用的失败率，保证应用的正常运行。配置描述在客户端的“mapred-site.xml”配置文件中调整如下参数。 “mapred-site.xml”配置文件在客户端安装路径的conf目录下，例如“/opt/

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce > MapReduce性能调优
Spark JDBCServer接口介绍 - MapReduce服务 MRS

一个sparkSQL的应用程序，而通过JDBC连接进来的客户端共同分享这个sparkSQL应用程序的资源，也就是说不同的用户之间可以共享数据。JDBCServer启动时还会开启一个侦听器，等待JDBC客户端的连接和提交查询。所以，在配置JDBCServer的时候，至少要配置JDB

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
从零开始使用Sqoop - MapReduce服务 MRS

指定导出数据的分隔符，与需要导出的HDFS中的数据表中的分隔符保持一致。 -m或-num-mappers <n> 启动n个map来并行导入数据，默认是4个，该值请勿高于集群的最大Map数。 -direct 快速模式，利用了数据库的导入工具，如MySQL的mysqlimport，可以比jdbc连接的方式更为高效的将数据导入到关系数据库中。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Sqoop
Spark REST API接口介绍 - MapReduce服务 MRS

Spark REST API接口介绍功能简介 Spark的REST API以JSON格式展现Web UI的一些指标，提供用户一种更简单的方法去创建新的展示和监控的工具，并且支持查询正在运行的app和已经结束的app的相关信息。开源的Spark REST接口支持对Jobs、Stages

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出 - MapReduce服务 MRS

java:745) 回答用户尝试收集大量数据到Driver端，如果Driver端的内存不足以存放这些数据，那么就会抛出OOM(OutOfMemory)的异常，然后Driver端一直在进行GC，尝试回收垃圾来存放返回的数据，导致应用长时间挂起。解决措施：如果用户需要在OOM场景下强制将应用退出，那么可以在启动Spark

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出 - MapReduce服务 MRS

java:745) 回答用户尝试收集大量数据到Driver端，如果Driver端的内存不足以存放这些数据，那么就会抛出OOM(OutOfMemory)的异常，然后Driver端一直在进行GC，尝试回收垃圾来存放返回的数据，导致应用长时间挂起。解决措施：如果用户需要在OOM场景下强制将应用退出，那么可以在启动Spark

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题

总条数： 3600

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置MapReduce应用安全认证 - MapReduce服务 MRS

下载MRS集群日志 - MapReduce服务 MRS

HDFS目录配额不足导致写文件失败 - MapReduce服务 MRS

如何获取Kafka Consumer Offset信息 - MapReduce服务 MRS

使用Loader从Hive导出数据到SFTP服务器 - MapReduce服务 MRS

Spark2x多租户 - MapReduce服务 MRS

BulkLoad工具配置文件说明 - MapReduce服务 MRS

BulkDelete接口使用 - MapReduce服务 MRS

Kafka客户端使用实践 - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

调整HetuEngine元数据缓存 - MapReduce服务 MRS

ALM-14025 租户文件对象使用率超过阈值 - MapReduce服务 MRS

Hive WebHCat接口介绍 - MapReduce服务 MRS

表输入 - MapReduce服务 MRS

降低MapReduce客户端运行任务失败率 - MapReduce服务 MRS

Spark JDBCServer接口介绍 - MapReduce服务 MRS

从零开始使用Sqoop - MapReduce服务 MRS

Spark REST API接口介绍 - MapReduce服务 MRS

执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出 - MapReduce服务 MRS

执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线