搜索_华为云

场景说明 - MapReduce服务 MRS
场景说明 - MapReduce服务 MRS

场景说明假定某个业务Kafka每30秒就会收到5个用户的消费记录。Hbase的table1表存储用户历史消费的金额信息。现table1表有10条记录，表示有用户名分别为1-10的用户，用户的历史消费金额初始化都是0元。基于某些业务要求，开发的Spark应用程序实现如下功能：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Streaming从Kafka读取数据再写入HBase
Flink DataStream应用开发思路 - MapReduce服务 MRS

Flink DataStream应用开发思路假定用户有某个网站网民周末网购停留时间的日志文本，基于某些业务要求，要求开发Flink的DataStream应用程序实现如下功能： DataStream应用程序可以在Windows环境和Linux环境中运行。实时统计总计网购时间超过2个小时的女性网民信息。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > 开发Flink应用 > DataStream程序
配置HDFS单目录文件数量 - MapReduce服务 MRS

统。当集群运行时，不同组件（例如Spark、Yarn）或客户端可能会向同一个HDFS目录不断写入文件。但HDFS系统支持的单目录文件数目是有上限的，因此用户需要提前做好规划，防止单个目录下的文件数目超过阈值，导致任务出错。 HDFS提供了“dfs.namenode.fs-limits

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
典型场景：从关系型数据库导入数据到Hive - MapReduce服务 MRS

获取关系型数据库使用的用户和密码。检查磁盘空间，确保没有出现告警且余量满足导入、导出数据的大小。如果设置的作业需要使用指定YARN队列功能，该用户需要已授权有相关YARN队列的权限。设置任务的用户需要获取该任务的执行权限，并获取该任务对应的连接的使用权限。操作前需要进行如下配置：获取关系型数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
HTML输入 - MapReduce服务 MRS
HTML输入 - MapReduce服务 MRS

HTML输入概述 “HTML输入”算子，导入有规则的HTML文件，并将HTML文件中的元素转换成输入字段。输入与输出输入：HTML文件输出：多个字段参数说明表1 算子参数说明参数含义类型是否必填默认值父标签所有字段的上层HTML标签，用于限定搜索范围。 string

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 算子帮助 > 输入算子
16T的文本数据转成4T Parquet数据失败 - MapReduce服务 MRS

120s spark.network.timeout 所有涉及网络连接操作的超时时间。单位：秒。 360s 回答由于当前数据量较大，有16T，而分区数只有200，造成每个task任务过重，才会出现上面的问题。为了解决上面问题，需要对参数进行调整。增大partition数，把任务切分的更小。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
典型场景：从Hive导出数据到关系型数据库 - MapReduce服务 MRS

获取关系型数据库使用的用户和密码。检查磁盘空间，确保没有出现告警且余量满足导入、导出数据的大小。如果设置的作业需要使用指定YARN队列功能，该用户需要已授权有相关YARN队列的权限。设置任务的用户需要获取该任务的执行权限，并获取该任务对应的连接的使用权限。操作前需要进行如下配置：获取关系型数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导出
配置MapReduce应用安全认证 - MapReduce服务 MRS

n、HDFS等之间进行通信。那么提交MapReduce的应用程序中需要写入安全认证代码，确保MapReduce程序能够正常运行。安全认证有两种方式：命令行认证：提交MapReduce应用程序运行前，在MapReduce客户端执行如下命令获得认证。 kinit 组件业务用户代码认证：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > MapReduce开发指南（安全模式） > 准备MapReduce应用开发环境
配置Oozie应用安全认证 - MapReduce服务 MRS

Oozie与Hadoop、Hive等之间进行通信。那么Oozie应用程序中需要写入安全认证代码，确保Oozie程序能够正常运行。安全认证有两种方式：命令行认证：提交Oozie应用程序运行前，在Oozie客户端执行如下命令获得认证。 kinit 组件业务用户代码认证（Kerberos安全认证）：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Oozie开发指南（安全模式） > 准备Oozie应用开发环境
Spark SQL样例程序开发思路 - MapReduce服务 MRS

Spark SQL样例程序开发思路场景说明假定用户有某个周末网民网购停留时间的日志文本，基于某些业务要求，要求开发Spark应用程序实现如下功能：统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。周末两天的日志文件第一列为姓名，第二列为性别，第三列为本次停留时间，单位为分钟，分隔符为“

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark SQL样例程序
Spark SQL样例程序开发思路 - MapReduce服务 MRS

Spark SQL样例程序开发思路场景说明假定用户有某个周末网民网购停留时间的日志文本，基于某些业务要求，要求开发Spark应用程序实现如下功能：统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。周末两天的日志文件第一列为姓名，第二列为性别，第三列为本次停留时间，单位为分钟，分隔符为“

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark SQL样例程序
Hive任务运行过程中失败，重试成功 - MapReduce服务 MRS

getHandleIdentifier()=XXX](state=,code=0) 而此任务提交到Yarn上的MapReduce任务运行成功。原因分析出错的集群有两个HiveServer实例，首先查看其中一个HiveServer日志发现里面的报错与客户端中的错误一样均是Error:Invalid Op

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
使用Hive输入use database语句失效 - MapReduce服务 MRS

使用Hive的时候，在输入框中输入了use database的语句切换数据库，重新在输入框内输入其他语句，为什么数据库没有切换过去？回答在Hue上使用Hive有区别于用Hive客户端使用Hive，Hue界面上有选择数据库的按钮，当前SQL执行的数据库以界面上显示的数据库为准。与此相关的还有设置参数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hue > Hue故障排除
16T的文本数据转成4T Parquet数据失败 - MapReduce服务 MRS

120s spark.network.timeout 所有涉及网络连接操作的超时时间。单位：秒。 360s 回答由于当前数据量较大，有16T，而分区数只有200，造成每个task任务过重，才会出现上面的问题。为了解决上面问题，需要对参数进行调整。增大partition数，把任务切分的更小。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
配置HDFS单目录文件数量 - MapReduce服务 MRS

统。当集群运行时，不同组件（例如Spark、Yarn）或客户端可能会向同一个HDFS目录不断写入文件。但HDFS系统支持的单目录文件数目是有上限的，因此用户需要提前做好规划，防止单个目录下的文件数目超过阈值，导致任务出错。 HDFS提供了“dfs.namenode.fs-limits

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
Manager基本原理 - MapReduce服务 MRS

图1 Manager逻辑架构 Manager由OMS和OMA组成： OMS：操作维护系统的管理节点，OMS一般有两个，互为主备。 OMA：操作维护系统中的被管理节点，一般有多个。图1中各模块的说明如表1所示：表1 业务模块说明模块名称描述 Web Service 是一个部署

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Manager
使用Loader从关系型数据库导入数据到Hive - MapReduce服务 MRS

获取关系型数据库使用的用户和密码。检查磁盘空间，确保没有出现告警且余量满足导入、导出数据的大小。如果设置的作业需要使用指定YARN队列功能，该用户需要已授权有相关YARN队列的权限。设置任务的用户需要获取该任务的执行权限，并获取该任务对应的连接的使用权限。操作前需要进行如下配置：获取关系型数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
写入更新数据时报错UnsupportedOperationException - MapReduce服务 MRS

rter 回答因为schema演进以非向后兼容的方式进行，此错误将再次发生。基本上，如果已经写入Hudi数据集parquet文件的记录R有一些更新U。R包含字段F，该字段包含某类数据类型，也就是LONG。U具有相同的字段F，该字段的数据类型是INT。Parquet FS不支持这种不兼容的数据类型转换。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi常见问题
配置Container日志聚合功能 - MapReduce服务 MRS

配置场景 Yarn提供了Container日志聚合功能，可以将各节点Container产生的日志收集到HDFS，释放本地磁盘空间。日志收集的方式有两种：应用完成后将Container日志一次性收集到HDFS。应用运行过程中周期性收集Container输出的日志片段到HDFS。配置描述

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn
MapReduce统计样例程序开发思路 - MapReduce服务 MRS

MapReduce统计样例程序开发思路场景说明假定用户有某个周末网民网购停留时间的日志文本，基于某些业务要求，要求开发MapReduce应用程序实现如下功能。统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。周末两天的日志文件第一列为姓名，第二列为性别，第三列为本次停留时间，单位为分钟，分隔符为“

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > MapReduce开发指南 > 开发MapReduce应用

总条数： 1109

上一页
1
...
15
16
17
...
56
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

场景说明 - MapReduce服务 MRS

Flink DataStream应用开发思路 - MapReduce服务 MRS

配置HDFS单目录文件数量 - MapReduce服务 MRS

典型场景：从关系型数据库导入数据到Hive - MapReduce服务 MRS

HTML输入 - MapReduce服务 MRS

16T的文本数据转成4T Parquet数据失败 - MapReduce服务 MRS

典型场景：从Hive导出数据到关系型数据库 - MapReduce服务 MRS

配置MapReduce应用安全认证 - MapReduce服务 MRS

配置Oozie应用安全认证 - MapReduce服务 MRS

Spark SQL样例程序开发思路 - MapReduce服务 MRS

Spark SQL样例程序开发思路 - MapReduce服务 MRS

Hive任务运行过程中失败，重试成功 - MapReduce服务 MRS

使用Hive输入use database语句失效 - MapReduce服务 MRS

16T的文本数据转成4T Parquet数据失败 - MapReduce服务 MRS

配置HDFS单目录文件数量 - MapReduce服务 MRS

Manager基本原理 - MapReduce服务 MRS

使用Loader从关系型数据库导入数据到Hive - MapReduce服务 MRS

写入更新数据时报错UnsupportedOperationException - MapReduce服务 MRS

配置Container日志聚合功能 - MapReduce服务 MRS

MapReduce统计样例程序开发思路 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线