搜索_华为云

表输入 - MapReduce服务 MRS
表输入 - MapReduce服务 MRS

表输入概述 “表输入”算子，将关系型数据库表的指定列按顺序转换成同等数量的输入字段。输入与输出输入：表列输出：字段参数说明表1 算子参数说明参数含义类型是否必填默认值输入字段配置关系型数据库输入字段的相关信息：位置：配置输入字段的位置。字段名：配置输入字段名。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输入类算子
HBase输入 - MapReduce服务 MRS
HBase输入 - MapReduce服务 MRS

HBase输入概述 “HBase输入”算子，将HBase表的指定列转换成同等数量的输入字段。输入与输出输入：HBase表列输出：字段参数说明表1 算子参数说明参数含义类型是否必填默认值 HBase表类型配置HBase表类型，可选项为normal（普通表）和phoenix表。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输入类算子
Hive输入 - MapReduce服务 MRS
Hive输入 - MapReduce服务 MRS

Hive输入概述 “Hive输入”算子，将Hive表的指定列转换成同等数量的输入字段。输入与输出输入：Hive表列输出：字段参数说明表1 算子参数说明参数含义类型是否必填默认值 Hive数据库 Hive的数据库名称。 String 否 default Hive表名

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输入类算子
Spark输入 - MapReduce服务 MRS
Spark输入 - MapReduce服务 MRS

Spark输入概述 “Spark输入”算子，将SparkSQL表的指定列转换成同等数量的输入字段。输入与输出输入：SparkSQL表列输出：字段参数说明表1 算子参数说明参数含义类型是否必填默认值 Spark数据库 SparkSQL的数据库名称。 String

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输入类算子
Loader算子数据处理规则 - MapReduce服务 MRS

Loader算子数据处理规则在Loader导入或导出数据的任务中，每个算子对于原始数据中NULL值、空字符串定义了不同的处理规则；在算子中无法正确处理的数据，将成为脏数据，无法导入或导出。在转换步骤中，算子数据处理规则请参见下表。表1 数据处理规则一览表转换步骤规则描述

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助
为什么在off heap时数据加载失败？ - MapReduce服务 MRS

为什么在off heap时数据加载失败？问题为什么在off heap时数据加载失败？回答 YARN Resource Manager将（Java堆内存 + “spark.yarn.am.memoryOverhead”）作为内存限制，因此在off heap时，内存可能会超出此限制。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData常见问题
如何在CarbonData中配置非安全内存？ - MapReduce服务 MRS

required”说明：当“spark.shuffle.io.preferDirectBufs”设为true时，Spark中netty传输服务从“spark.yarn.executor.memoryOverhead”中拿掉部分堆内存[~ 384 MB or 0.1 x 执行器内存]。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData常见问题
优化Flink Netty网络通信参数 - MapReduce服务 MRS

netty.client.numThreads”：默认是“taskmanager.numberOfTaskSlots”，表示netty的客户端和服务端的线程数目设置。 “taskmanager.network.netty.client.connectTimeoutSec”：默认是120

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink性能调优
客户端查询HBase出现SocketTimeoutException异常 - MapReduce服务 MRS

e.java:858) 回答出现该问题的主要原因为RegionServer分配的内存过小、Region数量过大导致在运行过程中内存不足，服务端对客户端的响应过慢。在RegionServer的配置文件“hbase-site.xml”中需要调整如下对应的内存分配参数。表1 RegionServer内存调整参数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase常见问题
HBase恢复数据任务报错回滚失败 - MapReduce服务 MRS

命令配置环境变量。执行kinit admin命令。执行zkCli.sh -server ZooKeeper节点业务IP地址:2181连接ZooKeeper。执行deleteall /recovering删除垃圾数据。然后执行quit退出ZooKeeper连接。执行该命令会导致数据丢失，请谨慎操作。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase故障排除
执行HDFS文件并发操作命令 - MapReduce服务 MRS

执行HDFS文件并发操作命令操作场景集群内并发修改文件和目录的权限及访问控制的工具。本章节适用于MRS 3.x及后续版本。对系统的影响因为集群内使用文件并发修改命令会对集群性能造成较大负担，所以在集群空闲时使用文件并发操作命令。前提条件已安装HDFS客户端或者包括H

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS性能调优
添加跨集群HetuEngine数据源 - MapReduce服务 MRS

keytab”文件就是用户的凭据文件。使用HetuEngine管理员用户登录FusionInsight Manager，选择“集群 > 服务 > HetuEngine”，进入HetuEngine服务页面。在概览页签下的“基本信息”区域，单击“HSConsole WebUI”后的链接，进入HSConsole界面。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
使用Hue提交Oozie Streaming作业 - MapReduce服务 MRS

使用Hue提交Oozie Streaming作业操作场景该任务指导用户通过Hue界面提交Streaming类型的Oozie作业。操作步骤创建工作流，请参考使用Hue创建工作流。在工作流编辑页面，选择“数据流”按钮，将其拖到操作区中。在弹出的“Streaming”窗口中

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Oozie > 使用Hue提交Oozie作业
使用Hue提交Oozie Distcp作业 - MapReduce服务 MRS

使用Hue提交Oozie Distcp作业操作场景该任务指导用户通过Hue界面提交Distcp类型的Oozie作业。操作步骤创建工作流，请参考使用Hue创建工作流。在工作流编辑页面，选择“DistCp”按钮，将其拖到操作区中。当前DistCp操作是否是跨集群操作。是，执行4。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Oozie > 使用Hue提交Oozie作业
创建SparkSQL角色 - MapReduce服务 MRS

权限管理，具体操作可参考添加Spark2x的Ranger访问权限策略。 Spark2x开启或关闭Ranger鉴权后，需要重启Spark2x服务，并重新下载客户端，或刷新客户端配置文件spark/conf/spark-defaults.conf：开启Ranger鉴权：spark.ranger

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark用户权限管理
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

经验总结使用mapPartitions，按每个分区计算结果如果每条记录的开销太大，例： rdd.map{x=>conn=getDBConn;conn.write(x.toString);conn.close} 则可以使用MapPartitions，按每个分区计算结果，如： rdd

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
合并CBO优化 - MapReduce服务 MRS
合并CBO优化 - MapReduce服务 MRS

合并CBO优化操作场景 Spark SQL默认支持基于规则的优化，但仅仅基于规则优化不能保证Spark选择合适的查询计划。CBO（Cost-Bsed Optimizer）是一种为SQL智能选择查询计划的技术。通过配置开启CBO后，CBO优化器可以基于表和列的统计信息，进行一系列的估算，最终选择出合适的查询计划。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
启用集群间拷贝功能备份集群数据 - MapReduce服务 MRS

可登录FusionInsight Manager界面，选择“集群 > 服务 > HDFS > 配置”，搜索“hadoop.rpc.protection”查看。操作步骤进入Yarn服务参数“全部配置”界面，具体操作请参考修改集群服务配置参数。如果集群详情页面没有“组件管理”页签，请先完成

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase运维管理
配置MapReduce集群管理员列表 - MapReduce服务 MRS

administrators”指定，集群管理员admin具有所有可以操作的权限。配置描述进入Mapreduce服务参数“全部配置”界面，在搜索框中输入参数名称。具体操作请参考修改集群服务配置参数章节。表1 参数描述参数描述默认值 mapreduce.cluster.acls.enabled

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce
使用HDFS Colocation存储Hive表 - MapReduce服务 MRS

使用HDFS Colocation存储Hive表操作场景 HDFS Colocation（同分布）是HDFS提供的数据分布控制功能，利用HDFS Colocation接口，可以将存在关联关系或者可能进行关联操作的数据存放在相同的存储节点上。Hive支持HDFS的Colocati

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive数据存储及加密配置

总条数： 4577

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

表输入 - MapReduce服务 MRS

HBase输入 - MapReduce服务 MRS

Hive输入 - MapReduce服务 MRS

Spark输入 - MapReduce服务 MRS

Loader算子数据处理规则 - MapReduce服务 MRS

为什么在off heap时数据加载失败？ - MapReduce服务 MRS

如何在CarbonData中配置非安全内存？ - MapReduce服务 MRS

优化Flink Netty网络通信参数 - MapReduce服务 MRS

客户端查询HBase出现SocketTimeoutException异常 - MapReduce服务 MRS

HBase恢复数据任务报错回滚失败 - MapReduce服务 MRS

执行HDFS文件并发操作命令 - MapReduce服务 MRS

添加跨集群HetuEngine数据源 - MapReduce服务 MRS

使用Hue提交Oozie Streaming作业 - MapReduce服务 MRS

使用Hue提交Oozie Distcp作业 - MapReduce服务 MRS

创建SparkSQL角色 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

合并CBO优化 - MapReduce服务 MRS

启用集群间拷贝功能备份集群数据 - MapReduce服务 MRS

配置MapReduce集群管理员列表 - MapReduce服务 MRS

使用HDFS Colocation存储Hive表 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线