搜索_华为云

MapReduce基本原理 - MapReduce服务 MRS

MapReduce基本原理如需使用MapReduce，请确保MRS集群内已安装Hadoop服务。 MapReduce是Hadoop的核心，是Google提出的一个软件架构，用于大规模数据集（大于1TB）的并行运算。概念“Map（映射）”和“Reduce（化简）”及其主要思想，均取自于函数式编程语言及矢量编程语言。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MapReduce
典型场景：从HDFS/OBS导入数据到HBase - MapReduce服务 MRS

典型场景：从HDFS/OBS导入数据到HBase 操作场景该任务指导用户使用Loader将文件从HDFS/OBS导入到HBase。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的HDFS/OBS目录和数据。确保用户已授权

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
使用Loader从HDFS导入数据到ClickHouse - MapReduce服务 MRS

使用Loader从HDFS导入数据到ClickHouse 操作场景该任务指导用户使用Loader将文件从HDFS导入到ClickHouse。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的HDFS目录和数据。 ClickH

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
Flink SQL逻辑开发建议 - MapReduce服务 MRS

Flink SQL逻辑开发建议在aggregate和join等操作前将数据过滤来减少计算的数据量提前过滤可以减少在shuffle阶段前的数据量，减少网络IO，从而提升查询效率。比如在表join前先过滤数据比在ON和WHERE时过滤可以有效较少join数据量。因为执行顺序从发

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink SQL逻辑开发规范
Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 Spark简介 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式）
Hive输入 - MapReduce服务 MRS
Hive输入 - MapReduce服务 MRS

Hive输入概述 “Hive输入”算子，将Hive表的指定列转换成同等数量的输入字段。输入与输出输入：Hive表列输出：字段参数说明表1 算子参数说明参数含义类型是否必填默认值 Hive数据库 Hive的数据库名称。 String 否 default Hive表名

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输入类算子
Spark输入 - MapReduce服务 MRS
Spark输入 - MapReduce服务 MRS

Spark输入概述 “Spark输入”算子，将SparkSQL表的指定列转换成同等数量的输入字段。输入与输出输入：SparkSQL表列输出：字段参数说明表1 算子参数说明参数含义类型是否必填默认值 Spark数据库 SparkSQL的数据库名称。 String

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输入类算子
Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 Spark简介 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式）
使用Loader从HDFS导出数据到ClickHouse - MapReduce服务 MRS

使用Loader从HDFS导出数据到ClickHouse 本章节适用于MRS 3.3.0及以后版本。操作场景该任务指导用户使用Loader将文件从HDFS导出到ClickHouse。前提条件在FusionInsight Manager创建一个角色，添加ClickHouse

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导出作业
Hive输入 - MapReduce服务 MRS
Hive输入 - MapReduce服务 MRS

Hive输入概述 “Hive输入”算子，将Hive表的指定列转换成同等数量的输入字段。输入与输出输入：Hive表列输出：字段参数说明表1 算子参数说明参数含义类型是否必填默认值 Hive数据库 Hive的数据库名称。 String 否 default Hive表名

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 算子帮助 > 输入算子
Spark输入 - MapReduce服务 MRS
Spark输入 - MapReduce服务 MRS

Spark输入概述 “Spark输入”算子，将SparkSQL表的指定列转换成同等数量的输入字段。输入与输出输入：SparkSQL表列输出：字段参数说明表1 算子参数说明参数含义类型是否必填默认值 Spark数据库 SparkSQL的数据库名称。 String

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 算子帮助 > 输入算子
表输入 - MapReduce服务 MRS
表输入 - MapReduce服务 MRS

表输入概述 “表输入”算子，将关系型数据库表的指定列按顺序转换成同等数量的输入字段。输入与输出输入：表列输出：字段参数说明表1 算子参数说明参数含义类型是否必填默认值输入字段配置关系型数据库输入字段的相关信息：位置：配置输入字段的位置。字段名：配置输入字段名。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输入类算子
HBase输入 - MapReduce服务 MRS
HBase输入 - MapReduce服务 MRS

HBase输入概述 “HBase输入”算子，将HBase表的指定列转换成同等数量的输入字段。输入与输出输入：HBase表列输出：字段参数说明表1 算子参数说明参数含义类型是否必填默认值 HBase表类型配置HBase表类型，可选项为normal（普通表）和phoenix表。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输入类算子
HBase输入 - MapReduce服务 MRS
HBase输入 - MapReduce服务 MRS

HBase输入概述 “HBase输入”算子，将HBase表的指定列转换成同等数量的输入字段。输入与输出输入：HBase表列输出：字段参数说明表1 算子参数说明参数含义类型是否必填默认值 HBase表类型配置HBase表类型，可选项为normal（普通表）和phoenix表。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 算子帮助 > 输入算子
Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 Spark简介 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式）
Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍由于Spark开源版本升级，为避免出现API兼容性或可靠性问题，建议用户使用配套版本的API。 Spark Core常用接口 Spark主要使用到如下这几个类： pyspark.SparkContext：是Spark的对外接口。负责向调用

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍由于Spark开源版本升级，为避免出现API兼容性或可靠性问题，建议用户使用配套版本的API。 Spark Core常用接口 Spark主要使用到如下这几个类： pyspark.SparkContext：是Spark的对外接口。负责向调用

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Java API接口介绍 - MapReduce服务 MRS

Spark Java API接口介绍由于Spark开源版本升级，为避免出现API兼容性或可靠性问题，建议用户使用配套版本的开源API。 Spark Core常用接口 Spark主要使用到如下这几个类： JavaSparkContext：是Spark的对外接口，负责向调用该类的J

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
Spark Scala API接口介绍 - MapReduce服务 MRS

Spark Scala API接口介绍由于Spark开源版本升级，为避免出现API兼容性或可靠性问题，建议用户使用配套版本的开源API。 Spark Core常用接口 Spark主要使用到如下这几个类： SparkContext：是Spark的对外接口，负责向调用该类的scal

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
Spark Python接口介绍 - MapReduce服务 MRS

Spark Python接口介绍由于Spark开源版本升级，为避免出现API兼容性或可靠性问题，建议用户使用配套版本的开源API。 Spark Core常用接口 Spark主要使用到如下这几个类： pyspark.SparkContext：是Spark的对外接口。负责向调用该类

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍

总条数： 236

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消

MapReduce基本原理 - MapReduce服务 MRS

典型场景：从HDFS/OBS导入数据到HBase - MapReduce服务 MRS

使用Loader从HDFS导入数据到ClickHouse - MapReduce服务 MRS

Flink SQL逻辑开发建议 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

Hive输入 - MapReduce服务 MRS

Spark输入 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

使用Loader从HDFS导出数据到ClickHouse - MapReduce服务 MRS

Hive输入 - MapReduce服务 MRS

Spark输入 - MapReduce服务 MRS

表输入 - MapReduce服务 MRS

HBase输入 - MapReduce服务 MRS

HBase输入 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Java API接口介绍 - MapReduce服务 MRS

Spark Scala API接口介绍 - MapReduce服务 MRS

Spark Python接口介绍 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线