搜索_华为云

Spark基本原理 - MapReduce服务 MRS
Spark基本原理 - MapReduce服务 MRS

Spark基本原理 Spark简介 Spark是一个开源的，并行数据处理框架，能够帮助用户简单、快速的开发大数据应用，对数据进行离线处理、流式处理、交互式分析等。 Spark提供了一个快速的计算、写入及交互式查询的框架。相比于Hadoop，Spark拥有明显的性能优势。Spark

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
HetuEngine物化视图SQL示例 - MapReduce服务 MRS

HetuEngine物化视图SQL示例物化视图SQL示例请参考表1。表1 物化视图的操作操作功能物化视图SQL样例备注创建物化视图（创建物化视图时，只创建了物化视图的定义，数据填充需要使用refresh materialized view name刷新物化视图数据）

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 配置HetuEngine物化视图
典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

典型场景：从SFTP服务器导入数据到HDFS/OBS 操作场景该任务指导用户使用Loader将数据从SFTP服务器导入到HDFS/OBS。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的HDFS/OBS目录和数据。获取S

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
使用Loader从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

使用Loader从SFTP服务器导入数据到HDFS/OBS 操作场景该任务指导用户使用Loader将数据从SFTP服务器导入到HDFS/OBS。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的HDFS/OBS目录和数据。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
使用Loader从关系型数据库导入数据到HDFS/OBS - MapReduce服务 MRS

使用Loader从关系型数据库导入数据到HDFS/OBS 操作场景该任务指导用户使用Loader将数据从关系型数据库导入到HDFS/OBS。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的HDFS/OBS目录和数据。获取关系型数据库使用的用户和密码。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
Flink任务开发建议 - MapReduce服务 MRS

Flink任务开发建议高可用性下考虑提高Checkpoint保存数 Checkpoint保存数默认是1，也就是只保存最新的Checkpoint的状态文件，当进行状态恢复时，如果最新的Checkpoint文件不可用（比如HDFS文件所有副本都损坏或者其他原因），那么状态恢复就会失

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink任务开发规范
使用DBeaver访问Phoenix - MapReduce服务 MRS

使用DBeaver访问Phoenix 应用场景 DBeaver是一个SQL客户端和数据库管理工具。对于关系数据库，使用JDBC API通过JDBC驱动程序与数据库交互。对于其他数据库（NoSQL），使用专有数据库驱动程序。本章节以DBeaver 6.3.5版本为例，讲解如何使用DBeaver访问MRS

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
将Hudi表数据同步到Hive - MapReduce服务 MRS

将Hudi表数据同步到Hive 通过执行run_hive_sync_tool.sh可以将Hudi表数据同步到Hive中。例如：需要将HDFS上目录为hdfs://hacluster/tmp/huditest/hudimor1_deltastreamer_partition的Hu

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi写操作
使用Loader从HDFS导出数据到MOTService - MapReduce服务 MRS

使用Loader从HDFS导出数据到MOTService 操作场景本章节适用于MRS 3.3.0及之后版本。在MOTService中需要根据表中数据版本字段对表进行更新操作，MOTService外部表不支持Upsert语句，您可以使用Loader将文件从HDFS导出到MOTService从而批量更新数据。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导出作业
将Hudi表数据同步到Hive - MapReduce服务 MRS

将Hudi表数据同步到Hive 通过执行run_hive_sync_tool.sh可以将Hudi表数据同步到Hive中。例如：需要将HDFS上目录为hdfs://hacluster/tmp/huditest/hudimor1_deltastreamer_partition的Hu

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi写操作
Flink DataStream样例程序（Java） - MapReduce服务 MRS

Flink DataStream样例程序（Java）功能介绍统计连续网购时间超过2个小时的女性网民信息，将统计结果直接打印。 DataStream FlinkStreamJavaExample代码样例下面代码片段仅为演示，具体代码参见com.huawei.bigdata.flink

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > 开发Flink应用 > Flink DataStream样例程序
Flink DataStream样例程序（Java） - MapReduce服务 MRS

Flink DataStream样例程序（Java）功能介绍统计连续网购时间超过2个小时的女性网民信息，将统计结果直接打印。代码样例下面代码片段仅为演示，完整代码参见FlinkStreamJavaExample样例工程下的com.huawei.bigdata.flink.examples

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > 开发Flink应用 > FlinkDataStream样例程序
Flink DataStream样例程序（Java） - MapReduce服务 MRS

Flink DataStream样例程序（Java）功能介绍统计连续网购时间超过2个小时的女性网民信息，将统计结果直接打印。 DataStream FlinkStreamJavaExample代码样例下面代码片段仅为演示，具体代码参见com.huawei.bigdata.flink

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > Flink DataStream样例程序
Flink DataStream样例程序（Java） - MapReduce服务 MRS

Flink DataStream样例程序（Java）功能介绍统计连续网购时间超过2个小时的女性网民信息，将统计结果直接打印。 DataStream FlinkStreamJavaExample代码样例下面代码片段仅为演示，具体代码参见com.huawei.bigdata.flink

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 开发Flink应用 > Flink DataStream样例程序
优化HDFS NameNode RPC的服务质量 - MapReduce服务 MRS

优化HDFS NameNode RPC的服务质量配置场景本章节适用于MRS 3.x及后续版本。数个成品Hadoop集群由于NameNode超负荷运行并失去响应而发生故障。这种阻塞现象是由于Hadoop的初始设计造成的。在Hadoop中，NameNode作为单独的机器，在其

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS性能调优
优化HDFS NameNode RPC的服务质量 - MapReduce服务 MRS

优化HDFS NameNode RPC的服务质量配置场景本章节适用于MRS 3.x及后续版本。数个成品Hadoop集群由于NameNode超负荷运行并失去响应而发生故障。这种阻塞现象是由于Hadoop的初始设计造成的。在Hadoop中，NameNode作为单独的机器，在其

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS性能调优
Spark2x基本原理 - MapReduce服务 MRS

Spark2x基本原理 Spark2x组件适用于MRS 3.x及后续版本。简介 Spark是基于内存的分布式计算框架。在迭代计算的场景下，数据处理过程中的数据可以存储在内存中，提供了比MapReduce高10到100倍的计算能力。Spark可以使用HDFS作为底层存储，使用户能

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x
入门实践 - MapReduce服务 MRS
入门实践 - MapReduce服务 MRS

入门实践当完成MRS集群部署后，可以根据自身的业务需求使用MRS提供的一系列常用实践。表1 MRS常用最佳实践实践描述数据分析使用Spark2x实现车联网车主驾驶行为分析本实践指导使用Spark实现车主驾驶行为分析。用于了解MRS的基本功能，利用MRS服务的Spar

帮助中心 > MapReduce服务 MRS > 快速入门
数学函数和运算符 - MapReduce服务 MRS

数学函数和运算符数学运算符运算符描述 + 加 - 减 * 乘 / 除 % 取余数学函数 abs(x) → [same as input] 返回x的绝对值 SELECT abs(-17.4);-- 17.4 bin(bigint x) -> string 返回x的二进制格式

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

配置Spark SQL开启Adaptive Execution特性配置场景 Spark SQL Adaptive Execution特性用于使Spark SQL在运行过程中，根据中间结果优化后续执行流程，提高整体执行效率。当前已实现的特性如下：自动设置shuffle partition数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强

总条数： 287

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark基本原理 - MapReduce服务 MRS

HetuEngine物化视图SQL示例 - MapReduce服务 MRS

典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

使用Loader从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

使用Loader从关系型数据库导入数据到HDFS/OBS - MapReduce服务 MRS

Flink任务开发建议 - MapReduce服务 MRS

使用DBeaver访问Phoenix - MapReduce服务 MRS

将Hudi表数据同步到Hive - MapReduce服务 MRS

使用Loader从HDFS导出数据到MOTService - MapReduce服务 MRS

将Hudi表数据同步到Hive - MapReduce服务 MRS

Flink DataStream样例程序（Java） - MapReduce服务 MRS

Flink DataStream样例程序（Java） - MapReduce服务 MRS

Flink DataStream样例程序（Java） - MapReduce服务 MRS

Flink DataStream样例程序（Java） - MapReduce服务 MRS

优化HDFS NameNode RPC的服务质量 - MapReduce服务 MRS

优化HDFS NameNode RPC的服务质量 - MapReduce服务 MRS

Spark2x基本原理 - MapReduce服务 MRS

入门实践 - MapReduce服务 MRS

数学函数和运算符 - MapReduce服务 MRS

配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线