搜索_华为云

应用场景 - MapReduce服务 MRS
应用场景 - MapReduce服务 MRS

应用场景大数据在人们的生活中无处不在，在IoT、电子商务、金融、制造、医疗、能源和政府部门等行业均可以使用华为云MRS服务进行大数据处理。海量数据分析场景海量数据分析是现代大数据系统中的主要场景。通常企业会包含多种数据源，接入后需要对数据进行ETL（Extract-Tran

帮助中心 > MapReduce服务 MRS > 产品介绍
使用CDL从Opengauss同步数据到Hudi - MapReduce服务 MRS

ser_libs/cdluser.keytab Principal cdluser Description xxx 参数配置完成后，单击“测试连接”，检查数据连通是否正常。连接校验通过后，单击“确定”完成数据连接创建。（可选）选择“ENV管理 > 新建ENV”，进入“新建EN

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > 创建CDL作业
Flink基本原理 - MapReduce服务 MRS
Flink基本原理 - MapReduce服务 MRS

Flink基本原理 Flink简介 Flink是一个批处理和流处理结合的统一计算框架，其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理，是业界最顶级的开源流处理引擎。 Flink最适合的应用场景是低时延的数据处理（Data Processing）场景

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flink
准备本地应用开发环境 - MapReduce服务 MRS

不同的IntelliJ IDEA不要使用相同的workspace和相同路径下的示例工程。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。华为提供开源镜像站，各服务样例工程依赖的Jar包通过华为开源镜像站下载，剩余所依赖的开源Jar包请直接从Maven中央库或

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Doris开发指南（安全模式） > 准备Doris应用开发环境
快速使用HetuEngine访问Hive数据源 - MapReduce服务 MRS

域相关参数，参数详情可参考创建HetuEngine计算实例章节或保持默认值即可。创建计算实例时的默认配置只申请极少量的资源，仅供基本功能测试。用户需要根据实际业务需求和可用资源进行参数配置，可参考配置HetuEngine资源组和配置HetuEngine Worker节点数量。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine
准备Spark本地应用开发环境 - MapReduce服务 MRS

不同的IntelliJ IDEA不要使用相同的workspace和相同路径下的示例工程。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。安装Scala Scala开发环境的基本配置。版本要求：2.12.10。安装Scala插件 Scala开发环境的基本配置。版本要求：2018

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 准备Spark应用开发环境
准备本地应用开发环境 - MapReduce服务 MRS

IDEA不要使用相同的workspace和相同路径下的示例工程。安装Junit插件开发环境的基本配置。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。华为提供开源镜像站，各服务样例工程依赖的Jar包通过华为开源镜像站下载，剩余所依赖的开源Jar包请直接从Maven中央库或

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > 准备HBase应用开发环境
准备Spark本地应用开发环境 - MapReduce服务 MRS

不同的IntelliJ IDEA不要使用相同的workspace和相同路径下的示例工程。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。安装Scala Scala开发环境的基本配置。版本要求：2.12.10。安装Scala插件 Scala开发环境的基本配置。版本要求：2018

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 准备Spark应用开发环境
典型场景：从Hive导出数据到SFTP服务器 - MapReduce服务 MRS

在“连接”区域，单击“添加”新建一个的连接，在“连接器”中选择“sftp-connector”，单击“添加”，输入配置连接参数，单击“测试”验证连接是否可用，待提示“测试成功”后单击“确定”。Loader支持配置多个SFTP服务器操作数据，单击“添加”可增加多行SFTP服务器的配置信息。表1

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导出
使用Loader从Hive导出数据到SFTP服务器 - MapReduce服务 MRS

在“连接”区域，单击“添加”新建一个的连接，在“连接器”中选择“sftp-connector”，单击“添加”，输入配置连接参数，单击“测试”验证连接是否可用，待提示“测试成功”后单击“确定”。Loader支持配置多个SFTP服务器操作数据，单击“添加”可增加多行SFTP服务器的配置信息。表1

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导出作业
数据序列化 - MapReduce服务 MRS
数据序列化 - MapReduce服务 MRS

数据序列化操作场景 Spark支持两种方式的序列化： Java原生序列化JavaSerializer Kryo序列化KryoSerializer 序列化对于Spark应用的性能来说，具有很大的影响。在特定的数据格式的情况下，KryoSerializer的性能可以达到JavaS

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
Flink客户端使用实践 - MapReduce服务 MRS

客户端软件包名称格式为：“FusionInsight_Cluster_集群ID_Services_Client.tar”。本章节仅以集群ID为1进行介绍，请以实际集群ID为准。以客户端安装用户登录将要安装客户端的服务器。进入安装包所在目录，执行如下命令解压软件包。 cd

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink
使用Loader从HDFS导出数据到MOTService - MapReduce服务 MRS

在“连接”区域，单击“添加”新建一个的连接，在“连接器”中选择“generic-jdbc-connector”，输入配置连接参数，单击“测试”验证连接是否可用，待提示“测试成功”后单击“确定”。表1 “generic-jdbc-connector”连接参数参数名说明示例名称关系型数据库连接的名称。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导出作业
准备本地应用开发环境 - MapReduce服务 MRS

不同的IntelliJ IDEA不要使用相同的workspace和相同路径下的示例工程。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。华为提供开源镜像站，各服务样例工程依赖的Jar包通过华为开源镜像站下载，剩余所依赖的开源Jar包请直接从Maven中央库或

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Doris开发指南（普通模式） > 准备Doris应用开发环境
典型场景：从Hive导出数据到关系型数据库 - MapReduce服务 MRS

le-partition-connector、mysql-fastpath-connector），输入配置连接参数，单击“测试”验证连接是否可用，待提示“测试成功”后单击“确定”。与关系数据库连接时，可以选择通用数据库连接器（generic-jdbc-connector）或者专

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导出
多CPU内核下MapReduce调优配置 - MapReduce服务 MRS

Client 在这种情况下，磁盘的IO是主要瓶颈。所以可以选择一种压缩率非常高的压缩算法。编解码器可配置为Snappy，Benchmark测试结果显示Snappy是非常平衡以及高效的编码器。 mapreduce.map.output.compress.codec 说明：需要在客

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce性能调优
使用CDL从PgSQL同步数据到Hudi - MapReduce服务 MRS

ser_libs/cdluser.keytab Principal cdluser Description xxx 参数配置完成后，单击“测试连接”，检查数据连通是否正常。连接校验通过后，单击“确定”完成数据连接创建。（可选）选择“ENV管理 > 新建ENV”，进入“新建EN

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > 创建CDL作业
创建FlinkServer作业写入数据至Hive表 - MapReduce服务 MRS

新建集群连接，如：flink_hive。选择“系统管理 > 集群连接管理”，进入集群连接管理页面。单击“创建集群连接”，在弹出的页面中参考表1填写信息，单击“测试”，测试连接成功后单击“确定”，完成集群连接创建。表1 创建集群连接信息参数名称参数描述取值样例集群连接名称集群连接的名称，只能包

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业
Presto - MapReduce服务 MRS
Presto - MapReduce服务 MRS

Presto Presto是一个开源的用户交互式分析查询的SQL查询引擎，用于针对各种大小的数据源进行交互式分析查询。其主要应用于海量结构化数据/半结构化数据分析、海量多维数据聚合/报表、ETL、Ad-Hoc查询等场景。 Presto允许查询的数据源包括Hadoop分布式文件系统

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
典型场景：从HBase导出数据到关系型数据库 - MapReduce服务 MRS

le-partition-connector、mysql-fastpath-connector），输入配置连接参数，单击“测试”验证连接是否可用，待提示“测试成功”后单击“确定”。与关系数据库连接时，可以选择通用数据库连接器（generic-jdbc-connector）或者专

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导出

总条数： 621

上一页
1
...
13
14
15
...
32
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

应用场景 - MapReduce服务 MRS

使用CDL从Opengauss同步数据到Hudi - MapReduce服务 MRS

Flink基本原理 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

快速使用HetuEngine访问Hive数据源 - MapReduce服务 MRS

准备Spark本地应用开发环境 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

准备Spark本地应用开发环境 - MapReduce服务 MRS

典型场景：从Hive导出数据到SFTP服务器 - MapReduce服务 MRS

使用Loader从Hive导出数据到SFTP服务器 - MapReduce服务 MRS

数据序列化 - MapReduce服务 MRS

Flink客户端使用实践 - MapReduce服务 MRS

使用Loader从HDFS导出数据到MOTService - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

典型场景：从Hive导出数据到关系型数据库 - MapReduce服务 MRS

多CPU内核下MapReduce调优配置 - MapReduce服务 MRS

使用CDL从PgSQL同步数据到Hudi - MapReduce服务 MRS

创建FlinkServer作业写入数据至Hive表 - MapReduce服务 MRS

Presto - MapReduce服务 MRS

典型场景：从HBase导出数据到关系型数据库 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线