搜索_华为云

配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

配置使用分布式缓存执行MapReduce任务配置场景本章节操作适用于MRS 3.x及之后版本。分布式缓存在两种情况下非常有用。滚动升级在升级过程中，应用程序必须保持文字内容（jar文件或配置文件）不变。而这些内容并非基于当前版本的Yarn，而是要基于其提交时的版本。一般情况下

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce
MapReduce开源增强特性 - MapReduce服务 MRS

MapReduce开源增强特性 MapReduce开源增强特性：JobHistoryServer HA特性 JobHistoryServer（JHS）是用于查看MapReduce历史任务信息的服务器，当前开源JHS只支持单实例服务。JobHistoryServer HA能够解决JHS

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MapReduce
安装客户端（3.x版本） - MapReduce服务 MRS

安装客户端（3.x版本） MRS集群创建成功后，用户可自行安装集群客户端，用于连接集群内组件服务端，进行组件连接、作业提交等任务。集群客户端可以安装在集群内的节点上，也可以安装在集群外的节点上。集群内组件的服务端配置修改后，也建议重新安装客户端，否则客户端与服务端版本将不一致，可能影响部分功能的正常使用

 帮助中心 > MapReduce服务 MRS > 用户指南 > 安装MRS集群客户端
创建FlinkServer作业写入数据至ClickHouse表 - MapReduce服务 MRS

创建FlinkServer作业写入数据至ClickHouse表本章节适用于MRS 3.1.2及之后的版本。操作场景 Flink通过对接ClickHouse的ClickHouseBalancer实例进行读写，有效避免ClickHouse流量分发问题。FlinkSQL与ClickHouse

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业
配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

配置使用分布式缓存执行MapReduce任务配置场景本章节操作适用于MRS 3.x及之后版本。分布式缓存在两种情况下非常有用。滚动升级在升级过程中，应用程序必须保持文字内容（jar文件或配置文件）不变。而这些内容并非基于当前版本的Yarn，而是要基于其提交时的版本。一般情况下

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce
使用Oozie客户端提交DistCp任务 - MapReduce服务 MRS

使用Oozie客户端提交DistCp任务操作场景该任务指导用户在使用Oozie客户端提交DistCp任务。请下载使用最新版本的客户端。前提条件 HDFS和Oozie组件安装完成且运行正常，客户端安装成功。如果当前客户端为旧版本，需要重新下载和安装客户端。已创建或获取访问

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Oozie > 使用Oozie客户端提交作业
HDFS对接OBS业务应用开发样例说明 - MapReduce服务 MRS

HDFS对接OBS业务应用开发样例说明对接原理介绍 HDFS创建FileSystem的代码会根据uri的scheme查找对应的实现类，即针对不同底层提供的实现类，在HDFS的配置文件中进行配置，HDFS就会根据fs.AbstractFileSystem.%s.impl创建对应的实现类

 帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 存算分离常见问题
Spark JDBCServer接口介绍 - MapReduce服务 MRS

Spark JDBCServer接口介绍简介 JDBCServer是Hive中的HiveServer2的另外一个实现，它底层使用了Spark SQL来处理SQL语句，从而比Hive拥有更高的性能。 JDBCServer是一个JDBC接口，用户可以通过JDBC连接JDBCServer

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
初始化HDFS - MapReduce服务 MRS
初始化HDFS - MapReduce服务 MRS

初始化HDFS 功能简介在使用HDFS提供的API之前，需要先进行HDFS初始化操作。过程为：加载HDFS服务配置文件，并进行kerberos安全认证。认证通过后，实例化Filesystem。使用HDFS的API。此处kerberos安全认证需要使用到的keytab文件，

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HDFS开发指南 > 开发HDFS应用
多级嵌套子查询以及混合Join的SQL调优 - MapReduce服务 MRS

多级嵌套子查询以及混合Join的SQL调优操作场景本章节介绍在多级嵌套以及混合Join SQL查询的调优建议。前提条件例如有一个复杂的查询样例如下： select s_name, count(1) as numwait from ( select s_name from (

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
Yarn与其他组件的关系 - MapReduce服务 MRS

Yarn与其他组件的关系 Yarn和Spark组件的关系 Spark的计算调度方式，可以通过Yarn的模式实现。Spark共享Yarn集群提供丰富的计算资源，将任务分布式的运行起来。Spark on Yarn分两种模式：Yarn Cluster和Yarn Client。 Yarn

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > YARN
离线数据加载：通过StreamLoad将本地CSV文件导入Doris - MapReduce服务 MRS

离线数据加载：通过StreamLoad将本地CSV文件导入Doris 应用场景本地CSV文件数据通过StreamLoad导入到Doris，需要写入Doris的数据不重复，通过引入 Unique 数据模型保证 Key 的唯一性。方案架构离线数据可以从数据湖加载，也可以直接加载本地文件

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
多级嵌套子查询以及混合Join的SQL调优 - MapReduce服务 MRS

多级嵌套子查询以及混合Join的SQL调优操作场景本章节介绍在多级嵌套以及混合Join SQL查询的调优建议。前提条件例如有一个复杂的查询样例如下： select s_name, count(1) as numwait from ( select s_name from (

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
准备ClickHouse应用开发和运行环境 - MapReduce服务 MRS

准备ClickHouse应用开发和运行环境准备开发环境在进行应用开发时，要准备的开发和运行环境如表1所示。表1 开发环境准备项说明操作系统开发环境：Windows系统，支持Windows7以上版本。运行环境：Linux系统。如需在本地调测程序，运行环境需要和集群业务平面网络互通

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > ClickHouse开发指南（安全模式） > 准备ClickHouse应用开发环境
准备ClickHouse应用开发和运行环境 - MapReduce服务 MRS

准备ClickHouse应用开发和运行环境准备开发环境在进行应用开发时，要准备的开发和运行环境如表1所示。表1 开发环境准备项说明操作系统开发环境：Windows系统，支持Windows7以上版本。运行环境：Linux系统。如需在本地调测程序，运行环境需要和集群业务平面网络互通

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > ClickHouse开发指南（普通模式） > 准备ClickHouse应用开发环境
通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据应用场景本文介绍如何使用MRS集群运行Spark Streaming作业以消费Kafka数据。假定某个业务Kafka每1秒就会收到1个单词记录。基于业务需要，开发的Spark应用程序实现实时累加计算每个单词的记录总数的功能

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
Spark JDBCServer接口介绍 - MapReduce服务 MRS

Spark JDBCServer接口介绍简介 JDBCServer是Hive中的HiveServer2的另外一个实现，它底层使用了Spark SQL来处理SQL语句，从而比Hive拥有更高的性能。 JDBCServer是一个JDBC接口，用户可以通过JDBC连接JDBCServer

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
准备连接集群配置文件 - MapReduce服务 MRS

准备连接集群配置文件准备集群认证用户信息对于开启Kerberos认证的MRS集群，需提前准备具有相关组件操作权限的用户用于程序认证。以下Flink权限配置示例供参考，在实际业务场景中可根据业务需求灵活调整。登录FusionInsight Manager。选择“系统 > 权限

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > 准备Flink应用开发环境
HBase Java API接口介绍 - MapReduce服务 MRS

HBase Java API接口介绍接口使用建议建议使用org.apache.hadoop.hbase.Cell作为KV数据对象，而不是org.apache.hadoop.hbase.KeyValue。建议使用Connection connection = ConnectionFactory.createConnection

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > HBase应用开发常见问题 > HBase对外接口介绍
HDFS开源增强特性 - MapReduce服务 MRS

HDFS开源增强特性 HDFS开源增强特性：文件块同分布（Colocation）离线数据汇总统计场景中，Join是一个经常用到的计算功能，在MapReduce中的实现方式大体如下： Map任务分别将两个表文件的记录处理成（Join Key，Value），然后按照Join Key做

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS

总条数： 2610

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

MapReduce开源增强特性 - MapReduce服务 MRS

安装客户端（3.x版本） - MapReduce服务 MRS

创建FlinkServer作业写入数据至ClickHouse表 - MapReduce服务 MRS

配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

使用Oozie客户端提交DistCp任务 - MapReduce服务 MRS

HDFS对接OBS业务应用开发样例说明 - MapReduce服务 MRS

Spark JDBCServer接口介绍 - MapReduce服务 MRS

初始化HDFS - MapReduce服务 MRS

多级嵌套子查询以及混合Join的SQL调优 - MapReduce服务 MRS

Yarn与其他组件的关系 - MapReduce服务 MRS

离线数据加载：通过StreamLoad将本地CSV文件导入Doris - MapReduce服务 MRS

多级嵌套子查询以及混合Join的SQL调优 - MapReduce服务 MRS

准备ClickHouse应用开发和运行环境 - MapReduce服务 MRS

准备ClickHouse应用开发和运行环境 - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

Spark JDBCServer接口介绍 - MapReduce服务 MRS

准备连接集群配置文件 - MapReduce服务 MRS

HBase Java API接口介绍 - MapReduce服务 MRS

HDFS开源增强特性 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线