搜索_华为云

CDL数据集成概述 - MapReduce服务 MRS

CDL数据集成概述 CDL是一种简单、高效的数据实时集成服务，能够从各种OLTP数据库中抓取Data Change事件，然后推送至Kafka中，最后由Sink Connector消费Topic中的数据并导入到大数据生态软件应用中，从而实现数据的实时入湖。 CDL服务包含了两个重要

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL
配置Spark Core广播变量 - MapReduce服务 MRS

Core广播变量操作场景 Broadcast（广播）可以把数据集合分发到每一个节点上，Spark任务在执行过程中要使用这个数据集合时，就会在本地查找Broadcast过来的数据集合。如果不使用Broadcast，每次任务需要数据集合时，都会把数据序列化到任务里面，不但耗时，还使任务变得很大。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
配置Spark Core广播变量 - MapReduce服务 MRS

Core广播变量操作场景 Broadcast（广播）可以把数据集合分发到每一个节点上，Spark任务在执行过程中要使用这个数据集合时，就会在本地查找Broadcast过来的数据集合。如果不使用Broadcast，每次任务需要数据集合时，都会把数据序列化到任务里面，不但耗时，还使任务变得很大。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
使用广播变量 - MapReduce服务 MRS

使用广播变量操作场景 Broadcast（广播）可以把数据集合分发到每一个节点上，Spark任务在执行过程中要使用这个数据集合时，就会在本地查找Broadcast过来的数据集合。如果不使用Broadcast，每次任务需要数据集合时，都会把数据序列化到任务里面，不但耗时，还使任务变得很大。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
Hive同步数据报错SemanticException - MapReduce服务 MRS

SemanticException: Database does not exist: test_db 回答这种情况通常在试图对Hudi数据集执行Hive同步，但配置的hive_sync数据库不存在时发生。请在您的Hive集群上创建对应的数据库后重试。父主题： Hive同步

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见问题 > Hive同步
Hive同步数据报错SemanticException - MapReduce服务 MRS

SemanticException: Database does not exist: test_db 回答这种情况通常在试图对Hudi数据集执行Hive同步，但配置的hive_sync数据库不存在时发生。请在您的Hive集群上创建对应的数据库后重试。父主题： Hudi常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi常见问题
Spark应用开发简介 - MapReduce服务 MRS

用proxy user参数去提交任务。基本概念 RDD 即弹性分布数据集（Resilient Distributed Dataset），是Spark的核心概念。指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式）
Spark应用开发常用概念 - MapReduce服务 MRS

Spark应用开发常用概念基本概念 RDD 即弹性分布数据集（Resilient Distributed Dataset），是Spark的核心概念。指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从HDFS输入

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
使用CDM服务迁移MySQL数据至MRS Hive - MapReduce服务 MRS

使用CDM服务迁移MySQL数据至MRS Hive 应用场景 MapReduce服务（MapReduce Service，简称MRS）提供企业级大数据集群云服务，里面包含HDFS、Hive、Spark等组件，适用于企业海量数据分析。其中Hive提供类SQL查询语言，帮助用户对大规模的数据

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
Hudi - MapReduce服务 MRS
Hudi - MapReduce服务 MRS

Hudi是一种数据湖的存储格式，在Hadoop文件系统之上提供了更新数据和删除数据的能力以及消费变化数据的能力。支持多种计算引擎，提供IUD接口，在HDFS的数据集上提供了插入更新和增量拉取的功能。如需使用Hudi，请确保MRS集群内已安装Spark/Spark2x服务。图1 Hudi基本架构 Hudi特性

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
MapReduce与其他组件的关系 - MapReduce服务 MRS

HDFS是Hadoop分布式文件系统，具有高容错和高吞吐量的特性，可以部署在价格低廉的硬件上，存储应用程序的数据，适合有超大数据集的应用程序。 MapReduce是一种编程模型，用于大数据集（大于1TB）的并行运算。在MapReduce程序中计算的数据可以来自多个数据源，如Local FileSy

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MapReduce
MapReduce应用开发简介 - MapReduce服务 MRS

来的应用程序能够运行在由上千个服务器组成的大型集群上，并以一种可靠容错的方式并行处理上T级别的数据集。一个MapReduce作业（application/job）通常会把输入的数据集切分为若干独立的数据块，由map任务（task）以完全并行的方式来处理。框架会对map的输出先进

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > MapReduce开发指南（安全模式）
MapReduce应用开发简介 - MapReduce服务 MRS

来的应用程序能够运行在由上千个服务器组成的大型集群上，并以一种可靠容错的方式并行处理上T级别的数据集。一个MapReduce作业（application/job）通常会把输入的数据集切分为若干独立的数据块，由map任务（task）以完全并行的方式来处理。框架会对map的输出先进

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > MapReduce开发指南（普通模式）
节点自定义引导操作 - MapReduce服务 MRS

节点自定义引导操作特性简介 MRS提供标准的云上弹性大数据集群，目前可安装部署包括Hadoop、Spark等大数据组件。当前标准的云上大数据集群不能满足所有用户需求，例如如下几种场景：通用的操作系统配置不能满足实际数据处理需求，例如需调大系统最大连接数。需要安装自身业务所需

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能
MapReduce应用开发简介 - MapReduce服务 MRS

来的应用程序能够运行在由上千个服务器组成的大型集群上，并以一种可靠容错的方式并行处理上T级别的数据集。一个MapReduce作业（application/job）通常会把输入的数据集切分为若干独立的数据块，由map任务（task）以完全并行的方式来处理。框架会对map的输出先进

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（普通模式）
MapReduce应用开发简介 - MapReduce服务 MRS

来的应用程序能够运行在由上千个服务器组成的大型集群上，并以一种可靠容错的方式并行处理上T级别的数据集。一个MapReduce作业（application/job）通常会把输入的数据集切分为若干独立的数据块，由map任务（task）以完全并行的方式来处理。框架会对map的输出先进

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > MapReduce开发指南 > MapReduce应用开发概述
MapReduce应用开发简介 - MapReduce服务 MRS

的应用程序能够运行在由上千个服务器组成的大型集群上，并以一种可靠容错的方式并行处理上TB级别的数据集。一个MapReduce作业（application/job）通常会把输入的数据集切分为若干独立的数据块，由map任务（task）以完全并行的方式来处理。框架会对map的输出先进

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（安全模式）
集群状态消息通知 - MapReduce服务 MRS

集群状态消息通知特性简介大数据集群运行过程中经常会进行如下操作：大数据集群变更，比如扩容、缩容集群。业务数据量突然变化，集群触发弹性伸缩。相关业务结束，需要终止大数据集群等。用户想要及时得知这些操作是否执行成功，以及当集群出现大数据服务不可用，或节点故障时，用户希望不

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能
MRS多租户简介 - MapReduce服务 MRS

MRS多租户简介多租户概述背景介绍：现代企业的数据集群在向集中化和云化方向发展，企业级大数据集群需要满足：不同用户在集群上运行不同类型的应用和作业（分析、查询、流处理等），同时存放不同类型和格式的数据。某些类型的用户（例如银行、政府单位等）对数据安全非常关注，很难容忍将自己的数据与其他用户的放在一起。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群租户
多租户资源管理 - MapReduce服务 MRS

多租户将大数据集群的资源隔离成一个个资源集合，彼此互不干扰，用户通过“租用”需要的资源集合，来运行应用和作业，并存放数据。在大数据集群上可以存在多个资源集合来支持多个用户的不同需求。因此，MRS大数据集群提供了完整的企业级大数据多租户解决方案。多租户是MRS大数据集群中的多个资

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能

总条数： 898

上一页
1
2
3
4
5
...
45
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CDL数据集成概述 - MapReduce服务 MRS

配置Spark Core广播变量 - MapReduce服务 MRS

配置Spark Core广播变量 - MapReduce服务 MRS

使用广播变量 - MapReduce服务 MRS

Hive同步数据报错SemanticException - MapReduce服务 MRS

Hive同步数据报错SemanticException - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发常用概念 - MapReduce服务 MRS

使用CDM服务迁移MySQL数据至MRS Hive - MapReduce服务 MRS

Hudi - MapReduce服务 MRS

MapReduce与其他组件的关系 - MapReduce服务 MRS

MapReduce应用开发简介 - MapReduce服务 MRS

MapReduce应用开发简介 - MapReduce服务 MRS

节点自定义引导操作 - MapReduce服务 MRS

MapReduce应用开发简介 - MapReduce服务 MRS

MapReduce应用开发简介 - MapReduce服务 MRS

MapReduce应用开发简介 - MapReduce服务 MRS

集群状态消息通知 - MapReduce服务 MRS

MRS多租户简介 - MapReduce服务 MRS

多租户资源管理 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线