搜索_华为云

作业管理 - MapReduce服务 MRS
作业管理 - MapReduce服务 MRS

Studio，用户可以先在线开发调试MRS HQL/SparkSQL脚本、拖拽式地开发MRS作业，完成MRS与其他20多种异构数据源之间的数据迁移和数据集成；通过强大的作业调度与灵活的监控告警，轻松管理数据作业运维。目前MRS集群支持在线创建如下几种类型的作业： MapReduce：提供快

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能
升级Master节点规格 - MapReduce服务 MRS

升级Master节点规格 MRS大数据集群采用Manager实现集群的管理，而管理集群的相关服务，如HDFS存储系统的NameNode，Yarn资源管理的ResourceManager，以及MRS的Manager管理服务都部署在集群的Master节点上。随着新业务的上线，集群规

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能 > 集群管理
使用FineBI访问MRS HetuEngine - MapReduce服务 MRS

gine。方案架构出于管理和信息收集的需要，企业内部会存储海量数据，包括数目众多的各种数据库、数据仓库等，此时会面临数据源种类繁多、数据集结构化混合、相关数据存放分散等困境，导致跨源查询开发成本高，跨源复杂查询耗时长。 HetuEngine提供了统一标准SQL实现跨源协同分析，简化跨源分析操作。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
Spark开源增强特性 - MapReduce服务 MRS

跨源复杂数据的SQL查询优化出于管理和信息收集的需要，企业内部会存储海量数据，包括数目众多的各种数据库、数据仓库等，此时会面临以下困境：数据源种类繁多，数据集结构化混合，相关数据存放分散等，这就导致了跨源复杂查询因传输效率低，耗时长。当前开源Spark在跨源查询时，只能对简单的filter进行

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
什么是MapReduce服务 - MapReduce服务 MRS

（MRS），MRS是一个在华为云上部署和管理Hadoop系统的服务，一键即可部署Hadoop集群。MRS提供租户完全可控的一站式企业级大数据集群云服务，完全兼容开源接口，结合华为云计算、存储优势及大数据行业经验，为客户提供高性能、低成本、灵活易用的全栈大数据平台，轻松运行Hado

帮助中心 > MapReduce服务 MRS > 产品介绍
同步Kafka数据至ClickHouse - MapReduce服务 MRS

同步Kafka数据至ClickHouse 您可以通过创建Kafka引擎表将Kafka数据自动同步至ClickHouse集群，具体操作详见本章节描述。前提条件已创建Kafka集群。已安装Kafka客户端，详细可以参考安装客户端。已创建ClickHouse集群，并且ClickH

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse数据导入
Spark跨源复杂数据的SQL查询优化 - MapReduce服务 MRS

Spark跨源复杂数据的SQL查询优化场景描述出于管理和信息收集的需要，企业内部会存储海量数据，包括数目众多的各种数据库、数据仓库等，此时会面临以下困境：数据源种类繁多，数据集结构化混合，相关数据存放分散等，这就导致了跨源复杂查询因传输效率低，耗时长。当前开源Spark在跨源查询时，只能对简单的filter进行

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x
节点标签管理 - MapReduce服务 MRS

关联，可以让拥有大量云资源的用户，通过给云资源打标签，快速查找具有同一标签属性的云资源，进行统一检视、修改、删除等管理操作，方便用户对大数据集群及其他相关云资源的统一管理。您可以在创建集群时添加标签，也可以在集群创建完成后，在集群的详情页添加标签，您最多可以给集群添加10个标签。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能 > 集群管理
使用永洪BI访问MRS HetuEngine - MapReduce服务 MRS

> hive > default > 视图”，在右侧“新建数据集”选择“SQL数据集”。在“数据源”处选择新建的数据集，显示所有表信息，选中其中一个表，如“test”表，单击“刷新数据”，可在右侧“数据详情”中显示表的所有信息。父主题：生态组件对接

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
批量写入Hudi表 - MapReduce服务 MRS

的数据源，建议使用该操作。由于INSERT时不会对主键进行排序，所以初始化数据集不建议使用INSERT。在确定数据都为新数据时建议使用INSERT，当存在更新数据时建议使用UPSERT，当初始化数据集时建议使用BULK_INSERT。批量写入Hudi表引入Hudi包生成测试数据，参考使用Spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi写操作
CREATE DATABASE创建数据库 - MapReduce服务 MRS

CREATE DATABASE创建数据库本章节主要介绍ClickHouse创建数据库的SQL基本语法和使用说明。基本语法 CREATE DATABASE [IF NOT EXISTS] database_name [ON CLUSTER ClickHouse集群名] ON CLUSTER

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse常用SQL语法
MRS集群元数据概述 - MapReduce服务 MRS

MRS集群元数据概述 MRS的数据连接用于管理集群中组件使用的外部源连接，如Hive的元数据可以通过数据连接关联使用外部的关系型数据库。本地元数据：元数据存储于集群内自带的本地GaussDB中，当集群删除时元数据同时被删除，如需保存元数据，需提前前往数据库手动保存元数据。外置

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据
集群在线扩缩容 - MapReduce服务 MRS

集群在线扩缩容大数据集群的处理能力通常可以通过增加集群的节点数来横向扩展，当集群规模不符合业务要求时，用户可以通过该功能进行集群节点规模的调整，进行扩容或者缩容；在缩容节点时，MRS会智能地选择负载最少或者迁移数据量最小节点，并且在缩容过程中，缩容节点不再接收新的任务，正在执行

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能 > 集群管理
Yarn节点配置调优 - MapReduce服务 MRS

Yarn节点配置调优操作场景合理配置大数据集群的调度器后，还可通过调节每个节点的可用内存、CPU资源及本地磁盘的配置进行性能调优。具体包括以下配置项：可用内存 CPU虚拟核数物理CPU使用百分比内存和CPU资源的协调本地磁盘操作步骤若您需要对参数配置进行调整，具体操作请参考修改集群服务配置参数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn性能调优
MRS集群节点规格说明 - MapReduce服务 MRS

MRS当前支持主机规格的配型由CPU+内存+Disk共同决定。弹性云服务器由多个租户共享物理资源，而裸金属服务器的资源归用户独享。对于关键类应用或性能要求较高的业务（如大数据集群、企业中间件系统），并且要求安全可靠的运行环境，使用裸金属服务器更合适。当使用BMS类型的规格时，不支持升级Master节点规格。仅

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群规划 > 业务选型
准备工作 - MapReduce服务 MRS
准备工作 - MapReduce服务 MRS

态，期间不能运行除数据迁移作业外的其他任何业务。云数据迁移（Cloud Data Migration，简称CDM），是一种高效、易用的数据集成服务。CDM围绕大数据迁移上云和智能数据湖解决方案，提供了简单易用的迁移能力和多种数据源到数据湖的集成能力，降低了客户数据源迁移和集成的

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移 > 数据迁移方案介绍
配置HDFS DataNode数据均衡 - MapReduce服务 MRS

配置HDFS DataNode数据均衡操作场景本章节适用于MRS 3.x及后续版本。 HDFS集群可能出现DataNode节点间磁盘利用率不平衡的情况，比如集群中添加新数据节点的场景。如果HDFS出现数据不平衡的状况，可能导致多种问题，比如MapReduce应用程序无法很好地

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
CarbonData - MapReduce服务 MRS
CarbonData - MapReduce服务 MRS

数据查询时，CarbonData Engine模块负责执行数据集的读取、过滤等实际任务。CarbonData Engine作为Spark Executor进程的一部分运行，负责处理数据文件块的一个子集。 Table数据集数据存储在HDFS中。同一Spark集群内的节点可以作为HDFS的数据节点。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
快速使用HetuEngine访问Hive数据源 - MapReduce服务 MRS

快速使用HetuEngine访问Hive数据源本章节指导用户从零开始使用HetuEngine对接Hive数据源，并通过HetuEngine查询本集群Hive数据源的数据库表。前提条件集群已安装HetuEngine、Hive服务及其所依赖的服务（DBService、KrbSe

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine
Spark Python API接口介绍 - MapReduce服务 MRS

preservesPartitioning=False) 对调用map的RDD数据集中的每个element都使用Func，生成新的RDD。 filter(f) 对RDD中所有元素调用Func，生成将满足条件数据集以RDD形式返回。 flatMap(f, preservesPartitioning=False)

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍

总条数： 3499

上一页
1
...
4
5
6
...
175
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

作业管理 - MapReduce服务 MRS

升级Master节点规格 - MapReduce服务 MRS

使用FineBI访问MRS HetuEngine - MapReduce服务 MRS

Spark开源增强特性 - MapReduce服务 MRS

什么是MapReduce服务 - MapReduce服务 MRS

同步Kafka数据至ClickHouse - MapReduce服务 MRS

Spark跨源复杂数据的SQL查询优化 - MapReduce服务 MRS

节点标签管理 - MapReduce服务 MRS

使用永洪BI访问MRS HetuEngine - MapReduce服务 MRS

批量写入Hudi表 - MapReduce服务 MRS

CREATE DATABASE创建数据库 - MapReduce服务 MRS

MRS集群元数据概述 - MapReduce服务 MRS

集群在线扩缩容 - MapReduce服务 MRS

Yarn节点配置调优 - MapReduce服务 MRS

MRS集群节点规格说明 - MapReduce服务 MRS

准备工作 - MapReduce服务 MRS

配置HDFS DataNode数据均衡 - MapReduce服务 MRS

CarbonData - MapReduce服务 MRS

快速使用HetuEngine访问Hive数据源 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线