搜索_华为云

使用DBeaver访问MRS HetuEngine - MapReduce服务 MRS

方案架构出于管理和信息收集的需要，企业内部会存储海量数据，包括数目众多的各种数据库、数据仓库等，此时会面临数据源种类繁多、数据集结构化混合、相关数据存放分散等困境，导致跨源查询开发成本高，跨源复杂查询耗时长。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
创建Hive表 - MapReduce服务 MRS
创建Hive表 - MapReduce服务 MRS

创建Hive表功能介绍本小节介绍了如何使用HQL创建内部表、外部表的基本操作。创建表主要有以下三种方式：自定义表结构，以关键字EXTERNAL区分创建内部表和外部表。内部表，如果对数据的处理都由Hive完成，则应该使用内部表。在删除内部表时，元数据和数据一起被删除。外部表

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式） > 开发Hive应用 > Hive JDBC访问样例程序
查看MRS集群监控指标 - MapReduce服务 MRS

查看MRS集群监控指标查看MRS集群资源监控指标查看MRS集群组件监控指标查看MRS集群节点资源监控指标配置MRS集群监控指标数据转储父主题： MRS集群运维

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维
MapReduce Shuffle调优 - MapReduce服务 MRS

MapReduce Shuffle调优操作场景 Shuffle阶段是MapReduce性能的关键部分，包括了从Map task将中间数据写到磁盘一直到Reduce task复制数据并最终放到reduce函数的全部过程。这部分Hadoop提供了大量的调优参数。图1 Shuffle

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce性能调优
应用场景 - MapReduce服务 MRS
应用场景 - MapReduce服务 MRS

应用场景大数据在人们的生活中无处不在，在IoT、电子商务、金融、制造、医疗、能源和政府部门等行业均可以使用华为云MRS服务进行大数据处理。海量数据分析场景海量数据分析是现代大数据系统中的主要场景。通常企业会包含多种数据源，接入后需要对数据进行ETL（Extract-Transform-Load

帮助中心 > MapReduce服务 MRS > 产品介绍
MapReduce与其他组件的关系 - MapReduce服务 MRS

MapReduce与其他组件的关系 MapReduce和HDFS的关系 HDFS是Hadoop分布式文件系统，具有高容错和高吞吐量的特性，可以部署在价格低廉的硬件上，存储应用程序的数据，适合有超大数据集的应用程序。 MapReduce是一种编程模型，用于大数据集（大于1TB）的并行运算

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MapReduce
Sqoop1.4.7适配MRS 3.x集群 - MapReduce服务 MRS

Sqoop1.4.7适配MRS 3.x集群 Sqoop是专为Apache Hadoop和结构化数据库（如关系型数据库）设计的高效传输大量数据的工具。客户需要在MRS中使用sqoop进行数据迁移，MRS旧版本中未自带Sqoop，客户可参考此文档自行安装使用。MRS 3.1.0及之后版本已支持创建集群时勾选

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Sqoop
Flink作业引擎概述 - MapReduce服务 MRS

Flink作业引擎概述 Flink WebUI提供基于Web的可视化开发平台，用户只需要编写SQL即可开发作业，极大降低作业开发门槛。同时通过作业平台能力开放，支持业务人员自行编写SQL开发作业来快速应对需求，大大减少Flink作业开发工作量。 Flink WebUI特点 Flink

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink
Spark常用配置参数 - MapReduce服务 MRS

Spark常用配置参数概述本节介绍Spark使用过程中的常用配置项。以特性为基础划分子章节，以便用户快速搜索到相应的配置项。如果用户使用MRS集群，本节介绍的参数大部分已经适配好，用户无需再进行配置。少数需要用户根据实际场景配置的参数，请参见快速配置Spark参数。配置Stage

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

使用distcp命令跨集群复制HDFS数据操作场景 distcp是一种在集群间或集群内部拷贝大量数据的工具。它利用MapReduce任务实现大量数据的分布式拷贝。前提条件已安装Yarn客户端或者包括Yarn的客户端。例如安装目录为“/opt/client”。各组件业务用户由

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS运维管理
Loader开源增强特性 - MapReduce服务 MRS

Loader开源增强特性 Loader开源增强特性：数据导入导出 Loader是在开源Sqoop组件的基础上进行了一些扩展，除了包含Sqoop开源组件本身已有的功能外，还开发了如下的增强特性：提供数据转化功能支持图形化配置转换步骤支持从SFTP/FTP服务器导入数据到HDFS

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Loader
Hive Group By语句优化 - MapReduce服务 MRS

Hive Group By语句优化操作场景优化Group by语句，可提升命令执行速度和查询速度。 Group by的时候， Map端会先进行分组，分组完后分发到Reduce端， Reduce端再进行分组。可采用Map端聚合的方式来进行Group by优化，开启Map端初步聚合

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
ClickHouse概述 - MapReduce服务 MRS
ClickHouse概述 - MapReduce服务 MRS

ClickHouse概述 ClickHouse表引擎介绍表引擎在ClickHouse中的作用十分关键，不同的表引擎决定了：数据存储和读取的位置支持哪些查询方式能否并发式访问数据能不能使用索引是否可以执行多线程请求数据复制使用的参数其中MergeTree和Distributed

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse
MRS Hive对接CSS服务配置说明 - MapReduce服务 MRS

方案架构 Hive是建立在Hadoop上的数据仓库框架，提供大数据平台批处理计算能力，能够对结构化/半结构化数据进行批量分析汇总完成数据计算。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 周边云服务对接
MRS集群数据备份恢复简介 - MapReduce服务 MRS

MRS集群数据备份恢复简介 MRS集群数据备份恢复概述 Manager提供对集群内的用户数据及系统数据的备份恢复能力，备份功能按组件提供。系统支持备份Manager的数据、组件元数据及业务数据。 MRS 3.x及之后版本，备份功能支持将数据备份至本地磁盘（LocalDir）、本端HDFS

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据
由于Timeout waiting for task异常导致Shuffle FetchFailed - MapReduce服务 MRS

由于Timeout waiting for task异常导致Shuffle FetchFailed 问题使用JDBCServer模式执行100T的TPCDS测试套，出现Timeout waiting for task异常导致Shuffle FetchFailed，Stage一直重试

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
ALM-12039 GaussDB主备数据不同步（2.x及以前版本） - MapReduce服务 MRS

ALM-12039 GaussDB主备数据不同步（2.x及以前版本）告警解释 GaussDB主备数据不同步，系统每10秒检查一次主备数据同步状态，如果连续6次查不到同步状态，或者同步状态异常，产生告警。当主备数据同步状态正常，告警恢复。告警属性告警ID 告警级别可自动清除

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

方案架构 Hive是建立在Hadoop上的数据仓库框架，提供大数据平台批处理计算能力，能够对结构化/半结构化数据进行批量分析汇总完成数据计算。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
HBase与其他组件的关系 - MapReduce服务 MRS

HBase与其他组件的关系 HBase和HDFS的关系 HDFS是Apache的Hadoop项目的子项目，HBase利用Hadoop HDFS作为其文件存储系统。HBase位于结构化存储层，Hadoop HDFS为HBase提供了高可靠性的底层存储支持。除了HBase产生的一些日志文件

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HBase
ALM-27004 DBService主备数据不同步（2.x及以前版本） - MapReduce服务 MRS

ALM-27004 DBService主备数据不同步（2.x及以前版本）告警解释 DBService主备数据不同步，每10秒检查一次主备数据同步状态，如果连续6次查不到同步状态，或者同步状态不正常，产生告警。当同步状态正常，告警恢复。告警属性告警ID 告警级别可自动清除

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 3614

上一页
1
...
6
7
8
...
181
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DBeaver访问MRS HetuEngine - MapReduce服务 MRS

创建Hive表 - MapReduce服务 MRS

查看MRS集群监控指标 - MapReduce服务 MRS

MapReduce Shuffle调优 - MapReduce服务 MRS

应用场景 - MapReduce服务 MRS

MapReduce与其他组件的关系 - MapReduce服务 MRS

Sqoop1.4.7适配MRS 3.x集群 - MapReduce服务 MRS

Flink作业引擎概述 - MapReduce服务 MRS

Spark常用配置参数 - MapReduce服务 MRS

使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

Loader开源增强特性 - MapReduce服务 MRS

Hive Group By语句优化 - MapReduce服务 MRS

ClickHouse概述 - MapReduce服务 MRS

MRS Hive对接CSS服务配置说明 - MapReduce服务 MRS

MRS集群数据备份恢复简介 - MapReduce服务 MRS

由于Timeout waiting for task异常导致Shuffle FetchFailed - MapReduce服务 MRS

ALM-12039 GaussDB主备数据不同步（2.x及以前版本） - MapReduce服务 MRS

使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

HBase与其他组件的关系 - MapReduce服务 MRS

ALM-27004 DBService主备数据不同步（2.x及以前版本） - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线