搜索_华为云

使用CDM服务迁移HBase数据至MRS集群 - MapReduce服务 MRS

增数据搬迁到目的端集群。一般每天更新的数据量在GB级别可以使用CDM的“整库迁移”指定时间段的方式进行HBase新增数据迁移。当前使用CDM的“整库迁移”功能时的限制：如果源HBase集群中被删除操作的数据无法同步到目的端集群上。场景迁移的HBase连接器不能与“整库迁移”共

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
配置Ranger元数据存储至RDS - MapReduce服务 MRS

“查看数据库实例”查看已创建的实例。数据库 dataname 待连接的数据库的名称。用户名 datauser 登录待连接的数据库的用户名。密码 - 登录待连接的数据库的密码。当用户选择的数据连接为“RDS服务MySQL数据库”时，请确保使用的数据库用户为root用户。如果

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据
技术支持 - MapReduce服务 MRS
技术支持 - MapReduce服务 MRS

用户基于大数据平台构建的应用系统等。技术支持范围支持的服务 MRS云服务管理控制台提供的相关功能：集群的创建、删除、扩容、缩容集群作业管理集群告警管理集群补丁管理 IAM用户委托管理对外API接口管理 MRS服务提供的开源大数据组件，其中开源组件请参考对应MRS版本组件列表。

帮助中心 > MapReduce服务 MRS > 产品介绍
HBase基本原理 - MapReduce服务 MRS
HBase基本原理 - MapReduce服务 MRS

定义Column的数量和类型。HBase中表的列非常稀疏，不同行的列的个数和类型都可以不同。此外，每个CF都有独立的生存周期（TTL）。可以只对行上锁，对行的操作始终是原始的。 Column 与传统的数据库类似，HBase的表中也有列的概念，列用于表示相同类型的数据。 RegionServer数据存储

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HBase
使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

通过数据应用，进行以下分析：查看薪水支付币种为美元的雇员联系方式。查询入职时间为2014年的雇员编号、姓名等字段，并将查询结果加载到新表中。统计雇员信息共有多少条记录。查询使用以“cn”结尾的邮箱的员工信息。方案架构 Hive是建立在Hadoop上的数据仓库框架，提供大数据平台批处理计算能

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
查询Impala数据 - MapReduce服务 MRS

id) WHERE usd_flag='D'; -- 查询入职时间为2014年的雇员编号、姓名等字段，并将查询结果加载进表employees_info_extended中的入职时间为2014的分区中. INSERT OVERWRITE TABLE employees_info_extended

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Impala开发指南 > 开发Impala应用
使用Loader从HDFS/OBS导出数据到SFTP服务器 - MapReduce服务 MRS

FS/OBS数据源的输入路径目录名、输入路径的子目录名及子文件名不能包含特殊字符/\"':;,中的任意字符。如果设置的任务需要使用指定YARN队列功能，该用户需要已授权有相关YARN队列的权限。设置任务的用户需要获取该任务的执行权限，并获取该任务对应的连接的使用权限。操作步骤

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导出作业
创建Hive表 - MapReduce服务 MRS
创建Hive表 - MapReduce服务 MRS

一个表可以拥有一个或者多个分区，每个分区以文件夹的形式单独存在表文件夹的目录下。对分区内数据进行查询，可缩小查询范围，加快数据的检索速度和可对数据按照一定的条件进行管理。分区是在创建表的时候用PARTITIONED BY子句定义的。 CREATE EXTERNAL TABLE

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式） > 开发Hive应用 > Hive JDBC访问样例程序
通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

录。基于业务需要，开发的Spark应用程序实现实时累加计算每个单词的记录总数的功能。 Spark Streaming样例工程的数据存储在Kafka组件中，向Kafka组件发送数据。 MRS服务提供了Spark服务多种场景下的样例开发工程，本章节对应示例场景的开发思路：接收Kafka中数据，生成相应DStream。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
HBase本地二级索引介绍 - MapReduce服务 MRS

查询具有特定列值的数据：所有数据按RowKey的顺序进行扫描，然后将数据与特定的列值进行匹配，直到找到所需的数据。过滤器功能会scan一些不必要的数据以获取所需的数据。因此，Filter功能不能满足高性能标准频繁查询的要求。这就是HBase HIndex产生的背景。如图1所示，HBase

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase企业级能力增强 > 配置HBase本地二级索引提升查询效率
应用场景 - MapReduce服务 MRS
应用场景 - MapReduce服务 MRS

据输入系统的过程中，对数据进行处理。例如在梯联网行业，智能电梯的数据，实时传入到MRS的流式集群中进行实时告警。图3 梯联网行业低时延流式处理场景该场景下MRS的优势如下所示。实时数据采集：利用Flume实现实时数据采集，并提供丰富的采集和存储连接方式。海量的数据源接入

 帮助中心 > MapReduce服务 MRS > 产品介绍
Sqoop1.4.7适配MRS 3.x集群 - MapReduce服务 MRS

使用MRS客户端中Hive的lib目录下（/opt/Bigdata/client/Hive/Beeline/lib）的jackson开头的jar包替换Sqoop的lib下的相应jar包。图2 jackson开头的jar 将MRS Hive客户端中（/opt/Bigdata/client/H

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Sqoop
ALM-14003 丢失的HDFS块数量超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-14003 丢失的HDFS块数量超过阈值（2.x及以前版本）告警解释系统每30秒周期性检测丢失的块数量，并把丢失的块数量和阈值相比较。丢失的块数量指标默认提供一个阈值范围。当检测到丢失的块数量超出阈值范围时产生该告警。当丢失的块数量小于或等于阈值时，告警恢复。告警属性

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
集群内ClickHouseServer节点间数据迁移 - MapReduce服务 MRS

在选择迁移数据表界面，单击“数据库”后的，选择待迁出节点上存在的数据库，在“数据表”处选择待迁移的数据表，数据表下拉列表中展示的是所选数据库中的MergeTree系列引擎的分区表。“节点信息”中展示的为当前迁入节点、迁出节点上ClickHouse服务数据目录的空间使用情况，单击“下一步”。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse运维管理
ClickHouse概述 - MapReduce服务 MRS
ClickHouse概述 - MapReduce服务 MRS

当合并SummingMergeTree表的数据片段时，ClickHouse会把所有具有相同主键的行合并为一行，该行包含了被合并的行中具有数值数据类型的列的汇总值。如果主键的组合方式使得单个键值对应于大量的行，则可以显著减少存储空间并加快数据查询的速度。建表语法： CREATE TABLE

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse
MapReduce Shuffle调优 - MapReduce服务 MRS

Shuffle阶段是MapReduce性能的关键部分，包括了从Map task将中间数据写到磁盘一直到Reduce task复制数据并最终放到reduce函数的全部过程。这部分Hadoop提供了大量的调优参数。图1 Shuffle过程操作步骤 Map阶段的调优判断Map使用的内存大小判断Map分配的内存是否

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce性能调优
Hive Group By语句优化 - MapReduce服务 MRS

By也同样存在数据倾斜的问题，设置“hive.groupby.skewindata”为“true”，生成的查询计划会有两个MapReduce Job，第一个Job的Map输出结果会随机的分布到Reduce中，每个Reduce做聚合操作，并输出结果，这样的处理会使相同的Group By

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
MapReduce与其他组件的关系 - MapReduce服务 MRS

MapReduce与其他组件的关系 MapReduce和HDFS的关系 HDFS是Hadoop分布式文件系统，具有高容错和高吞吐量的特性，可以部署在价格低廉的硬件上，存储应用程序的数据，适合有超大数据集的应用程序。 MapReduce是一种编程模型，用于大数据集（大于1TB）的并行运算。在Ma

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MapReduce
ALM-12057 元数据未配置周期备份到第三方服务器的任务 - MapReduce服务 MRS

参数含义来源产生告警的集群或系统名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。对系统的影响如果没有将元数据备份到第三方服务器，当集群主备管理节点同时故障且本地备份数据丢失时，若想要通过备份包恢复集群元数据则没有可用的备份包数据无法恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
配置Hive JDBC接口访问Hive安全认证 - MapReduce服务 MRS

mple”样例工程的“com.huawei.bigdata.hive.example”包中，该包包括JDBCExample和JDBCExamplePreLogin类，实现的功能相同，只是认证方式有区别。JDBCExample使用JDBC连接中拼接keytab的方式进行认证；JDB

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（安全模式） > 准备Hive应用开发环境

总条数： 3712

上一页
1
...
7
8
9
...
186
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用CDM服务迁移HBase数据至MRS集群 - MapReduce服务 MRS

配置Ranger元数据存储至RDS - MapReduce服务 MRS

技术支持 - MapReduce服务 MRS

HBase基本原理 - MapReduce服务 MRS

使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

查询Impala数据 - MapReduce服务 MRS

使用Loader从HDFS/OBS导出数据到SFTP服务器 - MapReduce服务 MRS

创建Hive表 - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

HBase本地二级索引介绍 - MapReduce服务 MRS

应用场景 - MapReduce服务 MRS

Sqoop1.4.7适配MRS 3.x集群 - MapReduce服务 MRS

ALM-14003 丢失的HDFS块数量超过阈值（2.x及以前版本） - MapReduce服务 MRS

集群内ClickHouseServer节点间数据迁移 - MapReduce服务 MRS

ClickHouse概述 - MapReduce服务 MRS

MapReduce Shuffle调优 - MapReduce服务 MRS

Hive Group By语句优化 - MapReduce服务 MRS

MapReduce与其他组件的关系 - MapReduce服务 MRS

ALM-12057 元数据未配置周期备份到第三方服务器的任务 - MapReduce服务 MRS

配置Hive JDBC接口访问Hive安全认证 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线