搜索_华为云

Sqoop1.4.7适配MRS 3.x集群 - MapReduce服务 MRS

tar.gz 从MySQL官网下载MySQL jdbc驱动程序“mysql-connector-java-xxx.jar”，具体MySQL jdbc驱动程序选择参见下表。表1 版本信息 jdbc驱动程序版本 MySQL版本 Connector/J 5.1 MySQL 4.1、MySQL

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Sqoop
在Windows中调测Presto应用开发 - MapReduce服务 MRS

如下：在“现有集群”列表中，单击已创建的集群名称。记录集群的“可用分区”、“虚拟私有云”，以及Master节点的“默认安全组”。在弹性云服务管理控制台，创建一个新的弹性云服务器。弹性云服务器的“可用分区”、“虚拟私有云”、“安全组”，需要和待访问集群的配置相同。选择一个Windows系统的公共镜像。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Presto开发指南 > 调测Presto应用
MRS集群元数据概述 - MapReduce服务 MRS

安装了Hive或Ranger组件的集群支持连接“RDS服务MySQL数据库”，且MySQL数据库版本为MySQL 5.7.x/MySQL 8.0。仅MRS 3.1.2-LTS.3、MRS 3.1.5和MRS 3.3.0-LTS版本集群支持连接“云数据库GaussDB(for MySQL)”。集群支持对接Lak

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据
自定义排序器 - MapReduce服务 MRS

mapPartitions(partition -> { List<Tuple2<String, HoodieRecord<T>>> recordList = new ArrayList<>(); for (; partition.hasNext();)

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Hudi自定义配置项样例程序
自定义排序器 - MapReduce服务 MRS

mapPartitions(partition -> { List<Tuple2<String, HoodieRecord<T>>> recordList = new ArrayList<>(); for (; partition.hasNext();)

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Hudi自定义配置项样例程序
Presto应用开发简介 - MapReduce服务 MRS

Presto主要特点如下：多数据源：Presto可以支持Mysql，Hive，JMX等多种Connector。支持SQL：Presto完全支持ANSI SQL，用户可以直接使用SQL Shell进行查询。混合计算：用户可以对多个Catalog进行join查询。父主题： Presto应用开发概述

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Presto开发指南 > Presto应用开发概述
使用Kafka Eagle对接MRS Kafka - MapReduce服务 MRS

生产者（Producer）将消息发布到Kafka主题（Topic）上，消费者（Consumer）订阅这些主题并消费这些消息。在Kafka集群上一个服务器称为一个Broker。对于每一个主题，Kafka集群保留一个用于缩放、并行化和容错性的分区（Partition）。每个分区是一个有序、不可变的消息序列

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
读取Hudi数据概述 - MapReduce服务 MRS

HetuEngine Y N Y 当前Hudi使用Spark datasource接口读取时，不支持分区推断能力。比如bootstrap表使用datasource接口查询时，可能出现分区字段不显示，或者显示为null的情况。增量视图，需设置set hoodie.hudicow.consume

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi读操作
入门实践 - MapReduce服务 MRS
入门实践 - MapReduce服务 MRS

Hive的元数据信息，存储在MySQL等数据库中。MRS Hive集群的元数据会默认存储到MRS DBService（华为的Gaussdb数据库），也可以选择RDS（MySQL）作为外置元数据库。 Hive的业务数据，存储在HDFS文件系统或OBS对象存储中。 MySQL数据迁移到MRS集群Hive分区表

 帮助中心 > MapReduce服务 MRS > 快速入门
创建Hive表 - MapReduce服务 MRS
创建Hive表 - MapReduce服务 MRS

DESCRIBE employees_like; 扩展应用创建分区表一个表可以拥有一个或者多个分区，每个分区以文件夹的形式单独存在表文件夹的目录下。对分区内数据进行查询，可缩小查询范围，加快数据的检索速度和可对数据按照一定的条件进行管理。分区是在创建表的时候用PARTITIONED BY子句定义的。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式） > 开发Hive应用 > Hive JDBC访问样例程序
窗口函数 - MapReduce服务 MRS
窗口函数 - MapReduce服务 MRS

对每个窗口分区执行排名。 SELECT cookieid, createtime, pv, RANK() OVER(PARTITION BY cookieid ORDER BY pv desc) AS rn1, DENSE_RANK() OVER(PARTITION BY cookieid

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
CDL - MapReduce服务 MRS
CDL - MapReduce服务 MRS

CDL组件基于Kafka Connect框架，抓取的数据都是通过kafka的topic做中转，所以首先依赖Kafka组件，其次CDL本身存储了任务的元数据信息和监控信息，这些数据都存储在数据库，因此也依赖DBService组件。父主题：组件介绍

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
10亿级数据量场景的解决方案有哪些？ - MapReduce服务 MRS

有数据更新、联机事务处理OLTP、复杂分析的场景，建议使用云数据库 GaussDB(for MySQL)。 MRS的Impala + Kudu也能满足该场景，Impala + Kudu可以在join操作时，把当前所有的join表都加载到内存中来实现。父主题：产品咨询类

 帮助中心 > MapReduce服务 MRS > 常见问题 > 产品咨询类
日期类型的字段作为过滤条件时匹配'2016-6-30'时没有查询结果 - MapReduce服务 MRS

日期类型的字段作为过滤条件时匹配'2016-6-30'时没有查询结果问题为什么日期类型的字段作为过滤条件时匹配'2016-6-30'时没有查询结果，匹配'2016-06-30'时有查询结果。如下图所示：“select count(*)from trxfintrx2012 a

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
补丁基本信息说明 - MapReduce服务 MRS

解决Hive启用Ranger鉴权，本用户创建的UDAF报无权限的问题。解决MetaStore删除分区偶现死锁的问题。解决CBG对接外置RDS mysql后开启添加列优化，执行alter cascade操作分区表，由于库中分区量较大导致mysql异常的问题。解决MetaSpace内存泄漏的问题。解决重启ZooKeeper节点后Hive

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.2.0-LTS.1.10补丁说明
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

在读取文件时，将单个分区打包的最大字节数。单位：byte。 134217728（即128M） spark.files.openCostInBytes 打开文件的预估成本，按照同一时间能够扫描的字节数来测量。当一个分区写入多个文件时使用。高估更好，这样小文件分区将比大文件分区更先被调度。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

在读取文件时，将单个分区打包的最大字节数。单位：byte。 134217728（即128M） spark.files.openCostInBytes 打开文件的预估成本，按照同一时间能够扫描的字节数来测量。当一个分区写入多个文件时使用。高估更好，这样小文件分区将比大文件分区更先被调度。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
读取Hudi数据概述 - MapReduce服务 MRS

Spark（SparkDataSource API） Y Y Y 当前Hudi使用Spark datasource接口读取时，不支持分区推断能力。比如bootstrap表使用datasource接口查询时，可能出现分区字段不显示，或者显示为null的情况。增量视图，需设置set hoodie.hudicow.consume

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi读操作
调整HetuEngine INSERT写入优化 - MapReduce服务 MRS

110 4 D 100 5 若“col3”为分区列，其distinct（去重）的count值为3，“hive.max-partitions-per-writers”的值建议大于或等于3。若结果表有多个分区列，如“col2”和“col3”都是分区列，“col2”的distinct的co

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine性能调优
调整Hudi数据源性能 - MapReduce服务 MRS

order_id = 'id1'; 每天订单量稳定，可采用天作为分区键。历史分区更新不频繁，主要数据更新在新分区。调优建议：使用Bucket索引建表（Spark-SQL），并且索引键为订单ID，分区键为日期。定期使用compaction合并日志，提高查询性能。 SQL示例：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine性能调优

总条数： 6499

上一页
1
...
8
9
10
...
325
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Sqoop1.4.7适配MRS 3.x集群 - MapReduce服务 MRS

在Windows中调测Presto应用开发 - MapReduce服务 MRS

MRS集群元数据概述 - MapReduce服务 MRS

自定义排序器 - MapReduce服务 MRS

自定义排序器 - MapReduce服务 MRS

Presto应用开发简介 - MapReduce服务 MRS

使用Kafka Eagle对接MRS Kafka - MapReduce服务 MRS

读取Hudi数据概述 - MapReduce服务 MRS

入门实践 - MapReduce服务 MRS

创建Hive表 - MapReduce服务 MRS

窗口函数 - MapReduce服务 MRS

CDL - MapReduce服务 MRS

10亿级数据量场景的解决方案有哪些？ - MapReduce服务 MRS

日期类型的字段作为过滤条件时匹配'2016-6-30'时没有查询结果 - MapReduce服务 MRS

补丁基本信息说明 - MapReduce服务 MRS

小文件优化 - MapReduce服务 MRS

小文件优化 - MapReduce服务 MRS

读取Hudi数据概述 - MapReduce服务 MRS

调整HetuEngine INSERT写入优化 - MapReduce服务 MRS

调整Hudi数据源性能 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线