搜索_华为云

调整Hudi数据源性能 - MapReduce服务 MRS

调整Hudi数据源性能本章节适用于MRS 3.3.1及以后版本。 HetuEngine具备高速访问Hive、Hudi等数据源的能力。对于Hudi数据源调优，可以分为对Hudi表本身和对集群环境的调优。 Hudi表调优可参考如下建议优化表和数据设计：建表时尽量按照频繁使用的过滤条件字段进行分区。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine性能调优
Kafka应用开发规则 - MapReduce服务 MRS

Kafka应用开发规则调用Kafka API（AdminZkClient.createTopic）创建Topic 对于Java开发语言，正确示例： import kafka.zk.AdminZkClient; import kafka.zk.KafkaZkClient; import

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Kafka应用开发规范
快速开发ClickHouse应用 - MapReduce服务 MRS

快速开发ClickHouse应用 ClickHouse是面向联机分析处理的列式数据库，支持SQL查询，且查询性能好，特别是基于大宽表的聚合分析查询性能非常优异，比其他分析型数据库速度快一个数量级。 ClickHouse的设计优点：数据压缩比高多核并行计算向量化计算引擎支持嵌套数据结构支持稀疏索引

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
快速开发Hive JDBC应用 - MapReduce服务 MRS

快速开发Hive JDBC应用 Hive是一个开源的，建立在Hadoop上的数据仓库框架，提供类似SQL的HQL语言操作结构化数据，其基本原理是将HQL语言自动转换成Mapreduce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
快速开发Hive HCatalog应用 - MapReduce服务 MRS

快速开发Hive HCatalog应用 Hive是一个开源的，建立在Hadoop上的数据仓库框架，提供类似SQL的HQL语言操作结构化数据，其基本原理是将HQL语言自动转换成Mapreduce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
快速开发Flink应用 - MapReduce服务 MRS

快速开发Flink应用 Flink是一个批处理和流处理结合的统一计算框架，其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理，是业界最顶级的开源流处理引擎。 Flink最适合的应用场景是低时延的数据处理（Data Processing）场景：高并发pi

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
配置矢量化读取ORC数据 - MapReduce服务 MRS

进行存储，并且文件中的数据尽可能的压缩来降低存储空间的消耗。矢量化读取ORC格式的数据能够大幅提升ORC数据读取性能。在Spark2.3版本中，SparkSQL支持矢量化读取ORC数据（这个特性在Hive的历史版本中已经得到支持）。矢量化读取ORC格式的数据能够获得比传统读取方式数倍的性能提升。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
Flink应用性能调优建议 - MapReduce服务 MRS

设置并行度并行度控制任务的数量，影响操作后数据被切分成的块数。调整并行度让任务的数量和每个任务处理的数据与机器的处理能力达到最优。查看CPU使用情况和内存占用情况，当任务和数据不是平均分布在各节点，而是集中在个别节点时，可以增大并行度使任务和数据更均匀的分布在各个节点。增加任务的并行度，充分利用集群机器的计算能力。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发常见问题
Doris应用开发规范 - MapReduce服务 MRS

Doris应用开发规范 Doris建表规范 Doris数据变更规范 Doris命名规范 Doris数据查询规范 Doris数据导入规范 Doris UDF开发规范 Doris连接运行规范

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范
Flink开发规范概述 - MapReduce服务 MRS

规范：数据表设计资源配置性能调优常见故障处理常用参数配置术语约定本规范采用以下的术语描述：规则：编程时必须遵守的原则。建议：编程时必须加以考虑的原则。说明：对此规则或建议进行的解释。示例：对此规则或建议给出示例。适用范围基于MRS-Flink数据存储进行

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范
Kafka SimpleConsumer API使用样例 - MapReduce服务 MRS

// 允许读取的最大消息数 long maxReads = 0; try { maxReads = Long.valueOf(args[0]); }

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Kafka开发指南 > 开发Kafka应用
ClickHouse调优思路 - MapReduce服务 MRS

及排序键的靠前位置。数据库参数调优通过调优数据参数，提升数据库性能，保障数据库稳定运行。更多信息可参考ClickHouse社区文档相关调优内容https://clickhouse.com/docs/en/intro。父主题： ClickHouse数据库调优

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse数据库调优
ClickHouse日志管理规则 - MapReduce服务 MRS

log/Bigdata/audit/clickhouse/clickhouse-server-audit.log”。 ClickHouse数据迁移日志：“/var/log/Bigdata/clickhouse/migration/${task_name}/clickhouse-c

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse数据库运维
Hudi表模型设计规范 - MapReduce服务 MRS

Hudi表必须配置precombine字段。在数据同步过程中不可避免会出现数据重复写入、数据乱序问题，例如：异常数据恢复、写入程序异常重启等场景。通过设置合理precombine字段值可以保证数据的准确性，老数据不会覆盖新数据，也就是幂等写入能力。该字段可用选择的类型包括：业务表中更新时间戳、数据库的提交时间戳

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表设计规范
TTL变更 - MapReduce服务 MRS
TTL变更 - MapReduce服务 MRS

toIntervalMonth(2) SETTINGS materialize_ttl_after_modify=0; 2）删除过期数据，直接删除过期数据分区：alter table default.test_auto drop partation xxx; --多个分区逐一删除父主题：

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse数据库运维 > 表运维
FlinkSQL JDBC表开发规则 - MapReduce服务 MRS

FlinkSQL JDBC表开发规则提前在对应数据库中创建表 JDBC作为sink表时，需要提前在对应数据库（如MySQL）中创建好用于接收数据的空表。 JDBC作为维表时，需要提前在对应数据库（如MySQL）中创建好维度表。父主题： FlinkSQL Connector开发规范

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > FlinkSQL Connector开发规范
Hudi表初始化 - MapReduce服务 MRS
Hudi表初始化 - MapReduce服务 MRS

Hudi表初始化初始化导入存量数据通常由Spark作业来完成，由于初始化数据量通常较大，因此推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量（例如Sp

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Bucket调优示例
SparkSQL建表参数规范 - MapReduce服务 MRS

建表必须指定primaryKey和preCombineField。 Hudi表提供了数据更新的能力和幂等写入的能力，该能力要求数据记录必须设置主键用来识别重复数据和更新操作。不指定主键会导致表丢失数据更新能力，不指定preCombineField会导致主键重复。参数名称参数描述

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Spark on Hudi开发规范
备份Manager数据（MRS 2.x及之前版本） - MapReduce服务 MRS

数据、LdapServer数据、DBService数据和NameNode数据。备份Manager数据包含同时备份OMS数据和LdapServer数据。默认情况下，元数据备份由“default”任务支持。该任务指导用户通过MRS Manager创建备份任务并备份元数据。支持创建任务自动或手动备份数据。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据 > 备份MRS集群组件数据
Spark Structured Streaming对接Kafka样例程序（Scala） - MapReduce服务 MRS

（Scala）功能介绍使用Structured Streaming，从kafka中读取广告请求数据、广告展示数据、广告点击数据，实时获取广告有效展示统计数据和广告有效点击统计数据，将统计结果写入kafka中。代码样例下面代码片段仅为演示，具体代码参见：com.huawei

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming对接Kafka样例程序

总条数： 3443

上一页
1
...
5
6
7
...
173
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

调整Hudi数据源性能 - MapReduce服务 MRS

Kafka应用开发规则 - MapReduce服务 MRS

快速开发ClickHouse应用 - MapReduce服务 MRS

快速开发Hive JDBC应用 - MapReduce服务 MRS

快速开发Hive HCatalog应用 - MapReduce服务 MRS

快速开发Flink应用 - MapReduce服务 MRS

配置矢量化读取ORC数据 - MapReduce服务 MRS

Flink应用性能调优建议 - MapReduce服务 MRS

Doris应用开发规范 - MapReduce服务 MRS

Flink开发规范概述 - MapReduce服务 MRS

Kafka SimpleConsumer API使用样例 - MapReduce服务 MRS

ClickHouse调优思路 - MapReduce服务 MRS

ClickHouse日志管理规则 - MapReduce服务 MRS

Hudi表模型设计规范 - MapReduce服务 MRS

TTL变更 - MapReduce服务 MRS

FlinkSQL JDBC表开发规则 - MapReduce服务 MRS

Hudi表初始化 - MapReduce服务 MRS

SparkSQL建表参数规范 - MapReduce服务 MRS

备份Manager数据（MRS 2.x及之前版本） - MapReduce服务 MRS

Spark Structured Streaming对接Kafka样例程序（Scala） - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线