搜索_华为云

Spark Structured Streaming对接Kafka样例程序（Scala） - MapReduce服务 MRS

（Scala）功能介绍使用Structured Streaming，从Kafka中读取广告请求数据、广告展示数据、广告点击数据，实时获取广告有效展示统计数据和广告有效点击统计数据，将统计结果写入kafka中。代码样例下面代码片段仅为演示，具体代码参见：com.huawei

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming对接Kafka样例程序
Spark Structured Streaming对接Kafka样例程序（Scala） - MapReduce服务 MRS

（Scala）功能介绍使用Structured Streaming，从kafka中读取广告请求数据、广告展示数据、广告点击数据，实时获取广告有效展示统计数据和广告有效点击统计数据，将统计结果写入kafka中。代码样例下面代码片段仅为演示，具体代码参见：com.huawei

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming对接Kafka样例程序
HBase应用开发简介 - MapReduce服务 MRS

HBase应用开发简介 HBase简介 HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。HBase设计目标是用来解决关系型数据库在处理海量数据时的局限性。 HBase使用场景有如下几个特点：处理海量数据（TB或PB级别以上）。具有高吞吐量。在海量数据中实现高效的随机读取。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > HBase应用开发概述
Flink应用性能调优建议 - MapReduce服务 MRS

设置并行度并行度控制任务的数量，影响操作后数据被切分成的块数。调整并行度让任务的数量和每个任务处理的数据与机器的处理能力达到最优。查看CPU使用情况和内存占用情况，当任务和数据不是平均分布在各节点，而是集中在个别节点时，可以增大并行度使任务和数据更均匀的分布在各个节点。增加任务的并行度，充分利用集群机器的计算能力。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发常见问题
快速开发Hive JDBC应用 - MapReduce服务 MRS

快速开发Hive JDBC应用 Hive是一个开源的，建立在Hadoop上的数据仓库框架，提供类似SQL的HQL语言操作结构化数据，其基本原理是将HQL语言自动转换成Mapreduce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
快速开发Hive HCatalog应用 - MapReduce服务 MRS

快速开发Hive HCatalog应用 Hive是一个开源的，建立在Hadoop上的数据仓库框架，提供类似SQL的HQL语言操作结构化数据，其基本原理是将HQL语言自动转换成Mapreduce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
ClickHouse分区设计 - MapReduce服务 MRS

如果业务场景需要做小时分区，使用pt_d、pt_h做联合分区键，其中pt_h是整型小时数。如果保存多年数据，建议考虑使用月做分区，toYYYYMM（pt_d）。综合考虑数据分区粒度、每个批次提交的数据量、数据的保存周期等因素，合理控制part数量。父主题： ClickHouse宽表设计

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse宽表设计
Kafka应用开发规则 - MapReduce服务 MRS

Kafka应用开发规则调用Kafka API（AdminZkClient.createTopic）创建Topic 对于Java开发语言，正确示例： import kafka.zk.AdminZkClient; import kafka.zk.KafkaZkClient; import

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Kafka应用开发规范
ClickHouse应用开发规范 - MapReduce服务 MRS

ClickHouse应用开发规范 ClickHouse设计规范概述 ClickHouse集群规划 ClickHouse数据库设计 ClickHouse宽表设计 ClickHouse物化视图设计 ClickHouse逻辑视图设计 ClickHouse数据库开发 ClickHouse数据库调优 ClickHouse数据库运维

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范
Flink任务开发规则 - MapReduce服务 MRS

DC采集工具，将数据采集到Kafka，然后Flink读Kafka数据进行计算。通过changelog数据解决 changelog与CDC格式的数据类似，只不过存储的方式不同，CDC格式数据会将更新前和更新后的数据在一行记录，而changelog数据会将更新数据拆分成两行，一行是

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink任务开发规范
FlinkSQL Doris数据表开发规则 - MapReduce服务 MRS

Doris数据表开发规则提前在Doris中创建表： Flink作业在Doris中找不到对应表会报错，所以需要提前在Doris中创建好对应的表。 Doris作为Sink表时需开启CheckPoint： Flink作业在触发CheckPoint时才会往Doris表中写数据。父主题：

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > FlinkSQL Connector开发规范
FlinkSQL HBase数据表开发建议 - MapReduce服务 MRS

FlinkSQL HBase数据表开发建议客户端提交作业时通过with属性添加HBase配置信息 Flink客户端提交作业，如SQL client提交，在建表语句中添加如下配置：表1 Flink作业with属性配置说明 'properties.hbase.rpc.protection'

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > FlinkSQL Connector开发规范
ClickHouse逻辑视图设计 - MapReduce服务 MRS

装为一个视图，后续查询时只查询视图，简化业务查询使用。如果业务间有权限隔离诉求，可将部分数据查询封装到视图中，使用视图方只能看到视图下有限行及列的数据。父主题： ClickHouse应用开发规范

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范
Spark Structured Streaming对接Kafka样例程序（Scala） - MapReduce服务 MRS

（Scala）功能介绍使用Structured Streaming，从kafka中读取广告请求数据、广告展示数据、广告点击数据，实时获取广告有效展示统计数据和广告有效点击统计数据，将统计结果写入kafka中。代码样例下面代码片段仅为演示，具体代码参见：com.huawei

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming对接Kafka样例程序
Doris应用开发规范 - MapReduce服务 MRS

Doris应用开发规范 Doris建表规范 Doris数据变更规范 Doris命名规范 Doris数据查询规范 Doris数据导入规范 Doris UDF开发规范 Doris连接运行规范

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范
Flink开发规范概述 - MapReduce服务 MRS

规范：数据表设计资源配置性能调优常见故障处理常用参数配置术语约定本规范采用以下的术语描述：规则：编程时必须遵守的原则。建议：编程时必须加以考虑的原则。说明：对此规则或建议进行的解释。示例：对此规则或建议给出示例。适用范围基于MRS-Flink数据存储进行

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范
Spark Java API接口介绍 - MapReduce服务 MRS

责向调用该类的Java应用提供Spark的各种功能，如连接Spark集群，创建RDD，累积量和广播量等。它的作用相当于一个容器。 SparkConf：Spark应用配置类，如设置应用名称，执行模式，executor内存等。 JavaRDD：用于在java应用中定义JavaRDD的

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Flink应用开发常用概念 - MapReduce服务 MRS

Flink应用开发常用概念 DataStream 数据流，是指Flink系统处理的最小数据单元。该数据单元最初由外部系统导入，可以通过socket、Kafka和文件等形式导入，在Flink系统处理后，通过Socket、Kafka和文件等输出到外部系统，这是Flink的核心概念。 Data

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发概述
FlinkSQL JDBC表开发规则 - MapReduce服务 MRS

FlinkSQL JDBC表开发规则提前在对应数据库中创建表 JDBC作为sink表时，需要提前在对应数据库（如MySQL）中创建好用于接收数据的空表。 JDBC作为维表时，需要提前在对应数据库（如MySQL）中创建好维度表。父主题： FlinkSQL Connector开发规范

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > FlinkSQL Connector开发规范
Spark Java API接口介绍 - MapReduce服务 MRS

责向调用该类的Java应用提供Spark的各种功能，如连接Spark集群，创建RDD，累积量和广播量等。它的作用相当于一个容器。 SparkConf：Spark应用配置类，如设置应用名称，执行模式，executor内存等。 JavaRDD：用于在java应用中定义JavaRDD的

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍

总条数： 5004

上一页
1
...
7
8
9
...
251
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Structured Streaming对接Kafka样例程序（Scala） - MapReduce服务 MRS

Spark Structured Streaming对接Kafka样例程序（Scala） - MapReduce服务 MRS

HBase应用开发简介 - MapReduce服务 MRS

Flink应用性能调优建议 - MapReduce服务 MRS

快速开发Hive JDBC应用 - MapReduce服务 MRS

快速开发Hive HCatalog应用 - MapReduce服务 MRS

ClickHouse分区设计 - MapReduce服务 MRS

Kafka应用开发规则 - MapReduce服务 MRS

ClickHouse应用开发规范 - MapReduce服务 MRS

Flink任务开发规则 - MapReduce服务 MRS

FlinkSQL Doris数据表开发规则 - MapReduce服务 MRS

FlinkSQL HBase数据表开发建议 - MapReduce服务 MRS

ClickHouse逻辑视图设计 - MapReduce服务 MRS

Spark Structured Streaming对接Kafka样例程序（Scala） - MapReduce服务 MRS

Doris应用开发规范 - MapReduce服务 MRS

Flink开发规范概述 - MapReduce服务 MRS

Spark Java API接口介绍 - MapReduce服务 MRS

Flink应用开发常用概念 - MapReduce服务 MRS

FlinkSQL JDBC表开发规则 - MapReduce服务 MRS

Spark Java API接口介绍 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线