搜索_华为云

基于Kafka的Word Count数据流统计案例 - MapReduce服务 MRS

基于Kafka的Word Count数据流统计案例应用场景 Kafka是一个分布式的消息发布-订阅系统。它采用独特的设计提供了类似JMS的特性，主要用于处理活跃的流式数据。 Kafka有很多适用的场景：消息队列、行为跟踪、运维数据监控、日志收集、流处理、事件溯源、持久化日志等。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

典型场景：从SFTP服务器导入数据到HDFS/OBS 操作场景该任务指导用户使用Loader将数据从SFTP服务器导入到HDFS/OBS。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的HDFS/OBS目录和数据。获取S

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
基于binlog的MySQL数据同步到MRS集群中 - MapReduce服务 MRS

基于binlog的MySQL数据同步到MRS集群中本章节为您介绍使用Maxwell同步工具将线下基于binlog的数据迁移到MRS Kafka集群中的指导。 Maxwell是一个开源程序（https://maxwells-daemon.io），通过读取MySQL的binlog日

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka常见问题
Spark应用开发常用概念 - MapReduce服务 MRS

Spark应用开发常用概念基本概念 RDD 即弹性分布数据集（Resilient Distributed Dataset），是Spark的核心概念。指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从HDFS输入

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
快速创建和使用ClickHouse列式数据库集群 - MapReduce服务 MRS

快速创建和使用ClickHouse列式数据库集群操作场景本入门提供从零开始创建ClickHouse集群并通过集群客户端进行ClickHouse表的创建与查询操作指导。 ClickHouse是一款开源的面向联机分析处理的列式数据库，独立于Hadoop大数据体系，具有压缩率和极速查询性能。

帮助中心 > MapReduce服务 MRS > 快速入门
快速创建和使用HBase离线数据查询集群 - MapReduce服务 MRS

快速创建和使用HBase离线数据查询集群操作场景本入门提供从零开始创建HBase查询集群并通过集群客户端进行HBase表的创建与查询操作指导。 HBase集群使用Hadoop和HBase组件提供一个稳定可靠、性能优异、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分

 帮助中心 > MapReduce服务 MRS > 快速入门
使用Loader从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

使用Loader从SFTP服务器导入数据到HDFS/OBS 操作场景该任务指导用户使用Loader将数据从SFTP服务器导入到HDFS/OBS。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的HDFS/OBS目录和数据。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
使用CDM服务迁移MySQL数据至MRS Hive - MapReduce服务 MRS

使用CDM服务迁移MySQL数据至MRS Hive 应用场景 MapReduce服务（MapReduce Service，简称MRS）提供企业级大数据集群云服务，里面包含HDFS、Hive、Spark等组件，适用于企业海量数据分析。其中Hive提供类SQL查询语言，帮助用户对大

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据应用场景本文介绍如何使用MRS集群运行Spark Streaming作业以消费Kafka数据。假定某个业务Kafka每1秒就会收到1个单词记录。基于业务需要，开发的Spark应用程序实现实时累加计算每个单词的记录总数的功能。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
使用Hive加载HDFS数据并分析图书评分情况 - MapReduce服务 MRS

使用Hive加载HDFS数据并分析图书评分情况应用场景 MRS离线处理集群，可对海量数据进行分析和处理，形成结果数据，供下一步数据应用使用。离线处理对处理时间要求不高，但是所处理数据量较大，占用计算存储资源较多，通常通过Hive/SparkSQL引擎或者MapReduce/Spark2x实现。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
快速创建和使用Hadoop离线数据分析集群 - MapReduce服务 MRS

快速创建和使用Hadoop离线数据分析集群操作场景本入门提供从零开始创建Hadoop离线数据分析集群并通过集群客户端提交一个wordcount作业的操作指导。wordcount是最经典的Hadoop作业，用于统计海量文本的单词数量。 Hadoop集群完全使用开源Hadoop生

 帮助中心 > MapReduce服务 MRS > 快速入门
使用Stream Load方式导入数据至Doris - MapReduce服务 MRS

使用Stream Load方式导入数据至Doris Stream Load是一个同步的导入方式，用户通过HTTP协议发送请求将本地文件或数据流导入到Doris中。Stream Load同步执行导入并返回导入结果，用户可直接通过请求的返回体判断本次导入是否成功。 Stream Lo

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris数据导入
快速创建和使用Kafka流式数据处理集群 - MapReduce服务 MRS

快速创建和使用Kafka流式数据处理集群操作场景本入门提供从零开始创建流式分析集群并在Kafka主题中产生和消费消息的操作指导。 Kafka集群提供一个高吞吐量、可扩展性的消息系统，广泛用于日志收集、监控数据聚合等场景。Kafka可实现高效的流式数据采集、实时数据处理存储等。

帮助中心 > MapReduce服务 MRS > 快速入门
约束与限制 - MapReduce服务 MRS
约束与限制 - MapReduce服务 MRS

约束与限制使用MRS前，您需要认真阅读并了解以下使用限制。 MRS集群创建限制表1 MRS集群创建约束说明限制项说明网络要求 MRS集群必须创建在VPC子网内。创建MRS集群时，支持自动创建安全组，也可选择已有的安全组。 MRS集群使用的安全组请勿随意放开权限，避免被恶意访问。

帮助中心 > MapReduce服务 MRS > 产品介绍
Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 Spark简介 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式）
配置Doris对接Hive数据源 - MapReduce服务 MRS

配置Doris对接Hive数据源通过连接Hive Metastore，或者兼容Hive Metatore的元数据服务，Doris可以自动获取Hive的库表信息，并进行数据查询。除Hive外，很多其他系统也会使用Hive Metastore存储元数据。通过Hive Catalo

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris企业级能力增强 > 配置Doris支持多源数据
快速配置参数 - MapReduce服务 MRS

快速配置参数概述本节介绍Spark2x使用过程中快速配置常用参数和不建议修改的配置参数。快速配置常用参数其他参数在安装集群时已进行了适配，以下参数需要根据使用场景进行调整。以下参数除特别指出外，一般在Spark2x客户端的“spark-defaults.conf”文件中配置。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
如何配置HBase双读功能 - MapReduce服务 MRS

如何配置HBase双读功能操作场景 HBase客户端应用通过自定义加载主备集群配置项，实现了双读能力。HBase双读作为提高HBase集群系统高可用性的一个关键特性，适用于使用Get读取数据、使用批量Get读取数据、使用Scan读取数据，以及基于二级索引查询。它能够同时读取主备集群数据，减少查询毛刺，具体表现为：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > HBase应用开发常见问题
快速配置Spark参数 - MapReduce服务 MRS

快速配置Spark参数概述本节介绍Spark2x使用过程中快速配置常用参数和不建议修改的配置参数。快速配置常用参数其他参数在安装集群时已进行了适配，以下参数需要根据使用场景进行调整。以下参数除特别指出外，一般在Spark2x客户端的“spark-defaults.conf”文件中配置。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
使用Grafana对接IoTDB数据库 - MapReduce服务 MRS

使用Grafana对接IoTDB数据库应用场景 IoTDB（物联网数据库）是一体化收集、存储、管理与分析物联网时序数据的软件系统。 IoTDB支持对接Grafana，对接成功后，即可通过Grafana丰富的图形报表展示能力，对IoTDB中的时序数据进行图形化展示，以分析时序数据的变化趋势等信息。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 物联网时序数据分析

总条数： 678

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

基于Kafka的Word Count数据流统计案例 - MapReduce服务 MRS

典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

基于binlog的MySQL数据同步到MRS集群中 - MapReduce服务 MRS

Spark应用开发常用概念 - MapReduce服务 MRS

快速创建和使用ClickHouse列式数据库集群 - MapReduce服务 MRS

快速创建和使用HBase离线数据查询集群 - MapReduce服务 MRS

使用Loader从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

使用CDM服务迁移MySQL数据至MRS Hive - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

使用Hive加载HDFS数据并分析图书评分情况 - MapReduce服务 MRS

快速创建和使用Hadoop离线数据分析集群 - MapReduce服务 MRS

使用Stream Load方式导入数据至Doris - MapReduce服务 MRS

快速创建和使用Kafka流式数据处理集群 - MapReduce服务 MRS

约束与限制 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

配置Doris对接Hive数据源 - MapReduce服务 MRS

快速配置参数 - MapReduce服务 MRS

如何配置HBase双读功能 - MapReduce服务 MRS

快速配置Spark参数 - MapReduce服务 MRS

使用Grafana对接IoTDB数据库 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线