-
准备MapReduce样例初始数据 - MapReduce服务 MRS
在调测程序之前,需要提前准备将待处理的数据。 运行MapReduce统计样例程序,请参考规划MapReduce统计样例程序数据。 运行MapReduce访问多组件样例程序,请参考规划MapReduce访问多组件样例程序数据。 规划MapReduce统计样例程序数据 将待处理的日志文件放置在HDFS系统中。
-
PyFlink样例程序开发思路 - MapReduce服务 MRS
PyFlink样例程序开发思路 本场景适用于MRS 3.3.0及以后版本。 假定业务平台需要提交Flink任务到MRS集群,业务平台主要使用的语言是Python,提供Python读写Kafka作业和Python提交SQL作业的样例。 父主题: PyFlink样例程序
-
PyFlink样例程序开发思路 - MapReduce服务 MRS
PyFlink样例程序开发思路 本场景适用于MRS 3.3.0及以后版本。 假定业务平台需要提交Flink任务到MRS集群,业务平台主要使用的语言是Python,提供Python读写Kafka作业和Python提交SQL作业的样例。 父主题: PyFlink样例程序
-
什么是MapReduce服务 - MapReduce服务 MRS
出了Hadoop大数据处理的开源解决方案。Hadoop是一个开源分布式计算平台,可以充分利用集群的计算和存储能力,完成海量数据的处理。企业自行部署Hadoop系统有成本高,周期长,难运维和不灵活等问题。 针对上述问题,华为云提供了大数据MapReduce服务(MRS),MRS是一
-
查看部件包 - MapReduce服务 MRS
操作步骤 登录FusionInsight Manager,选择“系统 > 部件”。 在“已安装部件”查看所有部件列表。 在“平台类型”列可查看部件已注册的OS及平台类型。 单击部件名称左侧的,可查看部件包含的服务及其版本号。 父主题: 系统设置
-
DESCRIBE FORMATTED COLUMNS - MapReduce服务 MRS
]table_name [PARTITION partition_spec] col_name 描述 描述表或分区的列信息,将包含指定表或分区的列的统计数据。 示例 describe formatted show_table1 a; Describe Formatted Column
-
Spark Core样例程序(Scala) - MapReduce服务 MRS
Spark Core样例程序(Scala) 功能简介 统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。 代码样例 下面代码片段仅为演示,具体代码参见com.huawei.bigdata.spark.examples.FemaleInfoCollection: val
-
Spark Core样例程序(Java) - MapReduce服务 MRS
Spark Core样例程序(Java) 功能简介 统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。 代码样例 下面代码片段仅为演示,具体代码参见com.huawei.bigdata.spark.examples.FemaleInfoCollection类:
-
MRS集群保留JDK说明 - MapReduce服务 MRS
MRS集群保留JDK说明 MRS集群是租户完全可控的大数据应用开发平台,用户基于平台开发业务后,将业务程序部署到大数据平台运行。由于需要具备开发调测能力,因此要在MRS集群中保留JDK。 此外,MRS集群功能中如下关键特性也强依赖JDK。 HBase BulkLoad HBase
-
快速使用Hive进行数据分析 - MapReduce服务 MRS
射成一张数据库表,并提供类SQL的功能对数据进行分析处理,通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。 背景信息 假定用户开发一个应用程序,用于管理企业中的使用A业务的用户信息,使用Hive客户端实现A业务操作流程如下:
-
安全声明 - MapReduce服务 MRS
OpenJDK,主要使用场景如下: 平台服务运行及维护使用。 Linux客户端运行时使用(主要为业务提交、应用运维等)。 JDK风险说明 系统对自带的JDK进行了权限控制,只有属于FusionInsight平台相关群组的用户才有权限访问,且平台部署在客户内网,安全风险较低。 JDK加固
-
Kafka基本原理 - MapReduce服务 MRS
久化、高吞吐、分布式、多客户端支持、实时等特性,适用于离线和在线的消息消费,如常规的消息收集、网站活性跟踪、聚合统计系统运营数据(监控数据)、日志收集等大量数据的互联网服务的数据收集场景。 Kafka结构 生产者(Producer)将消息发布到Kafka主题(Topic)上,消费
-
Spark Core样例程序(Scala) - MapReduce服务 MRS
Spark Core样例程序(Scala) 功能简介 统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。 代码样例 下面代码片段仅为演示,具体代码参见com.huawei.bigdata.spark.examples.FemaleInfoCollection: 样例:类CollectMapper
-
SHOW - MapReduce服务 MRS
参数描述 表1 参数描述 参数 描述 是否必填 path 需要查询的FS的路径 是 is_sub 默认false,false表示统计指定目录的信息,true表示统计指定目录的子目录的信息 否 sort 默认true,true表示根据storage_size排序结果,false表示根据文件数量排序结果
-
Spark Core样例程序(Scala) - MapReduce服务 MRS
Spark Core样例程序(Scala) 功能简介 统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。 代码样例 下面代码片段仅为演示,具体代码参见com.huawei.bigdata.spark.examples.FemaleInfoCollection: 样例:类CollectMapper
-
Spark Structured Streaming样例程序(Java) - MapReduce服务 MRS
Streaming样例程序(Java) 功能介绍 在Spark应用中,通过使用StructuredStreaming调用Kafka接口来获取单词记录,然后把单词记录分类统计,得到每个单词记录数。 代码样例 下面代码片段仅为演示,具体代码参见:com.huawei.bigdata.spark.examples.KafkaWordCount。
-
Spark Structured Streaming样例程序(Java) - MapReduce服务 MRS
Streaming样例程序(Java) 功能介绍 在Spark应用中,通过使用StructuredStreaming调用Kafka接口来获取单词记录,然后把单词记录分类统计,得到每个单词记录数。 代码样例 下面代码片段仅为演示,具体代码参见:com.huawei.bigdata.spark.examples.KafkaWordCount。
-
Spark Structured Streaming样例程序(Python) - MapReduce服务 MRS
Streaming样例程序(Python) 功能介绍 在Spark应用中,通过使用StructuredStreaming调用Kafka接口来获取单词记录,然后把单词记录分类统计,得到每个单词记录数。 代码样例 下面代码片段仅为演示,具体代码参见:SecurityKafkaWordCount。 当Streaming
-
Spark Structured Streaming状态操作样例程序(Scala) - MapReduce服务 MRS
Spark Structured Streaming状态操作样例程序(Scala) 功能介绍 在Spark结构流应用中,跨批次统计每个session期间发生了多少次event以及本session的开始和结束timestamp;同时输出本批次被更新状态的session。 代码样例
-
Spark Structured Streaming样例程序(Python) - MapReduce服务 MRS
Streaming样例程序(Python) 功能介绍 在Spark应用中,通过使用StructuredStreaming调用Kafka接口来获取单词记录,然后把单词记录分类统计,得到每个单词记录数。 代码样例 下面代码片段仅为演示,具体代码参见:SecurityKafkaWordCount。 当Streaming