搜索_华为云

Spark Core样例程序开发思路 - MapReduce服务 MRS

Spark Core样例程序开发思路场景说明假定用户有某个周末网民网购停留时间的日志，基于某些业务要求，要求开发Spark应用程序实现如下功能：统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。周末两天的日志文件第一列为姓名，第二列为性别，第三列为本次停留时间，单位为分钟，分隔符为“

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Core样例程序
Spark SQL样例程序开发思路 - MapReduce服务 MRS

Spark SQL样例程序开发思路场景说明假定用户有某个周末网民网购停留时间的日志文本，基于某些业务要求，要求开发Spark应用程序实现如下功能：统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。周末两天的日志文件第一列为姓名，第二列为性别，第三列为本次停留时间，单位为分钟，分隔符为“

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark SQL样例程序
Spark从HBase读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

Spark从HBase读取数据再写入HBase样例程序开发思路场景说明假定HBase的table1表存储用户当天消费的金额信息，table2表存储用户历史消费的金额信息。现table1表有记录key=1,cf:cid=100，表示用户1在当天消费金额为100元。 table2表有记录key=1

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark从HBase读取数据再写入HBase样例程序
Flink Join样例程序（Java） - MapReduce服务 MRS

env = StreamExecutionEnvironment.getExecutionEnvironment(); // 设置并发度 env.setParallelism(1); // 解析运行参数 ParameterTool

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > 开发Flink应用 > Flink Join样例程序
Flink应用开发简介 - MapReduce服务 MRS

SavePoint Savepoint是指允许用户在持久化存储中保存某个checkpoint，以便用户可以暂停自己的任务进行升级。升级完后将任务状态设置为savepoint存储的状态开始恢复运行，保证数据处理的延续性。 Flink样例工程介绍 MRS样例工程获取地址为https://github

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式）
Flink应用开发简介 - MapReduce服务 MRS

SavePoint Savepoint是指允许用户在持久化存储中保存某个checkpoint，以便用户可以暂停自己的任务进行升级。升级完后将任务状态设置为savepoint存储的状态开始恢复运行，保证数据处理的延续性。样例工程介绍 MRS样例工程获取地址为https://github.c

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式）
Flink Join样例程序（Java） - MapReduce服务 MRS

env = StreamExecutionEnvironment.getExecutionEnvironment(); // 设置并发度 env.setParallelism(1); // 解析运行参数 ParameterTool

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > 开发Flink应用 > Flink Join样例程序
Spark SQL样例程序开发思路 - MapReduce服务 MRS

Spark SQL样例程序开发思路场景说明假定用户有某个周末网民网购停留时间的日志文本，基于某些业务要求，要求开发Spark应用程序实现如下功能：统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。周末两天的日志文件第一列为姓名，第二列为性别，第三列为本次停留时间，单位为分钟，分隔符为“

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark SQL样例程序
Spark Structured Streaming状态操作样例程序开发思路 - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序开发思路场景说明假设需要跨批次统计每个session期间发生了多少次event以及本session的开始和结束timestamp；同时输出本批次被更新状态的session。数据规划在kafka中生成模拟数据（需要有Kafka权限用户）

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming状态操作样例程序
HDFS基本原理 - MapReduce服务 MRS
HDFS基本原理 - MapReduce服务 MRS

HDFS基本原理 HDFS是Hadoop的分布式文件系统（Hadoop Distributed File System），实现大规模数据可靠的分布式读写。HDFS针对的使用场景是数据读写具有“一次写，多次读”的特征，而数据“写”操作是顺序写，也就是在文件创建时的写入或者在现有文件

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
访问Hue WebUI界面 - MapReduce服务 MRS

访问Hue WebUI界面操作场景 MRS集群安装Hue组件后，用户可以通过Hue的WebUI，在图形化界面使用Hadoop生态相关组件。该任务指导用户在MRS集群中打开Hue的WebUI。 Internet Explorer浏览器可能存在兼容性问题，建议更换兼容的浏览器访问Hue

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hue
Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序开发思路场景说明假定某个业务Kafka每1秒就会收到1个单词记录。基于某些业务要求，开发的Spark应用程序实现如下功能：实时累加计算每个单词的记录总数。 “log1.txt”示例文件： LiuYang YuanJing

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Streaming对接Kafka0-10样例程序
更改DataNode的存储目录 - MapReduce服务 MRS

更改DataNode的存储目录操作场景本章节适用于MRS 3.x及后续版本。 HDFS DataNode定义的存储目录不正确或HDFS的存储规划变化时，MRS集群管理员需要在FusionInsight Manager中修改DataNode的存储目录，以保证HDFS正常工作。适用于以下场景：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS运维管理
Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序开发思路场景说明假定某个业务Kafka每1秒就会收到1个单词记录。基于某些业务要求，开发的Spark应用程序实现如下功能：实时累加计算每个单词的记录总数。 “log1.txt”示例文件： LiuYang YuanJing

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Streaming对接Kafka0-10样例程序
Spark Structured Streaming样例程序开发思路 - MapReduce服务 MRS

Spark Structured Streaming样例程序开发思路场景说明在Spark应用中，通过使用StructuredStreaming调用Kafka接口来获取单词记录，然后把单词记录分类统计，得到每个单词记录数。数据规划 StructuredStreaming样例工

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming样例程序
使用CDM服务迁移HBase数据至MRS集群 - MapReduce服务 MRS

使用CDM服务迁移HBase数据至MRS集群应用场景本章节适用于将线下IDC机房或者公有云HBase集群中的数据（支持数据量在几十TB级别或以下的数据量级）迁移到华为云MRS服务。本章节以通过华为云CDM服务 2.9.1.200版本进行数据迁移为例介绍。不同版本操作可能有差

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
更改DataNode的存储目录 - MapReduce服务 MRS

更改DataNode的存储目录操作场景本章节适用于MRS 3.x及后续版本。 HDFS DataNode定义的存储目录不正确或HDFS的存储规划变化时，MRS集群管理员需要在FusionInsight Manager中修改DataNode的存储目录，以保证HDFS正常工作。适用于以下场景：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS运维管理
管理MRS租户资源 - MapReduce服务 MRS

管理MRS租户资源管理MRS租户资源目录管理MRS租户资源池清除MRS租户队列配置重装Yarn服务后手动恢复MRS租户数据删除MRS租户 Superior调度器模式下管理MRS全局用户策略 Capacity调度器模式下清除租户非关联队列父主题：管理MRS集群租户

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群租户
HBase应用开发常用概念 - MapReduce服务 MRS

HBase应用开发常用概念过滤器过滤器提供了非常强大的特性来帮助用户提高HBase处理表中数据的效率。用户不仅可以使用HBase中预定义好的过滤器，而且可以实现自定义的过滤器。协处理器允许用户执行region级的操作，并且可以使用与RDBMS中触发器类似的功能。 Client

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > HBase应用开发概述
Spark从Hive读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序开发思路场景说明假定Hive的person表存储用户当天消费的金额信息，HBase的table2表存储用户历史消费的金额信息。现person表有记录name=1,account=100，表示用户1在当天消费金额为100元。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序

总条数： 2912

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Core样例程序开发思路 - MapReduce服务 MRS

Spark SQL样例程序开发思路 - MapReduce服务 MRS

Spark从HBase读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

Flink Join样例程序（Java） - MapReduce服务 MRS

Flink应用开发简介 - MapReduce服务 MRS

Flink应用开发简介 - MapReduce服务 MRS

Flink Join样例程序（Java） - MapReduce服务 MRS

Spark SQL样例程序开发思路 - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序开发思路 - MapReduce服务 MRS

HDFS基本原理 - MapReduce服务 MRS

访问Hue WebUI界面 - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

更改DataNode的存储目录 - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

Spark Structured Streaming样例程序开发思路 - MapReduce服务 MRS

使用CDM服务迁移HBase数据至MRS集群 - MapReduce服务 MRS

更改DataNode的存储目录 - MapReduce服务 MRS

管理MRS租户资源 - MapReduce服务 MRS

HBase应用开发常用概念 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线