搜索_华为云

Flink任务开发规则 - MapReduce服务 MRS

通过状态后端存储所有原始数据，新来的数据根据状态来判断是否是更新操作，进而通过Flink聚合回撤机制实现聚合结果数据的更新。优点：可以解决聚合准确性问题，而且对用户友好，对数据没有要求。缺点：大数据量情况下状态后端存储的数据比较多。通过CDC格式数据解决 CDC格式数据是指更新操作记录中会同时包含

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink任务开发规范
快速开发Hive HCatalog应用 - MapReduce服务 MRS

快速开发Hive HCatalog应用 Hive是一个开源的，建立在Hadoop上的数据仓库框架，提供类似SQL的HQL语言操作结构化数据，其基本原理是将HQL语言自动转换成Mapreduce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
Java样例代码 - MapReduce服务 MRS
Java样例代码 - MapReduce服务 MRS

call(Tuple2<String, Integer> s) throws Exception { //取出女性用户的总停留时间，并判断是否大于2小时 if(s._2() > (2 * 60)) {

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark Core程序
Flink Job Pipeline样例程序（Scala） - MapReduce服务 MRS

val zkRegisterServerHandler = new ZookeeperRegisterServerHandler //添加用户自定义算子产生数据 env.addSource(new UserSource) .keyBy(0).map(x=>x.content

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 开发Flink应用 > Flink Job Pipeline样例程序
批量加载HBase数据并生成本地二级索引 - MapReduce服务 MRS

批量加载HBase数据并生成本地二级索引场景介绍 HBase本身提供了ImportTsv＆LoadIncremental工具来批量加载用户数据。当前提供了HIndexImportTsv来支持加载用户数据的同时可以完成对索引数据的批量加载。HIndexImportTsv继承了HB

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase企业级能力增强 > 配置HBase本地二级索引提升查询效率
Spark应用开发常用概念 - MapReduce服务 MRS

Spark应用开发常用概念基本概念 RDD 即弹性分布数据集（Resilient Distributed Dataset），是Spark的核心概念。指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从HDFS输入

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
批量加载HBase数据并生成本地二级索引 - MapReduce服务 MRS

批量加载HBase数据并生成本地二级索引场景介绍 HBase本身提供了ImportTsv＆LoadIncremental工具来批量加载用户数据。当前提供了HIndexImportTsv来支持加载用户数据的同时可以完成对索引数据的批量加载。HIndexImportTsv继承了HB

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 配置HBase本地二级索引提升查询效率
Flink Job Pipeline样例程序（Scala） - MapReduce服务 MRS

val zkRegisterServerHandler = new ZookeeperRegisterServerHandler //添加用户自定义算子产生数据 env.addSource(new UserSource) .keyBy(0).map(x=>x.content

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > 开发Flink应用 > Flink Job Pipeline样例程序
CarbonData性能调优常见配置参数 - MapReduce服务 MRS

carbon.properties 适用于数据加载场景描述使用索引缓存服务器过程中开启数据预加载可以提升首次查询的性能。如何调优用户可以将该参数设置为true来开启预加载。默认情况，该参数为false。父主题： CarbonData性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData性能调优
Java样例代码 - MapReduce服务 MRS
Java样例代码 - MapReduce服务 MRS

} } }); // 5.筛选连续上网时间超过阈值的用户，并获取结果 upTimeUser.print(); // 6.Streaming系统启动

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark Streaming程序
批量写入Hudi表 - MapReduce服务 MRS

e文件直接做合并产生新的base文件，而不是写log。分区设置操作 Hudi支持多种分区方式，如多级分区、无分区、单分区、时间日期分区。用户可以根据实际需求选择合适的分区方式，接下来将详细介绍Hudi如何配置各种分区类型。多级分区多级分区即指定多个字段为分区键，需要注意的配置项：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi写操作
Flink任务开发建议 - MapReduce服务 MRS

内实现数据点查关联。若数据量过大，需要给TM分配大的内存空间，否则容易导致作业异常。外置维度表：将维度数据存在高速的K-V数据库中，通过远程的K-V查询实现点查关联，常用的开源K-V库有HBase。状态维度表：将维度表数据当做流表，实时读入到流式作业当中，通过数据的回撤流能力

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink任务开发规范
创建集群 - MapReduce服务 MRS
创建集群 - MapReduce服务 MRS

node_keypair_name不能为空。默认取值：不涉及 node_root_password 否 String 参数解释：配置访问集群节点的root密码。约束限制：不涉及取值范围：密码设置约束如下：字符串类型，可输入的字符串长度为8-26。至少包含四种字符

 帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 集群管理接口
配置Container日志聚合功能 - MapReduce服务 MRS

ser}/{yarn.nodemanager.remote-app-log-dir-suffix}”。说明： {user}为运行任务时的用户名。 logs yarn.nodemanager.log-aggregator.on-fail.remain-log-in-sec 设置C

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn
在Linux环境中调测HDFS应用 - MapReduce服务 MRS

在Linux环境中调测HDFS应用操作场景 HDFS应用程序支持在Linux环境中运行。在程序代码完成开发后，可以上传Jar包至准备好的Linux环境中运行。 HDFS应用程序运行完成后，可直接通过运行结果查看应用程序运行情况，也可以通过HDFS日志获取应用运行情况。前提条件

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（普通模式） > 调测HDFS应用
创建集群并执行作业 - MapReduce服务 MRS

参考MRS服务支持的组件获取MRS版本及对应版本支持的组件信息接口约束集群登录方式有密码和密钥对两种，两者必选其一。使用密码方式需要配置访问集群节点的root密码，即cluster_master_secret。使用密钥对方式需要配置密钥对名称，即node_public_cert_name。

帮助中心 > MapReduce服务 MRS > API参考 > API V1.1 > 集群管理接口
新增并执行作业 - MapReduce服务 MRS

在作业详情展示和日志打印中存在暴露的风险，请谨慎操作。提交HiveScript或HiveSql类型的作业时如需以“obs://”开头格式访问存储在OBS上的文件，请在Hive服务配置页面搜索参数“core.site.customized.configs”，新增OBS的endpoint配置项，参数为“fs

帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 作业管理接口

总条数： 3097

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink任务开发规则 - MapReduce服务 MRS

快速开发Hive HCatalog应用 - MapReduce服务 MRS

Java样例代码 - MapReduce服务 MRS

Flink Job Pipeline样例程序（Scala） - MapReduce服务 MRS

批量加载HBase数据并生成本地二级索引 - MapReduce服务 MRS

Spark应用开发常用概念 - MapReduce服务 MRS

批量加载HBase数据并生成本地二级索引 - MapReduce服务 MRS

Flink Job Pipeline样例程序（Scala） - MapReduce服务 MRS

CarbonData性能调优常见配置参数 - MapReduce服务 MRS

Java样例代码 - MapReduce服务 MRS

批量写入Hudi表 - MapReduce服务 MRS

Flink任务开发建议 - MapReduce服务 MRS

创建集群 - MapReduce服务 MRS

配置Container日志聚合功能 - MapReduce服务 MRS

在Linux环境中调测HDFS应用 - MapReduce服务 MRS

创建集群并执行作业 - MapReduce服务 MRS

新增并执行作业 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线