搜索_华为云

Kafka相关特性说明 - MapReduce服务 MRS

committed隔离级别的事务，保证多条消息原子性的写入到目标分区，同时也能保证Consumer只能看到成功提交的事务消息。Kafka中的事务特性主要用于以下两种场景：生产者发送多条数据可以封装在一个事务中，形成一个原子操作。多条消息要么都发送成功，要么都发送失败。 read-proc

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka常见问题
Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

Streaming接收Kafka中数据，生成请求流、展示流、点击流。对请求流、展示流、点击流的数据进行关联查询。统计结果写入kafka。应用中监控流处理任务的状态。打包项目通过IDEA自带的Maven工具，打包项目，生成jar包。具体操作请参考在Linux环境中调测Spark应用。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming对接Kafka样例程序
Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

registerServerHandler：为注册服务器的句柄。 numberOfSubscribedJobs：为订阅本NettySink的作业数量，该数量必须是明确的，只有当所有订阅者都连接上NettySink，NettySink才发送数据。 NettySource算子 Class

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 开发Flink应用 > Flink Job Pipeline样例程序
更新客户端（3.x之前版本） - MapReduce服务 MRS

端。以下操作以“/opt/Bigdata/client”为例进行说明。 MRS普通集群，在console页面提交作业时，会使用master节点上预置安装的客户端进行作业提交。用户也可使用master节点上预置安装的客户端来连接服务端、查看任务结果或管理数据等对集群安装补丁后，

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 常见操作 > 使用MRS客户端
LOAD DATA - MapReduce服务 MRS
LOAD DATA - MapReduce服务 MRS

Records处理：为了使数据处理应用程序为用户增值，不可避免地需要对数据进行某种程度的集成。在大多数情况下，数据质量问题源于生成源数据的上游（主要）系统。有两种完全不同的方式处理Bad Data：按照原始数据加载所有数据，之后进行除错处理。在进入数据源的过程中，可以清理或擦除Bad

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
创建Hive用户自定义函数 - MapReduce服务 MRS

ython的UDF函数。下面以编写一个AddDoublesUDF为例，说明UDF的编写和使用方法。功能介绍 AddDoublesUDF主要用来对两个及多个浮点数进行相加，在该样例中可以掌握如何编写和使用UDF。一个普通UDF必须继承自“org.apache.hadoop.hive

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive企业级能力增强
配置MRS集群通过IAM委托对接OBS - MapReduce服务 MRS

务场景需求确认是否需要配置委托。集群的Hadoop、Hive、Spark、Presto、Flink组件支持该功能。通过IAM委托对接OBS主要操作如下：创建具有访问OBS权限的ECS委托创建存算分离集群创建OBS文件系统用于存放数据配置生命周期规则创建具有访问OBS权限的ECS委托

 帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 配置MRS集群通过IAM委托对接OBS
使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

Language语言操作结构化数据，其基本原理是将HQL语言自动转换成MapReduce任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：海量结构化数据分析汇总。将复杂的MapReduce编写任务简化为SQL语句。灵活的数据存储格式，支持JSON、CSV、TE

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
创建Hive用户自定义函数 - MapReduce服务 MRS

ython的UDF函数。下面以编写一个AddDoublesUDF为例，说明UDF的编写和使用方法。功能介绍 AddDoublesUDF主要用来对两个及多个浮点数进行相加，在该样例中可以掌握如何编写和使用UDF。一个普通UDF必须继承自“org.apache.hadoop.hive

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive企业级能力增强
准备HDFS应用开发和运行环境 - MapReduce服务 MRS

HDFS/config/* root@客户端节点IP地址:/opt/client/conf 准备MRS应用开发用户时获取的keytab文件也需放置于该目录下，主要配置文件说明如表2所示。表2 配置文件文件名称作用 core-site.xml 配置HDFS详细参数。 hdfs-site.xml 配置HDFS详细参数。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式） > 准备HDFS应用开发环境
Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

registerServerHandler：为注册服务器的句柄。 numberOfSubscribedJobs：为订阅本NettySink的作业数量，该数量必须是明确的，只有当所有订阅者都连接上NettySink，NettySink才发送数据。 NettySource算子 Class

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > 开发Flink应用 > Flink Job Pipeline样例程序
Hive用户权限说明 - MapReduce服务 MRS

如果用户访问别人创建的表或数据库，需要授予权限。所以根据Hive使用场景的不同，用户需要的权限可能也不相同。表1 Hive使用场景主要场景用户需要的权限使用Hive表、列或数据库使用其他用户创建的Hive表、列或数据库，不同的场景需要不同的Hive权限，例如：创建表，需要“建表”。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive用户权限管理
准备HDFS应用开发和运行环境 - MapReduce服务 MRS

root@客户端节点IP地址:/opt/Bigdata/client/conf 准备MRS应用开发用户时获取的keytab文件也需放置于该目录下，主要配置文件说明如表2所示。表2 配置文件文件名称作用 core-site.xml 配置HDFS详细参数。 hdfs-site.xml 配置HDFS详细参数。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（安全模式） > 准备HDFS应用开发环境
Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

registerServerHandler：为注册服务器的句柄。 numberOfSubscribedJobs：为订阅本NettySink的作业数量，该数量必须是明确的，只有当所有订阅者都连接上NettySink，NettySink才发送数据。 NettySource算子 Class

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > 开发Flink应用 > Flink Job Pipeline样例程序
Loader日志介绍 - MapReduce服务 MRS

sqoopInstanceCheck.log Loader实例健康检查日志审计日志 default.audit Loader操作审计日志（例如：作业的增删改查、用户的登录）。 tomcat日志 catalina.out tomcat的运行日志 catalina. <yyyy-mm-dd

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader
structured streaming功能与可靠性介绍 - MapReduce服务 MRS

支持基于Event Time的聚合计算，支持对迟到数据的处理。支持对流式数据的去除重复数据操作。支持状态计算。支持对流处理任务的监控。支持批流join，流流join。当前JOIN操作支持列表如下：左表右表支持的Join类型说明 Static Static 全部类型

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
快速开发Spark应用 - MapReduce服务 MRS

例如客户端安装在主管理节点中，安装目录为“/opt/client”。准备集群配置文件集群创建成功后，登录FusionInsight Manager创建用于提交Flink作业的集群用户。选择“系统 > 权限 > 用户 > 添加用户”，在新增用户界面创建一个人机用户，例如sparkuser。 “用户组”需加入“

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
查询集群节点列表 - MapReduce服务 MRS

参数解释：返回结果中每页显示条数。约束限制：不涉及取值范围： ≥1 默认取值： 10 offset 否 Integer 参数解释：表示作业列表从该偏移量开始查询。约束限制：不涉及取值范围： ≥1 默认取值： 1 node_name 否 String 参数解释：指定节点名称，支持模糊搜索。

帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 集群管理接口
LOAD DATA - MapReduce服务 MRS
LOAD DATA - MapReduce服务 MRS

Records处理：为了使数据处理应用程序为用户增值，不可避免地需要对数据进行某种程度的集成。在大多数情况下，数据质量问题源于生成源数据的上游（主要）系统。有两种完全不同的方式处理Bad Data：按照原始数据加载所有数据，之后进行除错处理。在进入数据源的过程中，可以清理或擦除Bad

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DML
Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

registerServerHandler：为注册服务器的句柄。 numberOfSubscribedJobs：为订阅本NettySink的作业数量，该数量必须是明确的，只有当所有订阅者都连接上NettySink，NettySink才发送数据。 NettySource算子 Class

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > Flink Job Pipeline样例程序

总条数： 2413

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Kafka相关特性说明 - MapReduce服务 MRS

Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

更新客户端（3.x之前版本） - MapReduce服务 MRS

LOAD DATA - MapReduce服务 MRS

创建Hive用户自定义函数 - MapReduce服务 MRS

配置MRS集群通过IAM委托对接OBS - MapReduce服务 MRS

使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

创建Hive用户自定义函数 - MapReduce服务 MRS

准备HDFS应用开发和运行环境 - MapReduce服务 MRS

Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

Hive用户权限说明 - MapReduce服务 MRS

准备HDFS应用开发和运行环境 - MapReduce服务 MRS

Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

Loader日志介绍 - MapReduce服务 MRS

structured streaming功能与可靠性介绍 - MapReduce服务 MRS

快速开发Spark应用 - MapReduce服务 MRS

查询集群节点列表 - MapReduce服务 MRS

LOAD DATA - MapReduce服务 MRS

Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线