搜索_华为云

Spark使用说明 - MapReduce服务 MRS
Spark使用说明 - MapReduce服务 MRS

Spark使用说明 MRS 3.3.0-LTS及之后的版本中，Spark2x服务改名为Spark，服务包含的角色名也有差异，例如JobHistory2x变更为JobHistory。相关涉及服务名称、角色名称的描述和操作请以实际版本为准。 Spark是一个开源的，并行数据处理框架

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
使用HetuEngine跨源跨域访问数据源 - MapReduce服务 MRS

使用HetuEngine跨源跨域访问数据源 HetuEngine跨源功能简介出于管理和信息收集的需要，企业内部会存储海量数据，包括数目众多的各种数据库、数据仓库等，此时会面临数据源种类繁多、数据集结构化混合、相关数据存放分散等困境，导致跨源查询开发成本高，跨源复杂查询耗时长。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
下载MRS集群用户认证凭据文件 - MapReduce服务 MRS

下载MRS集群用户认证凭据文件用户开发大数据应用程序并在支持Kerberos认证的MRS集群中运行程序时，需要准备访问MRS集群的用户认证文件。认证文件中的keytab文件可用于认证用户身份。该任务指导管理员用户通过Manager下载用户认证文件并导出keytab文件。修改

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群用户 > 管理MRS集群用户
Hudi支持聚合函数 - MapReduce服务 MRS

Hudi支持聚合函数本章节内容仅适用于MRS 3.5.0-LTS及之后版本。使用场景当前开源社区提供了可插拔的Payload机制，用于满足客户各种聚合需求。但Payload的开发有一定的门槛，因此MRS内置了一些常见的聚合函数满足客户日常需求。该特性允许用户使用Hudi自带的聚合函数实现相同主键的聚合操作。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi
Impala客户端使用实践 - MapReduce服务 MRS

Impala客户端使用实践 Impala是用于处理存储在Hadoop集群中的大量数据的MPP（大规模并行处理）SQL查询引擎。它是一个用C++和Java编写的开源软件。与其他Hadoop的SQL引擎相比，它拥有高性能和低延迟的特点。背景信息假定用户开发一个应用程序，用于管

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Impala
MRS集群日志概述 - MapReduce服务 MRS

记录进程启动过程中执行的命令信息。进程启动异常日志记录进程启动失败时产生异常的信息，如依赖服务错误、资源不足等进程运行日志记录进程运行信息及调试信息，如函数入口和出口打印、模块间接口消息等。进程运行异常日志记录导致进程运行时错误的错误信息，如输入对象为空、编解码失败等错误。进程运行环境信息日志

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 查看MRS集群日志
运行MapReduce作业 - MapReduce服务 MRS

运行MapReduce作业用户可将自己开发的程序提交到MRS中，执行程序并获取结果，本章节指导您如何在MRS集群中提交一个MapReduce作业。 MapReduce作业用于提交Hadoop jar程序快速并行处理大量数据，是一种分布式数据处理模式。用户可以在MRS管理控制台

 帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
MRS集群数据备份恢复简介 - MapReduce服务 MRS

x及之后版本） NAS（Network Attached Storage）是一种特殊的专用数据存储服务器，包括存储器件和内嵌系统软件，可提供跨平台文件共享功能。利用NFS（支持NFSv3、NFSv4）和CIFS（支持SMBv2、SMBv3）协议，用户可以连通MRS的业务平面与NAS服

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据
Kafka相关特性说明 - MapReduce服务 MRS

Kafka相关特性说明 Kafka Idempotent特性特性说明：Kafka从0.11.0.0版本引入了创建幂等性Producer的功能，开启此特性后，Producer自动升级成幂等性Producer，当Producer发送了相同字段值的消息后，Broker会自动感知消息是

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka常见问题
运行SparkSql作业 - MapReduce服务 MRS

运行SparkSql作业用户可将自己开发的程序提交到MRS中，执行程序并获取结果，本章节指导您如何在MRS集群中提交一个SparkSql作业。 SparkSql作业用于查询和分析数据，包括SQL语句和Script脚本两种形式，如果SQL语句涉及敏感信息，也可使用脚本文件方式提交。

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
快速使用HBase进行离线数据分析 - MapReduce服务 MRS

快速使用HBase进行离线数据分析 HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。本章节提供从零开始使用HBase的操作指导，通过客户端实现创建表，往表中插入数据，修改表，读取表数据，删除表中数据以及删除表的功能。背景信息假定用户开发一个应用程序，用于管理

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase
基于Kafka的Word Count数据流统计案例 - MapReduce服务 MRS

基于Kafka的Word Count数据流统计案例应用场景 Kafka是一个分布式的消息发布-订阅系统。它采用独特的设计提供了类似JMS的特性，主要用于处理活跃的流式数据。 Kafka有很多适用的场景：消息队列、行为跟踪、运维数据监控、日志收集、流处理、事件溯源、持久化日志等。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
创建FlinkServer作业写入数据至Kafka消息队列 - MapReduce服务 MRS

创建FlinkServer作业写入数据至Kafka消息队列本章节适用于MRS 3.1.2及之后的版本。操作场景本章节介绍Kafka作为source表或者sink表的DDL定义，以及创建表时使用的WITH参数和代码示例，并指导如何在FlinkServer作业管理页面操作。本示例以安全模式Kafka为例。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业
快速使用HBase进行离线数据分析 - MapReduce服务 MRS

快速使用HBase进行离线数据分析 HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。本章节提供从零开始使用HBase的操作指导，通过客户端实现创建表，往表中插入数据，修改表，读取表数据，删除表中数据以及删除表的功能。背景信息假定用户开发一个应用程序，用于管理

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase
运行HiveSql作业 - MapReduce服务 MRS

运行HiveSql作业用户可将自己开发的程序提交到MRS中，执行程序并获取结果，本章节指导您如何在MRS集群中提交一个HiveSql作业。 HiveSql作业用于提交Hive SQL语句和SQL脚本文件查询和分析数据，包括SQL语句和Script脚本两种形式，如果SQL语句中涉及敏感信息，也可使用脚本文件方式提交。

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
HetuEngine基本原理 - MapReduce服务 MRS

HetuEngine基本原理 HetuEngine简介 HetuEngine是自研高性能交互式SQL分析及数据虚拟化引擎。与大数据生态无缝融合，实现海量数据秒级交互式查询；支持跨源跨域统一访问，使能数据湖内、湖间、湖仓一站式SQL融合分析。 HetuEngine结构 HetuEn

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HetuEngine
常用参数 - MapReduce服务 MRS
常用参数 - MapReduce服务 MRS

Spark Python Spark是Spark除了Scala、Java两种API之外的第三种编程语言。不同于Java和Scala都是在JVM平台上运行，Python Spark不仅会有JVM进程，还会有自身的Python进程。以下配置项只适用于Python Spark场景，而其他配置项也同样可以在Python

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
Spark常用配置参数 - MapReduce服务 MRS

Spark Python Spark是Spark除了Scala、Java两种API之外的第三种编程语言。不同于Java和Scala都是在JVM平台上运行，Python Spark不仅会有JVM进程，还会有自身的Python进程。以下配置项只适用于Python Spark场景，而其他配置项也同样可以在Python

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
创建FlinkServer作业对接JDBC - MapReduce服务 MRS

创建FlinkServer作业对接JDBC 本章节适用于MRS 3.3.1及之后的版本。操作场景 FlinkServer支持对接JDBC。本示例以安全模式FlinkServer、Kafka为例，介绍JDBC的MySQL作为Source表、Sink表以及维表的DDL定义，以及创建

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业
创建FlinkServer作业对接DWS表 - MapReduce服务 MRS

创建FlinkServer作业对接DWS表操作场景 FlinkServer支持对接8.1.x及之后版本的GaussDB（DWS）数据库，本章节介绍GaussDB（DWS）作为Source表、Sink表以及维表的DDL定义，以及创建表时使用的WITH参数和代码示例，并指导如何在F

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业

总条数： 3560

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark使用说明 - MapReduce服务 MRS

使用HetuEngine跨源跨域访问数据源 - MapReduce服务 MRS

下载MRS集群用户认证凭据文件 - MapReduce服务 MRS

Hudi支持聚合函数 - MapReduce服务 MRS

Impala客户端使用实践 - MapReduce服务 MRS

MRS集群日志概述 - MapReduce服务 MRS

运行MapReduce作业 - MapReduce服务 MRS

MRS集群数据备份恢复简介 - MapReduce服务 MRS

Kafka相关特性说明 - MapReduce服务 MRS

运行SparkSql作业 - MapReduce服务 MRS

快速使用HBase进行离线数据分析 - MapReduce服务 MRS

基于Kafka的Word Count数据流统计案例 - MapReduce服务 MRS

创建FlinkServer作业写入数据至Kafka消息队列 - MapReduce服务 MRS

快速使用HBase进行离线数据分析 - MapReduce服务 MRS

运行HiveSql作业 - MapReduce服务 MRS

HetuEngine基本原理 - MapReduce服务 MRS

常用参数 - MapReduce服务 MRS

Spark常用配置参数 - MapReduce服务 MRS

创建FlinkServer作业对接JDBC - MapReduce服务 MRS

创建FlinkServer作业对接DWS表 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线