搜索_华为云

Spark Core数据序列化 - MapReduce服务 MRS

Spark Core数据序列化操作场景 Spark支持两种方式的序列化： Java原生序列化JavaSerializer Kryo序列化KryoSerializer 序列化对于Spark应用的性能来说，具有很大的影响。在特定的数据格式的情况下，KryoSerializer的性

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
数据序列化 - MapReduce服务 MRS
数据序列化 - MapReduce服务 MRS

数据序列化操作场景 Spark支持两种方式的序列化： Java原生序列化JavaSerializer Kryo序列化KryoSerializer 序列化对于Spark应用的性能来说，具有很大的影响。在特定的数据格式的情况下，KryoSerializer的性能可以达到JavaS

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
Spark Core内存调优 - MapReduce服务 MRS

Spark Core内存调优操作场景 Spark是内存计算框架，计算过程中内存不够对Spark的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存中RDD的大小来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的GC情况（在客户端的conf/spark-default

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
准备MapReduce应用运行环境 - MapReduce服务 MRS

/opt/conf/user.keytab test。这里的user.keytab文件路径为Linux机器上配置文件的存放路径，后面的test用户名可以更改为5.2.2-准备开发用户中新建的用户名。父主题：准备MapReduce应用开发环境

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > MapReduce开发指南 > 准备MapReduce应用开发环境
Spark Core数据序列化 - MapReduce服务 MRS

Spark Core数据序列化操作场景 Spark支持两种方式的序列化： Java原生序列化JavaSerializer Kryo序列化KryoSerializer 序列化对于Spark应用的性能来说，具有很大的影响。在特定的数据格式的情况下，KryoSerializer的性

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
Flume基本原理 - MapReduce服务 MRS
Flume基本原理 - MapReduce服务 MRS

File Channel：基于WAL（预写式日志Write-Ahead Logging）的持久化实现。 JDBC Channel：基于嵌入Database的持久化实现。 Channel支持事务，可提供较弱的顺序保证，可以和任何数量的Source和Sink工作。 Sink Sink负责将

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flume
退服和入服MRS角色实例 - MapReduce服务 MRS

退服和入服MRS角色实例 MRS集群支持将数据存储在不同Core节点，某个Core或Task节点出现问题时，可能导致整个集群状态显示为“异常”，用户可以在MRS指定角色实例退服，使退服的角色实例不再提供服务。在排除故障后，可以将已退服的角色实例入服。 MRS集群支持退服、入服的角色实例包括：

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群组件
如何开发Flume第三方插件 - MapReduce服务 MRS

如何开发Flume第三方插件安装Flume客户端，如安装目录为“/opt/flumeclient”。将自主研发的代码打成jar包。建立插件目录布局。进入“Flume客户端安装目录/fusionInsight-flume-*/plugins.d”路径下，使用以下命令建立目录，可根据实际业务进行命名，无固定名称：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > Flume常见问题
在Linux环境中调测Spark应用 - MapReduce服务 MRS

在Linux环境中调测Spark应用在程序代码完成开发后，您可以上传至Linux客户端环境中运行应用。使用Scala或Java语言开发的应用程序在Spark客户端的运行步骤是一样的。使用Python开发的Spark应用程序无需打包成jar，只需将样例工程复制到编译机器上即可。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 调测Spark应用
在Linux环境中调测Spark应用 - MapReduce服务 MRS

在Linux环境中调测Spark应用在程序代码完成开发后，您可以上传至Linux客户端环境中运行应用。使用Scala或Java语言开发的应用程序在Spark客户端的运行步骤是一样的。使用Python开发的Spark应用程序无需打包成jar，只需将样例工程复制到编译机器上即可。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 调测Spark应用
Hudi Clustering操作说明 - MapReduce服务 MRS

Hudi Clustering操作说明什么是Clustering 即数据布局，该服务可重新组织数据以提高查询性能，也不会影响摄取速度。 Clustering架构 Hudi通过其写入客户端API提供了不同的操作，如insert/upsert/bulk_insert来将数据写入Hu

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi数据管理维护
如何开发Flume第三方插件 - MapReduce服务 MRS

如何开发Flume第三方插件该操作指导用户进行第三方插件二次开发。本章节适用于MRS 3.x及之后版本。将自主研发的代码打成jar包。安装Flume服务端或者客户端，如安装目录为“/opt/flumeclient”。建立插件目录布局。进入“Flume客户端安装目录/f

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > Flume常见问题
导出Doris查询结果集 - MapReduce服务 MRS

导出Doris查询结果集本章节主要介绍如何使用SELECT INTO OUTFILE命令，将Doris查询结果集使用指定的文件格式导出到指定的存储系统中。导出命令不会检查文件及文件路径是否存在、是否会自动创建路径、或是否会覆盖已存在文件，由远端存储系统的语义决定。如果在导出

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris数据分析
Spark Structured Streaming状态操作样例程序（Scala） - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序（Scala）功能介绍在Spark结构流应用中，跨批次统计每个session期间发生了多少次event以及本session的开始和结束timestamp；同时输出本批次被更新状态的session。代码样例

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming状态操作样例程序
Spark Structured Streaming状态操作样例程序（Scala） - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序（Scala）功能介绍在Spark结构流应用中，跨批次统计每个session期间发生了多少次event以及本session的开始和结束timestamp；同时输出本批次被更新状态的session。代码样例

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming状态操作样例程序
HDFS基本原理 - MapReduce服务 MRS
HDFS基本原理 - MapReduce服务 MRS

HDFS基本原理 HDFS是Hadoop的分布式文件系统（Hadoop Distributed File System），实现大规模数据可靠的分布式读写。HDFS针对的使用场景是数据读写具有“一次写，多次读”的特征，而数据“写”操作是顺序写，也就是在文件创建时的写入或者在现有文件

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
查询作业exe对象列表（废弃） - MapReduce服务 MRS

查询作业exe对象列表（废弃）功能介绍查询所有作业的exe对象列表。该接口不兼容Sahara。 MRS 3.x版本镜像，不支持MRS V1.1作业管理接口，需要使用V2作业管理接口。接口约束无调试您可以在API Explorer中调试该接口。 URI GET /v1.

帮助中心 > MapReduce服务 MRS > API参考 > 历史API > V1.1 作业管理接口（废弃）
Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

Spark Structured Streaming对接Kafka样例程序开发思路场景说明假定一个广告业务，存在广告请求事件、广告展示事件、广告点击事件，广告主需要实时统计有效的广告展示和广告点击数据。已知：终端用户每次请求一个广告后，会生成广告请求事件，保存到kafka的adRequest

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming对接Kafka样例程序
准备Spark连接集群配置文件 - MapReduce服务 MRS

理页面。在首页中单击“HADOOP SQL”区域的组件插件名称如“Hive”。单击“Policy Name”名称为“all - database, table, column”操作列的。在“Allow Conditions”区域新增策略允许条件，“Select User”列勾选2

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 准备Spark应用开发环境
转换函数 - MapReduce服务 MRS
转换函数 - MapReduce服务 MRS

转换函数 cast转换函数 HetuEngine会将数字和字符值隐式转换成正确的类型。HetuEngine不会把字符和数字类型相互转换。例如，一个查询期望得到一个varchar类型的值，HetuEngine不会自动将bigint类型的值转换为varchar类型。如果有必要，可以将值显式转换为指定类型。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明

总条数： 3619

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Core数据序列化 - MapReduce服务 MRS

数据序列化 - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

准备MapReduce应用运行环境 - MapReduce服务 MRS

Spark Core数据序列化 - MapReduce服务 MRS

Flume基本原理 - MapReduce服务 MRS

退服和入服MRS角色实例 - MapReduce服务 MRS

如何开发Flume第三方插件 - MapReduce服务 MRS

在Linux环境中调测Spark应用 - MapReduce服务 MRS

在Linux环境中调测Spark应用 - MapReduce服务 MRS

Hudi Clustering操作说明 - MapReduce服务 MRS

如何开发Flume第三方插件 - MapReduce服务 MRS

导出Doris查询结果集 - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序（Scala） - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序（Scala） - MapReduce服务 MRS

HDFS基本原理 - MapReduce服务 MRS

查询作业exe对象列表（废弃） - MapReduce服务 MRS

Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

准备Spark连接集群配置文件 - MapReduce服务 MRS

转换函数 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线