搜索_华为云

如何开发Flume第三方插件 - MapReduce服务 MRS

如何开发Flume第三方插件安装Flume客户端，如安装目录为“/opt/flumeclient”。将自主研发的代码打成jar包。建立插件目录布局。进入“Flume客户端安装目录/fusionInsight-flume-*/plugins.d”路径下，使用以下命令建立目录，可根据实际业务进行命名，无固定名称：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > Flume常见问题
在Linux环境中调测Spark应用 - MapReduce服务 MRS

在Linux环境中调测Spark应用在程序代码完成开发后，您可以上传至Linux客户端环境中运行应用。使用Scala或Java语言开发的应用程序在Spark客户端的运行步骤是一样的。使用Python开发的Spark应用程序无需打包成jar，只需将样例工程复制到编译机器上即可。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 调测Spark应用
如何开发Flume第三方插件 - MapReduce服务 MRS

如何开发Flume第三方插件该操作指导用户进行第三方插件二次开发。本章节适用于MRS 3.x及之后版本。将自主研发的代码打成jar包。安装Flume服务端或者客户端，如安装目录为“/opt/flumeclient”。建立插件目录布局。进入“Flume客户端安装目录/f

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > Flume常见问题
在Linux环境中调测Spark应用 - MapReduce服务 MRS

在Linux环境中调测Spark应用在程序代码完成开发后，您可以上传至Linux客户端环境中运行应用。使用Scala或Java语言开发的应用程序在Spark客户端的运行步骤是一样的。使用Python开发的Spark应用程序无需打包成jar，只需将样例工程复制到编译机器上即可。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 调测Spark应用
Hudi Clustering操作说明 - MapReduce服务 MRS

Hudi Clustering操作说明什么是Clustering 即数据布局，该服务可重新组织数据以提高查询性能，也不会影响摄取速度。 Clustering架构 Hudi通过其写入客户端API提供了不同的操作，如insert/upsert/bulk_insert来将数据写入Hu

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi数据管理维护
Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

Spark Structured Streaming对接Kafka样例程序开发思路场景说明假定一个广告业务，存在广告请求事件、广告展示事件、广告点击事件，广告主需要实时统计有效的广告展示和广告点击数据。已知：终端用户每次请求一个广告后，会生成广告请求事件，保存到kafka的adRequest

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming对接Kafka样例程序
查询作业exe对象列表（废弃） - MapReduce服务 MRS

查询作业exe对象列表（废弃）功能介绍查询所有作业的exe对象列表。该接口不兼容Sahara。 MRS 3.x版本镜像，不支持MRS V1.1作业管理接口，需要使用V2作业管理接口。接口约束无调试您可以在API Explorer中调试该接口。 URI GET /v1.

帮助中心 > MapReduce服务 MRS > API参考 > 历史API > V1.1 作业管理接口（废弃）
导出Doris查询结果集 - MapReduce服务 MRS

导出Doris查询结果集本章节主要介绍如何使用SELECT INTO OUTFILE命令，将Doris查询结果集使用指定的文件格式导出到指定的存储系统中。导出命令不会检查文件及文件路径是否存在、是否会自动创建路径、或是否会覆盖已存在文件，由远端存储系统的语义决定。如果在导出

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris数据分析
HDFS基本原理 - MapReduce服务 MRS
HDFS基本原理 - MapReduce服务 MRS

HDFS基本原理 HDFS是Hadoop的分布式文件系统（Hadoop Distributed File System），实现大规模数据可靠的分布式读写。HDFS针对的使用场景是数据读写具有“一次写，多次读”的特征，而数据“写”操作是顺序写，也就是在文件创建时的写入或者在现有文件

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
Flume基本原理 - MapReduce服务 MRS
Flume基本原理 - MapReduce服务 MRS

File Channel：基于WAL（预写式日志Write-Ahead Logging）的持久化实现。 JDBC Channel：基于嵌入Database的持久化实现。 Channel支持事务，可提供较弱的顺序保证，可以和任何数量的Source和Sink工作。 Sink Sink负责将

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flume
Spark Structured Streaming状态操作样例程序（Scala） - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序（Scala）功能介绍在Spark结构流应用中，跨批次统计每个session期间发生了多少次event以及本session的开始和结束timestamp；同时输出本批次被更新状态的session。代码样例

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming状态操作样例程序
Spark Structured Streaming状态操作样例程序（Scala） - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序（Scala）功能介绍在Spark结构流应用中，跨批次统计每个session期间发生了多少次event以及本session的开始和结束timestamp；同时输出本批次被更新状态的session。代码样例

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming状态操作样例程序
退订MRS包周期集群指定节点 - MapReduce服务 MRS

退订MRS包周期集群指定节点用户可以根据业务需求量，通过指定节点对集群进行缩容，以使MRS拥有更优的存储、计算能力，降低运维成本。目前一次操作最多可以退订20个Core节点，退订后的Core节点数不能小于2。退订节点时，须等待隔离/退服成功后，才能进行退订操作，否则会造成数据丢失等风险。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群容量调整
转换函数 - MapReduce服务 MRS
转换函数 - MapReduce服务 MRS

转换函数 cast转换函数 HetuEngine会将数字和字符值隐式转换成正确的类型。HetuEngine不会把字符和数字类型相互转换。例如，一个查询期望得到一个varchar类型的值，HetuEngine不会自动将bigint类型的值转换为varchar类型。如果有必要，可以将值显式转换为指定类型。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
二进制函数和运算符 - MapReduce服务 MRS

二进制函数和运算符二进制运算符 || 运算符执行连接。二进制函数 length(binary) → bigint 返回binary的字节长度。 select length(x'00141f');-- 3 concat(binary1, ..., binaryN) → varbinary

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
compaction&cleaning配置 - MapReduce服务 MRS

compaction&cleaning配置参数描述默认值 hoodie.clean.automatic 是否执行自动clean。 true hoodie.cleaner.policy 要使用的清理策略。Hudi将删除旧版本的parquet文件以回收空间。任何引用此版本文件

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见配置参数
INSERT - MapReduce服务 MRS
INSERT - MapReduce服务 MRS

INSERT 语法 INSERT { INTO | OVERWRITE } [TABLE] table_name [(column_list)] [ PARTITION (partition_clause)] {select_statement | VALUES (value [

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DML SQL语法说明
BulkDelete接口使用 - MapReduce服务 MRS

BulkDelete接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将要删除的数据的rowKey构造成rdd，然后通过HBaseContext的bulkDelete接口对HBase表上这些rowKey对应的数据进行删除。数据规划

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
beeline客户端报错“OutOfMemoryError” - MapReduce服务 MRS

beeline客户端报错“OutOfMemoryError” 问题背景与现象 beeline客户端查询大量数据时，报OutOFMemoryError：Java heap space，具体报错信息如下： org.apache.thrift.TException: Error in calling

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
快速创建和使用Hadoop离线数据分析集群 - MapReduce服务 MRS

快速创建和使用Hadoop离线数据分析集群操作场景本入门提供从零开始创建Hadoop离线数据分析集群并通过集群客户端提交一个wordcount作业的操作指导。wordcount是最经典的Hadoop作业，用于统计海量文本的单词数量。 Hadoop集群完全使用开源Hadoop生

 帮助中心 > MapReduce服务 MRS > 快速入门

总条数： 3633

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何开发Flume第三方插件 - MapReduce服务 MRS

在Linux环境中调测Spark应用 - MapReduce服务 MRS

如何开发Flume第三方插件 - MapReduce服务 MRS

在Linux环境中调测Spark应用 - MapReduce服务 MRS

Hudi Clustering操作说明 - MapReduce服务 MRS

Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

查询作业exe对象列表（废弃） - MapReduce服务 MRS

导出Doris查询结果集 - MapReduce服务 MRS

HDFS基本原理 - MapReduce服务 MRS

Flume基本原理 - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序（Scala） - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序（Scala） - MapReduce服务 MRS

退订MRS包周期集群指定节点 - MapReduce服务 MRS

转换函数 - MapReduce服务 MRS

二进制函数和运算符 - MapReduce服务 MRS

compaction&cleaning配置 - MapReduce服务 MRS

INSERT - MapReduce服务 MRS

BulkDelete接口使用 - MapReduce服务 MRS

beeline客户端报错“OutOfMemoryError” - MapReduce服务 MRS

快速创建和使用Hadoop离线数据分析集群 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线