搜索_华为云

Flink Java API接口介绍 - MapReduce服务 MRS

以根据接收到的元素生成不同的Watermark。提供迭代的能力表9 提供迭代的能力的相关接口 API 说明 public IterativeStream<T> iterate() 在流(flow)中创建一个带反馈的循环，通过重定向一个operator的输出到之前的operator。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > Flink应用开发常见问题 > Flink常用API介绍
配置Hive Python3样例工程 - MapReduce服务 MRS

版本为47.3.1。具体软件，请到对应的官方网站获取。 https://pypi.org/project/setuptools/#files 将下载的setuptools压缩文件复制到客户端机器上，解压后进入解压目录，在客户端机器的命令行终端执行python3 setup.py

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程
安装客户端（2.x及之前版本） - MapReduce服务 MRS

业提交等任务。集群客户端可以安装在集群内的节点上，也可以安装在集群外的节点上。集群内组件的服务端配置修改后，也建议重新安装客户端，否则客户端与服务端版本将不一致，可能影响部分功能的正常使用。本章节指导用户安装MRS 2.x及之前版本的集群客户端，MRS 3.x版本请参考安装客户端（3

帮助中心 > MapReduce服务 MRS > 用户指南 > 安装MRS集群客户端
Oozie应用开发步骤 - MapReduce服务 MRS

Oozie应用开发步骤业务分析。可以使用客户端样例目录中MapReduce程序对日志目录的数据进行分析、处理。将MapReduce程序的分析结果移动到数据分析结果目录，并将数据文件的权限设置成660。为了满足每天分析一次的需求，需要每天重复执行一次1.a～1.b。业务实现。登录客户端所在节

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（普通模式） > 开发Oozie应用 > 开发Oozie配置文件
Oozie应用开发步骤 - MapReduce服务 MRS

Oozie应用开发步骤业务分析。可以使用客户端样例目录中Mapreduce程序对日志目录的数据进行分析、处理。将Mapreduce程序的分析结果移动到数据分析结果目录，并将数据文件的权限设置成660。为了满足每天分析一次的需求，需要每天重复执行一次1.a～1.b。业务实现。登录Oozie客

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Oozie开发指南（安全模式） > 开发Oozie应用 > 开发Oozie配置文件
IoTDB客户端使用实践 - MapReduce服务 MRS

client”，以下操作的客户端目录只是举例，请根据实际安装目录修改。各组件业务用户由MRS集群管理员根据业务需要创建。安全模式下，“机机”用户需要下载keytab文件。“人机”用户第一次登录时需修改密码。操作步骤以客户端安装用户，登录安装客户端的节点。切换到IoTDB客

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用IoTDB
配置Flume加密传输 - MapReduce服务 MRS

配置工具 > 导入”，将该文件导入后再修改加密传输的相关配置项即可。导入配置文件时，建议配置source/channel/sink的各自的个数都不要超过40个，否则可能导致界面响应时间过长。不同的File Channel均需要配置一个不同的checkpoint目录。单击“导出”，将配置文件“properties

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > 配置Flume加密传输数据采集任务
典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

、导出数据的大小。使用Loader从SFTP服务器导入数据时，确保SFTP服务器输入路径目录名、输入路径的子目录名及子文件名不能包含特殊字符/\"':;,中的任意字符。如果设置的作业需要使用指定YARN队列功能，该用户需要已授权有相关YARN队列的权限。设置任务的用户需要获

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
为什么不同服务之间互相删除UDF失败 - MapReduce服务 MRS

CServer未重启或者spark-sql未重新启动的场景，Spark所在线程的FunctionRegistry对象未保存新创建的UDF，那么删除UDF时就会出现错误。解决方法：重启Spark服务端的JDBCServer和spark-sql，再删除此类UDF。在Hive端创建

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
为什么不同服务之间互相删除UDF失败 - MapReduce服务 MRS

CServer未重启或者spark-sql未重新启动的场景，Spark所在线程的FunctionRegistry对象未保存新创建的UDF，那么删除UDF时就会出现错误。解决方法：重启Spark服务端的JDBCServer和spark-sql，再删除此类UDF。在Hive端创建

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
典型场景：从关系型数据库导入数据到HDFS/OBS - MapReduce服务 MRS

不建议分区列选择类型为float或double的字段，因为精度问题，可能导致分区列字段的最小值、最大值所在记录无法导入。 id 分区列空值配置对数据库列中为null值记录的处理方式。值为“true”时，分区列的值为null的数据会被处理；值为“false”时，分区列的值为null的数据不会被处理。 true

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
编译并调测Flink应用 - MapReduce服务 MRS

cala或Java语言开发的应用程序在Flink客户端的运行步骤是相同的。基于YARN集群的Flink应用程序不支持在Windows环境下运行，只支持在Linux环境下运行。操作步骤在IntelliJ IDEA中，单击IDEA右边Maven窗口的“Reload All Maven

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 调测Flink应用
离线数据加载：通过Broker Load将ORC格式的Hive数据导入Doris - MapReduce服务 MRS

数据库连接端口为Doris FE的查询连接端口，可通过登录MRS Doris集群的Manager界面，选择“集群 > 服务 > Doris > 实例”，查看任一FE实例的业务IP地址获取。 Doris FE实例IP地址可通过登录MRS Doris集群的Manager界面，选择“集群

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
访问MRS Manager（MRS 3.x之前版本） - MapReduce服务 MRS

进入“添加安全组规则”页面，添加需要开放权限用户访问公网的IP地址段并勾选“我确认这里设置的授权对象是可信任的公网访问IP范围，禁止使用0.0.0.0/0,否则会有安全风险。”如图4所示。图4 添加安全组规则默认填充的是用户访问公网的IP地址，用户可根据需要修改IP地址段，如需开放多

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 常见操作 > 访问集群Manager
配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

进行部署，且无需依赖安装中复制的静态版本。因此，可以在HDFS中存放多版本的Hadoop，并通过配置“mapred-site.xml”文件指定任务默认使用的版本。只需设置适当的配置属性，用户就可以运行不同版本的MapReduce，而无需使用部署在集群中的版本。图1 具有多个版本

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce
创建CDL数据比较任务作业 - MapReduce服务 MRS

等特殊数据类型的比对。数据比对任务不支持数据表字段名包含数据库关键字的表进行数据比对。数据比对任务单表比较仅支持100个以内的字段进行比较，如果单表的字段超过一百，可以分两次指定不同的比较字段的白名单进行数据比对。当前只支持对从PgSQL抓取到Hudi的数据进行比对，如

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > 创建CDL作业
Storm-Kafka开发指引 - MapReduce服务 MRS

如果集群启用了安全服务，需要从管理员处获取一个“人机”用户，用于认证，并且获取到该用户的keytab文件。将获取到的文件拷贝到示例工程的 src/main/resources目录。获取的用户需要同时属于storm组和kafka组。下载并安装Kafka客户端程序，参见《Kafka应用开发》。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Storm开发指南 > Storm应用开发常见问题
Spark客户端使用实践 - MapReduce服务 MRS

Core为Spark的内核模块，主要负责任务的执行，用于编写spark应用程序；Spark SQL为执行SQL的模块。场景说明假定用户有某个周末网民网购停留时间的日志文本，基于某些业务要求，要求开发Spark应用程序实现如下要求：统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）
Oozie应用开发步骤 - MapReduce服务 MRS

Oozie应用开发步骤业务分析。可以使用客户端样例目录中MapReduce程序对日志目录的数据进行分析、处理。将MapReduce程序的分析结果移动到数据分析结果目录，并将数据文件的权限设置成660。为了满足每天分析一次的需求，需要每天重复执行一次1.a～1.b。业务实现。登录Oozie客

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（安全模式） > 开发Oozie应用 > 开发Oozie配置文件
快速使用Hadoop - MapReduce服务 MRS

快速使用Hadoop 本章节提供从零开始使用Hadoop提交wordcount作业的操作指导，wordcount是最经典的Hadoop作业，它用来统计海量文本的单词数量。操作步骤准备wordcount程序。开源的Hadoop的样例程序包含多个例子，其中包含wordcount。可以从https://dist

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS

总条数： 2274

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink Java API接口介绍 - MapReduce服务 MRS

配置Hive Python3样例工程 - MapReduce服务 MRS

安装客户端（2.x及之前版本） - MapReduce服务 MRS

Oozie应用开发步骤 - MapReduce服务 MRS

Oozie应用开发步骤 - MapReduce服务 MRS

IoTDB客户端使用实践 - MapReduce服务 MRS

配置Flume加密传输 - MapReduce服务 MRS

典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

为什么不同服务之间互相删除UDF失败 - MapReduce服务 MRS

为什么不同服务之间互相删除UDF失败 - MapReduce服务 MRS

典型场景：从关系型数据库导入数据到HDFS/OBS - MapReduce服务 MRS

编译并调测Flink应用 - MapReduce服务 MRS

离线数据加载：通过Broker Load将ORC格式的Hive数据导入Doris - MapReduce服务 MRS

访问MRS Manager（MRS 3.x之前版本） - MapReduce服务 MRS

配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

创建CDL数据比较任务作业 - MapReduce服务 MRS

Storm-Kafka开发指引 - MapReduce服务 MRS

Spark客户端使用实践 - MapReduce服务 MRS

Oozie应用开发步骤 - MapReduce服务 MRS

快速使用Hadoop - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线