搜索_华为云

Kafka样例程序开发思路 - MapReduce服务 MRS

开发一个Consumer消费该Topic的数据。性能调优建议建议预先创建Topic，根据业务需求合理规划Partition数目，Partition数目限制了消费者的并发数。消息key值选取一定是可变的，防止由于消息key值不变导致消息分布不均匀。消费者尽量使用主动提交offset的方式，避免重复消费。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（安全模式） > 开发Kafka应用
配置Oozie应用安全认证 - MapReduce服务 MRS

提交Oozie应用程序运行前，在Oozie客户端执行如下命令获得认证。 kinit 组件业务用户代码认证（Kerberos安全认证）：通过获取客户端的principal和keytab文件在应用程序中进行认证，用于Kerberos安全认证的keytab文件和principal文件您可以联系管理员创建并获取

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（安全模式） > 准备Oozie应用开发环境
Kafka样例程序开发思路 - MapReduce服务 MRS

Kafka样例程序开发思路场景说明 Kafka是一个分布式消息系统，在此系统上可以做一些消息的发布和订阅操作，假定用户要开发一个Producer，让其每秒向Kafka集群某Topic发送一条消息，另外，还需要实现一个Consumer，订阅该Topic，实时消费该类消息。开发思路

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Kafka开发指南 > 开发Kafka应用
Java样例代码 - MapReduce服务 MRS
Java样例代码 - MapReduce服务 MRS

call(Tuple2<String, String> tuple2) { // map(_._1)是消息的key, map(_._2)是消息的value return tuple2._2(); } } );

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Streaming从Kafka读取数据再写入HBase
界面配置dfs.blocksize后上传数据，block大小未改变 - MapReduce服务 MRS

blocksize”，将其设置为268435456，上传数据，block大小还是原来的大小。原因分析 HDFS客户端的“hdfs-site.xml”文件中的dfs.blocksize大小没有更改，以客户端配置为准。解决办法确保“dfs.blocksize”为512的倍数。重新下载安装客户端或者更改客户端配置。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
正则表达式函数 - MapReduce服务 MRS

g, pattern, function) → varchar 描述：使用function替换与字符串中的正则表达式模式匹配的子字符串的每个实例。对于每个匹配，以数组形式传递的捕获组都会调用lambda表达式函数。捕获组号从1开始；整个匹配没有分组（如果需要，请用括号将整个表达式括起来）。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
MRS可以做什么？ - MapReduce服务 MRS

use、Spark、Flink、Kafka、HBase等Hadoop生态的高性能大数据引擎，支持数据湖、数据仓库、BI、AI融合等能力，完全兼容开源，快速帮助客户上云构建低成本、灵活开放、安全可靠、全栈式的云原生大数据平台，满足客户业务快速增长和敏捷创新诉求。父主题：产品咨询类

 帮助中心 > MapReduce服务 MRS > 常见问题 > 产品咨询类
Load数据到Hive表失败 - MapReduce服务 MRS

此问题。解决办法属于应用侧问题，解决办法有多种。只要保证表所指定存储格式和被导入数据格式是一致的，可以根据实际情况采用合适方法。方法1：可以使用具有Hive表操作权限的用户在建表时指定存储格式，例如： CREATE TABLE IF NOT EXISTS employees_info(name

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
Hive应用开发环境简介 - MapReduce服务 MRS

开发和运行环境的基本配置。版本要求如下： MRS集群的服务端和客户端仅支持自带的Oracle JDK（版本为1.8），不允许替换。对于客户应用需引用SDK类的Jar包运行在客户应用进程中的，支持Oracle JDK和IBM JDK。 Oracle JDK：支持1.7和1.8版本。 IBM JDK：推荐1.7.8

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Hive开发指南 > 准备Hive应用开发环境
Phoenix BulkLoad Tool使用限制说明 - MapReduce服务 MRS

--------------+----------------+ 解决方法删除旧的索引表。 DROP INDEX TEST_TABLE_INDEX ON TEST_TABLE; 异步方式创建新的索引表。 CREATE INDEX TEST_TABLE_INDEX ON TEST_TABLE(ACCOUNT1

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase常见问题
Presto应用开发环境简介 - MapReduce服务 MRS

开发和运行环境的基本配置。版本要求如下： MRS集群的服务端和客户端仅支持自带的Oracle JDK（版本为1.8），不允许替换。对于客户应用需引用SDK类的Jar包运行在客户应用进程中的，支持Oracle JDK和IBM JDK。 Oracle JDK：支持1.7和1.8版本。 IBM JDK：推荐1.7

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Presto开发指南 > 准备Presto应用开发环境
Impala应用开发环境简介 - MapReduce服务 MRS

开发和运行环境的基本配置。版本要求如下： MRS集群的服务端和客户端仅支持自带的Oracle JDK（版本为1.8），不允许替换。对于客户应用需引用SDK类的Jar包运行在客户应用进程中的，支持Oracle JDK和IBM JDK。 Oracle JDK：支持1.7和1.8版本。 IBM JDK：推荐1.7.8.10、1

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Impala开发指南 > 准备Impala应用开发环境
Consumer消费数据时存在重复消费现象 - MapReduce服务 MRS

数据。原理：每次poll的数据处理完后才提交offset，如果poll数据后的处理时长超出了session.timeout.ms的设置时长，此时发生rebalance导致本次消费失败，已经消费数据的offset无法正常提交，所以下次重新消费时还是在旧的offset消费数据，从而导致消费数据重复。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
准备Spark应用Python开发环境 - MapReduce服务 MRS

操作步骤对于Python开发环境，直接使用Editra编辑器（或其他编写Python应用程序的IDE）即可。下载客户端样例配置程序到本地开发环境。使用FTP工具，将运行调测环境的客户端包文件“MRS_Service_client”下载到本地，并解压得到目录“MRS_Services_ClientConfig”。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 准备Spark应用开发环境
Phoenix BulkLoad Tool使用限制说明 - MapReduce服务 MRS

--------------+----------------+ 解决方法删除旧的索引表。 DROP INDEX TEST_TABLE_INDEX ON TEST_TABLE; 异步方式创建新的索引表。 CREATE INDEX TEST_TABLE_INDEX ON TEST_TABLE(ACCOUNT1

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase常见问题
配置ResourceManager重启后自动加载Container信息 - MapReduce服务 MRS

Restart时，升主后的ResourceManager就可以通过加载之前的主ResourceManager的状态信息，并通过接收所有NodeManager上container的状态信息，重构运行状态继续执行。这样应用程序通过定期执行检查点操作保存当前状态信息，就可以避免工作内容的丢失。当启用NodeManager

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn企业级能力增强
通过API提交Spark作业后作业状态为error - MapReduce服务 MRS

通过API提交Spark作业后作业状态为error 用户问题使用API提交Spark作业后，作业状态显示为error。问题现象修改“/opt/client/Spark/spark/conf/log4j.properties”中的日志级别，使用API V1.1接口作业提交后，状态显示为error。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
SELECT - MapReduce服务 MRS
SELECT - MapReduce服务 MRS

CUBE ( column [, ...] ) ROLLUP ( column [, ...] ) 描述从零个或多个表中检索行数据。查询stu表的内容。 SELECT id,name FROM stu; 父主题： HetuEngine DQL SQL语法说明

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DQL SQL语法说明
配置ResourceManager重启后自动加载Container信息 - MapReduce服务 MRS

Restart时，升主后的ResourceManager就可以通过加载之前的主ResourceManager的状态信息，并通过接收所有NodeManager上container的状态信息，重构运行状态继续执行。这样应用程序通过定期执行检查点操作保存当前状态信息，就可以避免工作内容的丢失。当启用NodeManager

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn企业级能力增强
数据复制 - MapReduce服务 MRS
数据复制 - MapReduce服务 MRS

复制）将数据复制到对应目的集群所在Region的OBS，然后通过Distcp工具将OBS数据复制到目的集群的HDFS上。由于执行Distcp无法为OBS上的文件设置权限、属主/组等信息，因此当前场景在进行数据导出时也需要将HDFS的元数据信息进行导出并复制，以防HDFS文件属性信息丢失。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移 > 数据迁移方案介绍

总条数： 6151

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Kafka样例程序开发思路 - MapReduce服务 MRS

配置Oozie应用安全认证 - MapReduce服务 MRS

Kafka样例程序开发思路 - MapReduce服务 MRS

Java样例代码 - MapReduce服务 MRS

界面配置dfs.blocksize后上传数据，block大小未改变 - MapReduce服务 MRS

正则表达式函数 - MapReduce服务 MRS

MRS可以做什么？ - MapReduce服务 MRS

Load数据到Hive表失败 - MapReduce服务 MRS

Hive应用开发环境简介 - MapReduce服务 MRS

Phoenix BulkLoad Tool使用限制说明 - MapReduce服务 MRS

Presto应用开发环境简介 - MapReduce服务 MRS

Impala应用开发环境简介 - MapReduce服务 MRS

Consumer消费数据时存在重复消费现象 - MapReduce服务 MRS

准备Spark应用Python开发环境 - MapReduce服务 MRS

Phoenix BulkLoad Tool使用限制说明 - MapReduce服务 MRS

配置ResourceManager重启后自动加载Container信息 - MapReduce服务 MRS

通过API提交Spark作业后作业状态为error - MapReduce服务 MRS

SELECT - MapReduce服务 MRS

配置ResourceManager重启后自动加载Container信息 - MapReduce服务 MRS

数据复制 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线