搜索_华为云

Kafka安全使用说明 - MapReduce服务 MRS

Kafka安全使用说明 Kafka API简单说明新Producer API 指org.apache.kafka.clients.producer.KafkaProducer中定义的接口，在使用“kafka-console-producer.sh”时，默认使用此API。旧Producer

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
入门实践 - MapReduce服务 MRS
入门实践 - MapReduce服务 MRS

由配置项“hbase.rootdir”指定在HDFS上的路径，华为云MRS的默认存储位置是“/hbase”文件夹下。 HBase自带的一些机制和工具命令也可以实现数据搬迁，例如：通过导出Snapshots快照、Export/Import、CopyTable方式等。 Hive数据迁移到华为云MRS服务

 帮助中心 > MapReduce服务 MRS > 快速入门
回滚补丁 - MapReduce服务 MRS
回滚补丁 - MapReduce服务 MRS

滚动重启不影响业务。滚动重启耗时约10分钟。 Yarn 直接重启直接重启期间，不可新提交任务，正在运行Spark、Flink任务有重试机制不受影响。直接重启耗时约5分钟。滚动重启依赖NodeManager的remote shuffle Spark任务受影响，Flink任务有概率失败，Hive任务有概率失败。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.2.0-LTS.1.8补丁说明 > 回滚补丁
HDFS客户端写文件close失败 - MapReduce服务 MRS

BlockManager.logAddStoredBlock(BlockManager.java:2393) DataNode上报块写成功通知延迟的原因可能有：网络瓶颈导致、CPU瓶颈导致。如果此时再次调用close或者close的retry的次数增多，那么close都将返回成功。建议适当增大参数dfs

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
安装补丁 - MapReduce服务 MRS
安装补丁 - MapReduce服务 MRS

滚动重启不影响业务。滚动重启耗时约10分钟。 Yarn 直接重启直接重启期间，不可新提交任务，正在运行Spark、Flink任务有重试机制不受影响。直接重启耗时约5分钟。滚动重启依赖NodeManager的remote shuffle Spark任务受影响，Flink任务有概率失败，Hive任务有概率失败。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.2.0-LTS.1.8补丁说明
安装补丁 - MapReduce服务 MRS
安装补丁 - MapReduce服务 MRS

滚动重启不影响业务。滚动重启耗时约10分钟。 Yarn 直接重启直接重启期间，不可新提交任务，正在运行Spark、Flink任务有重试机制不受影响。直接重启耗时约5分钟。滚动重启依赖NodeManager的remote shuffle Spark任务受影响，Flink任务有概率失败，Hive任务有概率失败。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.3.1-LTS.1.2补丁说明
快速开发Spark应用 - MapReduce服务 MRS

jar”。上传jar包及准备源数据将编译后的jar包上传到客户端节点，例如上传到“/opt/client/sparkdemo”目录下。如果本地网络无法直接连接客户端节点上传文件，可先将jar文件或者源数据上传至OBS文件系统中，然后通过MRS管理控制台集群内的“文件管理”页面导入HD

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
基于Kafka的Word Count数据流统计案例 - MapReduce服务 MRS

jar”。步骤3：上传jar包及源数据将编译后的jar包上传到客户端节点，例如上传到“/opt/client/lib”目录下。如果本地网络无法直接连接客户端节点上传文件，可先将jar文件或者源数据上传至OBS文件系统中，然后通过MRS管理控制台集群内的“文件管理”页面导入HD

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
Spark应用开发常用概念 - MapReduce服务 MRS

时，每一条输出结果需要按key哈希，并且分发到对应的Reducer上去，这个过程就是shuffle。由于shuffle涉及到了磁盘的读写和网络的传输，因此shuffle性能的高低直接影响到了整个程序的运行效率。下图清晰地描述了MapReduce算法的整个流程。图3 算法流程

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

为了提高导入数据速度，需要确保以下条件：每个Map连接时，相当于一个客户端连接，因此需要确保SFTP服务器最大连接数大于Map数量。确保SFTP服务器上的磁盘IO或是网络带宽都未达到上限。 20 Map数据块大小配置数据操作的MapReduce任务中启动map所处理的数据大小，单位为MB。参数值必须大于或

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
编译并调测Flink应用 - MapReduce服务 MRS

truststore.password xxx --kerberos.domain.name hadoop.hadoop.com 运行异步Checkpoint机制样例程序（Scala和Java语言）。为了丰富样例代码，Java版本使用了Processing Time作为数据流的时间戳，而Scala版本使用Event

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 调测Flink应用
structured streaming功能与可靠性介绍 - MapReduce服务 MRS

sink代替。 Structured Streaming可靠性说明 Structured Streaming通过checkpoint和WAL机制，对可重放的sources，以及支持重复处理的幂等性sinks，可以提供端到端的exactly-once容错语义。用户可在程序中设置op

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
CarbonData调优思路 - MapReduce服务 MRS

如果高cardinality维度位于左边，那么排序后的数据分区范围较大，压缩效率较低。内存调优 CarbonData为内存调优提供了一个机制，其中数据加载会依赖于查询中需要的列。不论何时，接收到一个查询命令，将会获取到该查询中的列，并确保内存中这些列有数据加载。在该操作期间，如

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData性能调优
回滚补丁 - MapReduce服务 MRS
回滚补丁 - MapReduce服务 MRS

滚动重启不影响业务。滚动重启耗时约10分钟。 Yarn 直接重启直接重启期间，不可新提交任务，正在运行Spark、Flink任务有重试机制不受影响。直接重启耗时约5分钟。滚动重启依赖NodeManager的remote shuffle Spark任务受影响，Flink任务有概率失败，Hive任务有概率失败。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.2.0-LTS.1.9补丁说明 > 回滚补丁
structured streaming功能与可靠性介绍 - MapReduce服务 MRS

sink代替。 Structured Streaming可靠性说明 Structured Streaming通过checkpoint和WAL机制，对可重放的sources，以及支持重复处理的幂等性sinks，可以提供端到端的exactly-once容错语义。用户可在程序中设置op

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
structured streaming功能与可靠性介绍 - MapReduce服务 MRS

sink代替。 Structured Streaming可靠性说明 Structured Streaming通过checkpoint和WAL机制，对可重放的sources，以及支持重复处理的幂等性sinks，可以提供端到端的exactly-once容错语义。用户可在程序中设置op

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
structured streaming功能与可靠性介绍 - MapReduce服务 MRS

sink代替。 Structured Streaming可靠性说明 Structured Streaming通过checkpoint和WAL机制，对可重放的sources，以及支持重复处理的幂等性sinks，可以提供端到端的exactly-once容错语义。用户可在程序中设置op

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
回滚补丁 - MapReduce服务 MRS
回滚补丁 - MapReduce服务 MRS

滚动重启不影响业务。滚动重启耗时约10分钟。 Yarn 直接重启直接重启期间，不可新提交任务，正在运行Spark、Flink任务有重试机制不受影响。直接重启耗时约5分钟。滚动重启依赖NodeManager的remote shuffle Spark任务受影响，Flink任务有概率失败，Hive任务有概率失败。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.3.1-LTS.1.2补丁说明 > 回滚补丁
CarbonData调优思路 - MapReduce服务 MRS

如果高cardinality维度位于左边，那么排序后的数据分区范围较大，压缩效率较低。内存调优 CarbonData为内存调优提供了一个机制，其中数据加载会依赖于查询中需要的列。不论何时，接收到一个查询命令，将会获取到该查询中的列，并确保内存中这些列有数据加载。在该操作期间，如

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData性能调优
使用Loader从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

为了提高导入数据速度，需要确保以下条件：每个Map连接时，相当于一个客户端连接，因此需要确保SFTP服务器最大连接数大于Map数量。确保SFTP服务器上的磁盘IO或是网络带宽都未达到上限。 20 Map数据块大小配置数据操作的MapReduce任务中启动map所处理的数据大小，单位为MB。参数值必须大于或

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业

总条数： 939

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Kafka安全使用说明 - MapReduce服务 MRS

入门实践 - MapReduce服务 MRS

回滚补丁 - MapReduce服务 MRS

HDFS客户端写文件close失败 - MapReduce服务 MRS

安装补丁 - MapReduce服务 MRS

安装补丁 - MapReduce服务 MRS

快速开发Spark应用 - MapReduce服务 MRS

基于Kafka的Word Count数据流统计案例 - MapReduce服务 MRS

Spark应用开发常用概念 - MapReduce服务 MRS

典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

编译并调测Flink应用 - MapReduce服务 MRS

structured streaming功能与可靠性介绍 - MapReduce服务 MRS

CarbonData调优思路 - MapReduce服务 MRS

回滚补丁 - MapReduce服务 MRS

structured streaming功能与可靠性介绍 - MapReduce服务 MRS

structured streaming功能与可靠性介绍 - MapReduce服务 MRS

structured streaming功能与可靠性介绍 - MapReduce服务 MRS

回滚补丁 - MapReduce服务 MRS

CarbonData调优思路 - MapReduce服务 MRS

使用Loader从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线