搜索_华为云

备份ClickHouse业务数据 - MapReduce服务 MRS

选择“集群 > 服务 > HDFS”，选择“更多 > 下载客户端”。“选择客户端类型”设置为“仅配置文件”，根据待安装客户端节点的节点类型选择正确的平台类型后（x86选择x86_64，ARM选择aarch64）单击“确定”。等待客户端文件包生成后根据浏览器提示下载客户端到本地并解压。例

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据 > 备份MRS集群组件数据
HDFS文件系统目录简介 - MapReduce服务 MRS

HDFS文件系统目录简介 HDFS是Hadoop的分布式文件系统（Hadoop Distributed File System），实现大规模数据可靠的分布式读写。HDFS针对的使用场景是数据读写具有“一次写，多次读”的特征，而数据“写”操作是顺序写，也就是在文件创建时的写入或者在

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
ALM-25004 LdapServer数据同步异常 - MapReduce服务 MRS

ALM-25004 LdapServer数据同步异常告警解释系统按30秒周期性检测LdapServer数据，如果连续12次检测，Manager的主备LdapServer的数据内容都不一致，产生该告警，当两者的数据一致时，对应告警恢复。系统按30秒周期性检测LdapServe

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
FlinkSQL Lookup算子复用 - MapReduce服务 MRS

FlinkSQL Lookup算子复用本章节适用于MRS 3.5.0及以后版本。使用场景将Lookup Join的结果写入到多个sink端时，无需为每个sink复制一个Lookup join算子，提高作业的执行效率。使用方法配置Flink作业时，可通过在FlinkServer

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
配置Flink SQL Client支持SQL校验功能 - MapReduce服务 MRS

配置Flink SQL Client支持SQL校验功能本章节适用于MRS 3.3.0及以后版本。配置Flink SQL Client支持SQL校验功能方法通过SQL Client进行SQL作业开发时，支持进入校验模式校验SQL语法正确性。校验模式下执行SQL命令不会启动Flink

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
FlinkSQL JSON_VALUE函数性能优化 - MapReduce服务 MRS

FlinkSQL JSON_VALUE函数性能优化本章节适用于MRS 3.5.0及以后版本。使用场景内置JSON_VALUE函数解析一个JSON item的多个字段时，复用上次JSON item的解析结果，提升算子性能。使用方法配置Flink作业时，可通过在FlinkServer

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
缩容ClickHouseServer节点 - MapReduce服务 MRS

勾选“我已经阅读上述信息，并了解具体影响。”并单击“确定”。单击“组件管理”观察各个组件是否存在异常，若存在异常等待5~10分钟后再次观察组件，依然存在异常则联系华为云技术支持处理。单击“告警管理”观察是否存在异常告警，若存在请清除告警后再进行其他操作。父主题： MRS集群容量调整

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群容量调整
配置Doris对接Hive数据源 - MapReduce服务 MRS

相关操作可参考配置跨Manager集群互信。 Hive表操作如果需使用Doris读取Hive存储在OBS中的数据，需执行以下操作。登录华为云管理控制台，在“控制台”页面，鼠标移动至右上方的用户名，在下拉列表中选择“我的凭证”。单击“访问密钥”页签，单击“新增访问密钥”，输入

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris企业级能力增强 > 配置Doris支持多源数据
Flume日志采集概述 - MapReduce服务 MRS

Flume日志采集概述 Flume是一个分布式、可靠和高可用的海量日志聚合的系统。它能够将不同数据源的海量日志数据进行高效收集、聚合、移动，最后存储到一个中心化数据存储系统中。支持在系统中定制各类数据发送方，用于收集数据。同时，提供对数据进行简单处理，并写到各种数据接受方（可定制）的能力。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume
Flume日志采集概述 - MapReduce服务 MRS

Flume日志采集概述 Flume是一个分布式、可靠和高可用的海量日志聚合的系统。它能够将不同数据源的海量日志数据进行高效收集、聚合、移动，最后存储到一个中心化数据存储系统中。支持在系统中定制各类数据发送方，用于收集数据。同时，提供对数据进行简单处理，并写到各种数据接受方（可定制）的能力。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume
通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据应用场景本文介绍如何使用MRS集群运行Spark Streaming作业以消费Kafka数据。假定某个业务Kafka每1秒就会收到1个单词记录。基于业务需要，开发的Spark应用程序实现实时累加计算每个单词的记录总数的功能。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
Spark客户端使用实践 - MapReduce服务 MRS

Spark客户端使用实践本章节提供从零开始使用Spark，提交Spark应用程序，包括Spark Core及Spark SQL。其中，Spark Core为Spark的内核模块，主要负责任务的执行，用于编写Spark应用程序；Spark SQL为执行SQL的模块。场景说明假

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
Spark客户端使用实践 - MapReduce服务 MRS

Spark客户端使用实践本章节提供从零开始使用Spark2x提交spark应用程序，包括Spark Core及Spark SQL。其中，Spark Core为Spark的内核模块，主要负责任务的执行，用于编写spark应用程序；Spark SQL为执行SQL的模块。场景说明

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）
配置FlinkServer重启策略 - MapReduce服务 MRS

配置FlinkServer重启策略概述 Flink支持不同的重启策略，以在发生故障时控制作业是否重启以及如何重启。若不指定重启策略，集群会使用默认的重启策略。用户也可以在提交作业时指定一个重启策略，可参考创建FlinkServer作业在作业开发界面配置（MRS 3.1.0及以后版本）。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink > 管理FlinkServer作业
配置FlinkServer作业重启策略 - MapReduce服务 MRS

配置FlinkServer作业重启策略 FlinkServer作业重启策略介绍 Flink支持不同的重启策略，以在发生故障时控制作业是否重启以及如何重启。如果不指定重启策略，集群会使用默认的重启策略。用户也可以在提交作业时指定一个重启策略，可参考如何创建FlinkServer作业在作业开发界面配置（MRS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 管理FlinkServer作业
使用Jupyter Notebook对接MRS Spark - MapReduce服务 MRS

使用Jupyter Notebook对接MRS Spark 应用场景在MRS服务中可以配合Jupyter Notebook使用PySpark，能够提高机器学习、数据探索和ETL应用开发效率。本实践指导用户如何在MRS集群中配置Jupyter Notebook来使用Pyspark。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
建立Hive表分区提升查询效率 - MapReduce服务 MRS

建立Hive表分区提升查询效率操作场景 Hive在做Select查询时，一般会扫描整个表内容，会消耗较多时间去扫描不关注的数据。此时，可根据业务需求及其查询维度，建立合理的表分区，从而提高查询效率。操作步骤以root用户登录已安装Hive客户端的节点。执行以下命令，进入客

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
FlinkSQL OVER窗口支持超期退窗 - MapReduce服务 MRS

FlinkSQL OVER窗口支持超期退窗本章节适用于MRS 3.5.0及以后版本。 FlinkSQL OVER窗口新增数据超期退窗功能，当已有数据过期且没有新数据到来时，OVER聚合结果刷新并向下游算子发送最新的计算结果，可通过over.window.interval配置该功能，配置如下：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
下载MRS集群用户认证凭据文件 - MapReduce服务 MRS

下载MRS集群用户认证凭据文件用户开发大数据应用程序并在支持Kerberos认证的MRS集群中运行程序时，需要准备访问MRS集群的用户认证文件。认证文件中的keytab文件可用于认证用户身份。该任务指导管理员用户通过Manager下载用户认证文件并导出keytab文件。修改

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群用户 > 管理MRS集群用户
Impala客户端使用实践 - MapReduce服务 MRS

Impala客户端使用实践 Impala是用于处理存储在Hadoop集群中的大量数据的MPP（大规模并行处理）SQL查询引擎。它是一个用C++和Java编写的开源软件。与其他Hadoop的SQL引擎相比，它拥有高性能和低延迟的特点。背景信息假定用户开发一个应用程序，用于管

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Impala

总条数： 3560

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

备份ClickHouse业务数据 - MapReduce服务 MRS

HDFS文件系统目录简介 - MapReduce服务 MRS

ALM-25004 LdapServer数据同步异常 - MapReduce服务 MRS

FlinkSQL Lookup算子复用 - MapReduce服务 MRS

配置Flink SQL Client支持SQL校验功能 - MapReduce服务 MRS

FlinkSQL JSON_VALUE函数性能优化 - MapReduce服务 MRS

缩容ClickHouseServer节点 - MapReduce服务 MRS

配置Doris对接Hive数据源 - MapReduce服务 MRS

Flume日志采集概述 - MapReduce服务 MRS

Flume日志采集概述 - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

Spark客户端使用实践 - MapReduce服务 MRS

Spark客户端使用实践 - MapReduce服务 MRS

配置FlinkServer重启策略 - MapReduce服务 MRS

配置FlinkServer作业重启策略 - MapReduce服务 MRS

使用Jupyter Notebook对接MRS Spark - MapReduce服务 MRS

建立Hive表分区提升查询效率 - MapReduce服务 MRS

FlinkSQL OVER窗口支持超期退窗 - MapReduce服务 MRS

下载MRS集群用户认证凭据文件 - MapReduce服务 MRS

Impala客户端使用实践 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线