搜索_华为云

配置Hive元数据存储至RDS - MapReduce服务 MRS

RDS实例的安全组入方向规则需要放通MySQL（默认为“3306”）和PostgreSQL（默认为“5432”）数据库端口。例如，可通过在RDS控制台单击实例名称进入实例基本信息页面，在“连接信息”区域单击“安全组”右侧的安全组名称进入安全组控制台，在入方向规则页签中添加一个“协议端口”为TCP

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据
Streaming任务打印两次相同DAG日志 - MapReduce服务 MRS

子来实现底层的计算。 Take算子会以Partition为单位多次触发计算。在该问题中，由于Shuffle操作，导致take算子默认有两个Partition，Spark首先计算第一个Partition，但由于没有数据输入，导致获取结果不足10个，从而触发第二次计算，因此会出现RDD的DAG结构打印两次的现象。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Streaming
Tez - MapReduce服务 MRS
Tez - MapReduce服务 MRS

Tez是Apache最新的支持DAG（有向无环图）作业的开源计算框架，它可以将多个有依赖的作业转换为一个作业从而大幅提升DAG作业的性能。 MRS将Tez作为Hive的默认执行引擎，执行效率远远超过原先的MapReduce的计算引擎。有关Tez的详细说明，请参见：https://tez

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
ALM-45179 OBS readFully接口调用失败数高于阈值 - MapReduce服务 MRS

系统当前指标取值满足自定义的告警设置条件。对系统的影响 OBS readFully接口调用失败数高于阈值，会影响上层大数据计算业务的正常执行，导致某些计算任务的执行失败。可能原因 OBS服务端出现执行异常或严重超时。处理步骤登录FusionInsight Manager，选择“运维

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Storm与其他组件的关系 - MapReduce服务 MRS

Storm与其他组件的关系 Storm，提供实时的分布式计算框架，它可以从数据源（如Kafka、TCP连接等）中获得实时消息数据，在实时平台上完成高吞吐、低延迟的实时计算，并将结果输出到消息队列或者进行持久化。Storm与其他组件的关系如图1所示：图1 组件关系图 Storm和Streaming的关系

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Storm
Streaming任务打印两次相同DAG日志 - MapReduce服务 MRS

子来实现底层的计算。 Take算子会以Partition为单位多次触发计算。在该问题中，由于Shuffle操作，导致take算子默认有两个Partition，Spark首先计算第一个Partition，但由于没有数据输入，导致获取结果不足10个，从而触发第二次计算，因此会出现RDD的DAG结构打印两次的现象。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Streaming
ALM-45181 OBS write接口调用失败数高于阈值 - MapReduce服务 MRS

condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响 OBS write接口调用失败数高于阈值，会影响上层大数据计算业务的正常执行，导致某些计算任务的执行失败。可能原因 OBS服务端出现执行异常或严重超时。处理步骤登录FusionInsight Manager，选择“运维

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Spark基本原理 - MapReduce服务 MRS
Spark基本原理 - MapReduce服务 MRS

式分析等。 Spark提供了一个快速的计算、写入及交互式查询的框架。相比于Hadoop，Spark拥有明显的性能优势。Spark使用in-memory的计算方式，通过这种方式来避免一个MapReduce工作流中的多个任务对同一个数据集进行计算时的IO瓶颈。Spark利用Scala

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
Storm开源增强特性 - MapReduce服务 MRS

种SQL-like的语言，相对于SQL，CQL中增加了（时序）窗口的概念，将待处理的数据保存在内存中，进行快速的内存计算，CQL的输出结果为数据流在某一时刻的计算结果。使用CQL，可以快速进行业务开发，并方便地将业务提交到Storm平台开启实时数据的接收、处理及结果输出；并可以在合适的时候中止业务。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Storm
如何让不同的业务程序分别用不同的Yarn队列？ - MapReduce服务 MRS

选择“叶子租户”：当前租户为叶子租户，不支持添加子租户。选择“非叶子租户”：当前租户为非叶子租户，支持添加子租户，但租户层级不能超过5层。计算资源为当前租户选择动态计算资源。选择“Yarn”时，系统自动在Yarn中以子租户名称创建任务队列。如果是叶子租户，叶子租户可直接提交到任务队列中。

帮助中心 > MapReduce服务 MRS > 常见问题 > 作业管理类
HetuEngine物化视图概述 - MapReduce服务 MRS

将高频访问的SQL查询和有高耗时的算子（连接，聚合等算子）的SQL通过建立物化视图进行预计算，然后在查询的SQL中将能匹配到物化视图的查询或者子查询转换为物化视图，避免了数据的重复计算，这种情况下往往能较大地提高查询的响应效率。物化视图通常基于对数据表进行聚合和连接的查询结果创建。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 配置HetuEngine物化视图
ALM-12101 AZ不健康 - MapReduce服务 MRS

AZ的健康状态由AZ内的存储资源（HDFS）、计算资源（Yarn）和关键角色的健康度是否超过配置阈值决定。 AZ亚健康有两种：计算资源（Yarn）不健康，存储资源（HDFS）健康，任务无法提交到本AZ，但是数据可以继续往本AZ内读写。计算资源（Yarn）健康，存储资源（HDFS）

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Flink应用开发简介 - MapReduce服务 MRS

Flink应用开发简介 Flink是一个批处理和流处理结合的统一计算框架，其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。 Flink最适合的应用场景是低时延的数据处理（Data Processing）场景：高并发pipeline处理数据，时延毫秒级，且兼具可靠性。 Flink整个系统包含三个部分：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发概述
ALM-45180 OBS read接口调用失败数高于阈值 - MapReduce服务 MRS

condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响 OBS read接口调用失败数高于阈值，会影响上层大数据计算业务的正常执行，导致某些计算任务的执行失败。可能原因 OBS服务端出现执行异常或严重超时。处理步骤登录FusionInsight Manager，选择“运维

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

b=xxx 原因分析按照设定，任务应该只扫描b=xxx的分区，但是查看任务日志可以发现，实际上任务却扫描了所有的分区再来计算b=xxx的数据，因此任务计算的很慢。并且因为需要扫描所有文件，会有大量的OBS请求发送。 MRS默认开启基于分区统计信息的执行计划优化，相当于自动执行Analyze

帮助中心 > MapReduce服务 MRS > 常见问题 > 作业管理类
使用CDM服务迁移MRS HDFS数据至OBS - MapReduce服务 MRS

使用CDM服务迁移MRS HDFS数据至OBS 应用场景 MRS支持在大数据存储容量大、计算资源需要弹性扩展的场景下，用户将数据存储在OBS服务中，使用MRS集群仅作数据计算处理的存算分离模式，从而实现按需灵活扩展资源、低成本的海量数据分析方案。 CDM支持文件到文件类数据的迁移，本章节以MRS

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
ClickHouse简介 - MapReduce服务 MRS
ClickHouse简介 - MapReduce服务 MRS

量级。 ClickHouse的设计优点：数据压缩比高多核并行计算向量化计算引擎支持嵌套数据结构支持稀疏索引支持数据Insert和Update ClickHouse的应用场景：实时数仓场景使用流式计算引擎（如Flink）把实时数据写入ClickHouse，借助Cli

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > ClickHouse开发指南（普通模式） > ClickHouse应用开发简介
ALM-45177 OBS数据读操作接口调用成功率低于阈值 - MapReduce服务 MRS

condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响 OBS数据读操作接口调用成功率小于阈值，会影响上层大数据计算业务的正常执行，导致某些计算任务的执行失败。可能原因 OBS服务端出现执行异常或严重超时。处理步骤检查堆内存使用率。在FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Flink基本原理 - MapReduce服务 MRS
Flink基本原理 - MapReduce服务 MRS

Flink基本原理 Flink简介 Flink是一个批处理和流处理结合的统一计算框架，其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理，是业界最顶级的开源流处理引擎。 Flink最适合的应用场景是低时延的数据处理（Data Processing）场景

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flink
配置Hive动态脱敏 - MapReduce服务 MRS

配置Hive动态脱敏使用场景 Hive动态脱敏功能开启后，配置脱敏列的数据可以参与计算，计算结果输出时不可见，在集群内脱敏策略会根据血缘关系自动传递，更大的发挥数据的价值同时保障数据的隐私性。使用约束不支持Hudi表的脱敏。不支持涉及直接读写HDFS的操作的脱敏。不支持

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive企业级能力增强

总条数： 1880

上一页
1
2
3
4
5
...
94
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置Hive元数据存储至RDS - MapReduce服务 MRS

Streaming任务打印两次相同DAG日志 - MapReduce服务 MRS

Tez - MapReduce服务 MRS

ALM-45179 OBS readFully接口调用失败数高于阈值 - MapReduce服务 MRS

Storm与其他组件的关系 - MapReduce服务 MRS

Streaming任务打印两次相同DAG日志 - MapReduce服务 MRS

ALM-45181 OBS write接口调用失败数高于阈值 - MapReduce服务 MRS

Spark基本原理 - MapReduce服务 MRS

Storm开源增强特性 - MapReduce服务 MRS

如何让不同的业务程序分别用不同的Yarn队列？ - MapReduce服务 MRS

HetuEngine物化视图概述 - MapReduce服务 MRS

ALM-12101 AZ不健康 - MapReduce服务 MRS

Flink应用开发简介 - MapReduce服务 MRS

ALM-45180 OBS read接口调用失败数高于阈值 - MapReduce服务 MRS

SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

使用CDM服务迁移MRS HDFS数据至OBS - MapReduce服务 MRS

ClickHouse简介 - MapReduce服务 MRS

ALM-45177 OBS数据读操作接口调用成功率低于阈值 - MapReduce服务 MRS

Flink基本原理 - MapReduce服务 MRS

配置Hive动态脱敏 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线