搜索_华为云

经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

Int)相同，会将数据通过Shuffle的方式重新分区；当shuffle为false的时候，则只是简单的将父RDD的多个partition合并到同一个task进行计算，shuffle为false时，如果numPartitions大于父RDD的切片数，那么分区不会重新调整。遇到下列场景，可选择使用coalesce算子：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

Int)相同，会将数据通过Shuffle的方式重新分区；当shuffle为false的时候，则只是简单的将父RDD的多个partition合并到同一个task进行计算，shuffle为false时，如果numPartitions大于父RDD的切片数，那么分区不会重新调整。遇到下列场景，可选择使用coalesce算子

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
Hive基本原理 - MapReduce服务 MRS
Hive基本原理 - MapReduce服务 MRS

L、Derby。Hive中的元数据包括表的名字，表的列和分区及其属性，表的属性（是否为外部表等），表的数据所在目录等。 Hive结构 Hive为单实例的服务进程，提供服务的原理是将HQL编译解析成相应的MapReduce或者HDFS任务，图1为Hive的结构概图。图1 Hive结构

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Hive
使用永洪BI访问MRS HetuEngine - MapReduce服务 MRS

户名”和“密码”为已创建的“人机”用户的用户名和用户密码。配置完成后可以单击“测试连接”测试。图2 数据源配置驱动：选择“自定义 > 选择自定义驱动”，单击，编辑驱动名称，单击“上传文件”上传已获取的JDBC jar包，单击“确定”。 URL：支持HSFabric方式和HSBroker方式，详情请参考表1。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
快速创建和使用HBase离线数据查询集群 - MapReduce服务 MRS

HBase查询集群基于系统预置的集群模板选择要购买的集群组件。可用区可用区1 选择集群工作区域下关联的可用区。虚拟私有云 vpc-default 选择需要创建集群的VPC，单击“查看虚拟私有云”进入VPC服务查看已创建的VPC名称和ID。如果没有VPC，需要创建一个新的VPC。子网 subnet-default

帮助中心 > MapReduce服务 MRS > 快速入门
Flink on Hudi作业参数规则 - MapReduce服务 MRS

时长超过Checkpoint超时时长会导致作业失败。 CDC场景下Hudi读写表需要开启Changelog CDC场景下为保障Flink计算的准确，需要在Hudi表中保留+I、+U、-U、-D。所以同一个Hudi表在写入、流读时都需要开启Changelog。父主题： Flink

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink on Hudi开发规范
Flink作业引擎概述 - MapReduce服务 MRS

流作业和批作业的状态监控。 Flink作业运维能力增强，包括原生监控页面跳转。性能&可靠性流处理支持24小时窗口聚合计算，毫秒级性能。批处理支持90天窗口聚合计算，分钟级计算完成。支持对流处理和批处理的数据进行过滤配置，过滤无效数据。读取HDFS数据时，提前根据计算周期过滤。作业定

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink
Spark SQL ROLLUP和CUBE使用的注意事项 - MapReduce服务 MRS

2 2 1 1 1 1 2 2 对于以上结果的第一条为什么是(NULL,0)而不是(NULL,4)。回答在进行rollup和cube操作时，用户通常是基于维度进行分析，需要的是度量的结果，因此不会对维度进行聚合操作。例如当前有表src(d1, d2,

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
快速购买MRS集群 - MapReduce服务 MRS

务自研组件，提供长期的支持和演进。普通版：主要依托开源组件的能力，融入了MRS服务自研、成熟稳定的特性和功能，带来性能及稳定性的提升。 LTS版集群版本 MRS集群的版本，不同版本所包含的开源组件版本及功能特性可能不同，推荐选择最新版本。版本详细包含的组件详细可参考MRS组件版本一览表。

帮助中心 > MapReduce服务 MRS > 用户指南 > 购买MRS集群
MapReduce与其他组件的关系 - MapReduce服务 MRS

MapReduce与其他组件的关系 MapReduce和HDFS的关系 HDFS是Hadoop分布式文件系统，具有高容错和高吞吐量的特性，可以部署在价格低廉的硬件上，存储应用程序的数据，适合有超大数据集的应用程序。 MapReduce是一种编程模型，用于大数据集（大于1TB）的并行运算。在Ma

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MapReduce
如何处理checkpoint设置RocksDBStateBackend方式，且当数据量大时，执行checkpoint会很慢的问题？ - MapReduce服务 MRS

oint会很慢的问题？问题如何处理checkpoint设置RocksDBStateBackend方式，且当数据量大时，执行checkpoint会很慢的问题？原因分析由于窗口使用自定义窗口，这时窗口的状态使用ListState，且同一个key值下，value的值非常多，每次

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发常见问题
如何处理Checkpoint设置RocksDBStateBackend方式时Checkpoint慢 - MapReduce服务 MRS

t会很慢的问题？原因分析由于窗口使用自定义窗口，这时窗口的状态使用ListState，且同一个key值下，value的值非常多，每次新的value值到来都要使用RocksDB的merge()操作；触发计算时需要将该key值下所有的value值读出。 RocksDB的方式为merge()->merge()

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > Flink应用开发常见问题
如何处理Checkpoint设置RocksDBStateBackend方式时Checkpoint慢 - MapReduce服务 MRS

t会很慢的问题？原因分析由于窗口使用自定义窗口，这时窗口的状态使用ListState，且同一个key值下，value的值非常多，每次新的value值到来都要使用RocksDB的merge()操作；触发计算时需要将该key值下所有的value值读出。 RocksDB的方式为merge()->merge()

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > Flink应用开发常见问题
通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

录。基于业务需要，开发的Spark应用程序实现实时累加计算每个单词的记录总数的功能。 Spark Streaming样例工程的数据存储在Kafka组件中，向Kafka组件发送数据。 MRS服务提供了Spark服务多种场景下的样例开发工程，本章节对应示例场景的开发思路：接收Kafka中数据，生成相应DStream。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
ClickHouse基本原理 - MapReduce服务 MRS

ClickHouse是一款开源的面向联机分析处理的列式数据库，其独立于Hadoop大数据体系，最核心的特点是压缩率和极速查询性能。同时，ClickHouse支持SQL查询，且查询性能好，特别是基于大宽表的聚合分析查询性能非常优异，比其他分析型数据库速度快一个数量级。 ClickHouse核心的功能特性介绍如下：

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > ClickHouse
如何处理Checkpoint设置RocksDBStateBackend方式时Checkpoint慢 - MapReduce服务 MRS

t会很慢的问题？原因分析由于窗口使用自定义窗口，这时窗口的状态使用ListState，且同一个key值下，value的值非常多，每次新的value值到来都要使用RocksDB的merge()操作；触发计算时需要将该key值下所有的value值读出。 RocksDB的方式为merge()->merge()

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > Flink应用开发常见问题
如何处理Checkpoint设置RocksDBStateBackend方式时Checkpoint慢 - MapReduce服务 MRS

t会很慢的问题？原因分析由于窗口使用自定义窗口，这时窗口的状态使用ListState，且同一个key值下，value的值非常多，每次新的value值到来都要使用RocksDB的merge()操作；触发计算时需要将该key值下所有的value值读出。 RocksDB的方式为merge()->merge()

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > Flink应用开发常见问题
Storm应用开发简介 - MapReduce服务 MRS

Storm是一个分布式的、可靠的、容错的数据流处理系统。它会把工作任务委托给不同类型的组件，每个组件负责处理一项简单特定的任务。Storm的目标是提供对大数据流的实时处理，可以可靠地处理无限的数据流。 Storm有很多适用的场景：实时分析、在线机器学习、持续计算和分布式ETL等，易扩

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（安全模式） > Storm应用开发概述
配置Hive对接MemArtsCC - MapReduce服务 MRS

本章节介绍在存算分离场景下如何配置Hive任务中集成MemArtsCC缓存，MemArtsCC会在将热点数据存储在计算侧集群，可以起到降低OBS服务端带宽的作用，利用MemArtsCC的本地存储，访问热点数据不必跨网络，可以提升Hive的数据读取效率。前提条件 Guardian服务正常，且已开启存算分离，具体请参考配置Guardian服务对接OBS。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用MemArtsCC
配置在Spark对接MemArtsCC - MapReduce服务 MRS

rk任务中集成MemArtsCC缓存，MemArtsCC会在将热点数据存储在计算侧集群，可以起到降低OBS服务端带宽的作用，利用MemArtsCC的本地存储，访问热点数据不必跨网络，可以提升Spark的数据读取效率。前提条件 Guardian服务正常，且已开启存算分离，具体请参考配置Guardian服务对接OBS。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用MemArtsCC

总条数： 3789

上一页
1
...
9
10
11
...
190
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

经验总结 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

Hive基本原理 - MapReduce服务 MRS

使用永洪BI访问MRS HetuEngine - MapReduce服务 MRS

快速创建和使用HBase离线数据查询集群 - MapReduce服务 MRS

Flink on Hudi作业参数规则 - MapReduce服务 MRS

Flink作业引擎概述 - MapReduce服务 MRS

Spark SQL ROLLUP和CUBE使用的注意事项 - MapReduce服务 MRS

快速购买MRS集群 - MapReduce服务 MRS

MapReduce与其他组件的关系 - MapReduce服务 MRS

如何处理checkpoint设置RocksDBStateBackend方式，且当数据量大时，执行checkpoint会很慢的问题？ - MapReduce服务 MRS

如何处理Checkpoint设置RocksDBStateBackend方式时Checkpoint慢 - MapReduce服务 MRS

如何处理Checkpoint设置RocksDBStateBackend方式时Checkpoint慢 - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

ClickHouse基本原理 - MapReduce服务 MRS

如何处理Checkpoint设置RocksDBStateBackend方式时Checkpoint慢 - MapReduce服务 MRS

如何处理Checkpoint设置RocksDBStateBackend方式时Checkpoint慢 - MapReduce服务 MRS

Storm应用开发简介 - MapReduce服务 MRS

配置Hive对接MemArtsCC - MapReduce服务 MRS

配置在Spark对接MemArtsCC - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线