搜索_华为云

Spark并发写Hudi建议 - MapReduce服务 MRS

Spark并发写Hudi建议涉及到并发场景，推荐采用分区间并发写的方式：即不同的写入任务写不同的分区分区并发参数控制： SQL方式： set hoodie.support.partition.lock=true; DataSource Api方式： df.write .format("hudi")

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Spark on Hudi开发规范
Doris基本原理 - MapReduce服务 MRS
Doris基本原理 - MapReduce服务 MRS

和被更新的数据进行标记删除，同时将新的数据写入新的文件。在查询时，所有被标记删除的数据都会在文件级别被过滤，读取出的数据就都是最新的数据，消除了读时合并中的数据聚合过程，并且能够在很多情况下支持多种谓词的下推。因此在许多场景都能带来比较大的性能提升，尤其是在有聚合查询的情况下。 Duplicate模型

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Doris
Flink与其他组件的关系 - MapReduce服务 MRS

Flink与其他组件的关系 Flink与Yarn的关系 Flink支持基于Yarn管理的集群模式，在该模式下，Flink作为Yarn上的一个应用，提交到Yarn上执行。 Flink基于Yarn的集群部署如图1所示。图1 Flink基于Yarn的集群部署 Flink Yarn C

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flink
登录MRS集群节点 - MapReduce服务 MRS

本章节介绍如何使用弹性云服务器管理控制台上提供的远程登录（VNC方式）和如何使用密钥或密码方式（SSH方式）登录MRS集群中的节点，远程登录主要用于紧急运维场景，远程登录弹性云服务器进行相关维护操作。其他场景下，建议用户采用SSH方式登录。如果需要使用SSH方式登录集群节点，需要在集群的安全组规则中手动添

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 登录MRS集群
ClickHouse概述 - MapReduce服务 MRS
ClickHouse概述 - MapReduce服务 MRS

当合并SummingMergeTree表的数据片段时，ClickHouse会把所有具有相同主键的行合并为一行，该行包含了被合并的行中具有数值数据类型的列的汇总值。如果主键的组合方式使得单个键值对应于大量的行，则可以显著减少存储空间并加快数据查询的速度。建表语法： CREATE TABLE

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse
配置矢量化读取ORC数据 - MapReduce服务 MRS

空间的消耗。矢量化读取ORC格式的数据能够大幅提升ORC数据读取性能。在Spark2.3版本中，SparkSQL支持矢量化读取ORC数据（这个特性在Hive的历史版本中已经得到支持）。矢量化读取ORC格式的数据能够获得比传统读取方式数倍的性能提升。该特性可以通过下面的配置项开启：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
配置矢量化读取ORC数据 - MapReduce服务 MRS

空间的消耗。矢量化读取ORC格式的数据能够大幅提升ORC数据读取性能。在Spark2.3版本中，SparkSQL支持矢量化读取ORC数据（这个特性在Hive的历史版本中已经得到支持）。矢量化读取ORC格式的数据能够获得比传统读取方式数倍的性能提升。该特性可以通过下面的配置项开启：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
使用HBase过滤器Filter - MapReduce服务 MRS

件来实现，如设置RowKey、列名或者列值的过滤条件。代码样例以下代码片段在com.huawei.bigdata.hbase.examples包的“HBaseExample”类的testFilterList方法中。样例代码获取方式请参考获取MRS应用开发样例工程。代码样例：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > 开发HBase应用
使用HDFS异步删除特性 - MapReduce服务 MRS

操作场景 HDFS异步删除特性适用于存在删除大目录的场景，通过异步以及流量控制的方式删除block块的方式，能有效降低连续持有锁的时间。该操作仅适用于MRS 3.5.0及之后版本。操作步骤请参考修改集群服务配置参数，进入HDFS的“全部配置”页面。在搜索框中输入参数名称，根据

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS性能调优
用add jar方式创建function，执行drop function时出现问题 - MapReduce服务 MRS

functions; 结果显示，被drop的function仍然存在，如图2所示。图2 执行show functions操作后的结果回答问题根因：上述两个问题是由于多主实例模式或者多租户模式下，使用spark-beeline通过add jar的方式创建function，此funct

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
IoTDB基本原理 - MapReduce服务 MRS
IoTDB基本原理 - MapReduce服务 MRS

图1展示了使用IoTDB套件的全部组件形成的整体应用架构，IoTDB特指其中的时间序列数据库组件。图1 IoTDB结构用户可以通过JDBC/Session将来自设备传感器上采集的时序数据和服务器负载、CPU内存等系统状态数据、消息队列中的时序数据、应用程序的时序数据或者其他数据库中的时序数据导

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > IoTDB
Yarn节点配置调优 - MapReduce服务 MRS

有设置的目录中，一般会是在不同的设备中。为保证磁盘IO负载均衡，需要提供几个路径且每个路径都对应一个单独的磁盘。应用程序的本地化后的日志目录存在于相对路径/application_%{appid}中。单独容器的日志目录，即container_{$contid}，是该路径下的子目录

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn性能调优
Consumer初始化成功但是无法从Kafka中获取指定Topic消息 - MapReduce服务 MRS

group-xxx/owners/topic-xxx/x。当触发负载均衡后，原来的consumer会重新计算并释放已占用的partitions，此过程需要一定的处理时间，新来的consumer抢占该partitions时很有可能会失败。表1 参数说明名称作用默认值 rebalance

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
计费说明 - MapReduce服务 MRS
计费说明 - MapReduce服务 MRS

配置弹性伸缩：根据业务数据量的变化动态调整集群Task节点数量以增减资源，请参见配置弹性伸缩规则。若MRS提供的变更配置方式不满足您的要求，您也可以通过重建集群，然后做数据迁移的方式实现集群配置的变更。续费如需续费，请进入“续费管理”页面进行续费操作。欠费包年/包月集群，没有欠费的概念。

帮助中心 > MapReduce服务 MRS > 产品介绍
运行HiveSql作业 - MapReduce服务 MRS

可选参数，为本次执行的作业配置相关优化参数（例如线程、内存、CPU核数等），用于优化资源使用效率，提升作业的执行性能。 HiveSql作业常用的运行程序参数如表2所示，可根据执行程序及集群资源情况进行配置。 - 服务配置参数可选参数，用于为本次执行的作业修改服务配置参数。该参数的修改仅适

 帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
Flink客户端使用实践 - MapReduce服务 MRS

下载认证凭据”。图6 下载认证凭据将下载的认证凭据压缩包解压缩，并将得到的文件拷贝到客户端节点中，例如客户端节点的“/opt/hadoopclient/Flink/flink/conf”目录下。如果是在集群外节点安装的客户端，需要将得到的文件拷贝到该节点的“/etc/”目录下。配置安全

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink
Spark基本原理 - MapReduce服务 MRS
Spark基本原理 - MapReduce服务 MRS

store以及数据库，支持对于可变状态的细粒度更新，这一点要求集群需要对数据或者日志的更新进行备份来保障容错性。这样就会给数据密集型的工作流带来大量的IO开销。而对于RDD来说，它只有一套受限制的接口，仅支持粗粒度的更新，例如map，join等等。通过这种方式，Spark只需要简单的记录建立数据的转换操作的

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
Yarn节点配置调优 - MapReduce服务 MRS

有设置的目录中，一般会是在不同的设备中。为保证磁盘IO负载均衡，需要提供几个路径且每个路径都对应一个单独的磁盘。应用程序的本地化后的日志目录存在于相对路径/application_%{appid}中。单独容器的日志目录，即container_{$contid}，是该路径下的子目录

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn性能调优
Kafka与其他组件的关系 - MapReduce服务 MRS

Kafka与其他组件的关系 Kafka作为一个消息发布-订阅系统，为整个大数据平台多个子系统之间数据的传递提供了高速数据流转方式。 Kafka可以实时接受来自外部的消息，并提供给在线以及离线业务进行处理。 Kafka与其他组件的具体的关系如下图所示：图1 与其他组件关系父主题：

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Kafka
将Oracle数据库中的数据导入HDFS时各连接器的区别 - MapReduce服务 MRS

答案 generic-jdbc-connector 使用JDBC方式从Oracle数据库读取数据，适用于支持JDBC的数据库。在这种方式下，Loader加载数据的性能受限于分区列的数据分布是否均匀。当分区列的数据偏斜（数据集中在一个或者几个值）时，个别Map需要处理绝大部分数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader常见问题

总条数： 1538

上一页
1
...
5
6
7
...
77
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark并发写Hudi建议 - MapReduce服务 MRS

Doris基本原理 - MapReduce服务 MRS

Flink与其他组件的关系 - MapReduce服务 MRS

登录MRS集群节点 - MapReduce服务 MRS

ClickHouse概述 - MapReduce服务 MRS

配置矢量化读取ORC数据 - MapReduce服务 MRS

配置矢量化读取ORC数据 - MapReduce服务 MRS

使用HBase过滤器Filter - MapReduce服务 MRS

使用HDFS异步删除特性 - MapReduce服务 MRS

用add jar方式创建function，执行drop function时出现问题 - MapReduce服务 MRS

IoTDB基本原理 - MapReduce服务 MRS

Yarn节点配置调优 - MapReduce服务 MRS

Consumer初始化成功但是无法从Kafka中获取指定Topic消息 - MapReduce服务 MRS

计费说明 - MapReduce服务 MRS

运行HiveSql作业 - MapReduce服务 MRS

Flink客户端使用实践 - MapReduce服务 MRS

Spark基本原理 - MapReduce服务 MRS

Yarn节点配置调优 - MapReduce服务 MRS

Kafka与其他组件的关系 - MapReduce服务 MRS

将Oracle数据库中的数据导入HDFS时各连接器的区别 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线