搜索_华为云

Flink作业RocksDB状态后端调优 - MapReduce服务 MRS

监测所有版本的SST文件的总大小，单位：字节。文件太多，可能会降低查询的速度 state.backend.rocksdb.metrics.live-sst-files-size true 监测属于最新版本的所有SST文件的总大小，单位：字节。文件太多，可能会降低查询的速度 state.backend.rocksdb

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink性能调优
配置ClickHouse冷热分离 - MapReduce服务 MRS

创建普通账号委托并绑定集群 ClickHouse集群添加OBS磁盘信息配置磁盘存储策略自定义冷热分离数据存储策略导入数据ClickHouse测试验证原理介绍 OBS对象存储是支持海量数据存储，并提供安全可靠的、低成本的分布式存储服务，ClickHouse基于OBS的优势构建冷热分

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse企业级能力增强
使用Spark小文件合并工具说明 - MapReduce服务 MRS

一般来说，旧分区数>新分区数，可设置shuffle为false；但如果旧分区远大于新分区数，例如高于100倍以上，可以考虑设置shuffle为true，增加并行度，提高合并的速度。设置shuffle为true（repartition），会有性能上的提升；但是由于Parquet和Orc存储方式的特殊性，repart

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
使用Spark小文件合并工具说明 - MapReduce服务 MRS

一般来说，旧分区数>新分区数，可设置shuffle为false；但如果旧分区远大于新分区数，例如高于100倍以上，可以考虑设置shuffle为true，增加并行度，提高合并的速度。设置shuffle为true（repartition），会有性能上的提升；但是由于Parquet和Orc存储方式的特殊性，repart

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强
Alluxio常用操作 - MapReduce服务 MRS

0m5.540s sys 0m0.696s 第一次读取数据后会将数据放在内存中，Alluxio再次读取时可以提高访问该数据的速度。例如：在通过cat命令获取文件后，用ls命令再查看文件的状态。 alluxio fs ls /mnt/obs/test_data.csv

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Alluxio
使用Loader导出MRS集群内数据 - MapReduce服务 MRS

“名称”输入作业的名称，“类型”选择“导出”即导出。 “连接”选择一个连接。默认没有已创建的连接，单击“添加”创建一个新的连接，完成后单击“测试”，测试是否可用，待提示成功后单击“确定”。表1 连接配置参数一览表连接器类型参数名说明 generic-jdbc-connector

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导出作业
HBase全局二级索引介绍 - MapReduce服务 MRS

HBase全局二级索引，使用独立的索引表存储索引数据。当给定的查询条件可以命中索引时，可以将对数据表的全表查询转换为对索引表的精确范围查询，提升查询速度。开启全局二级索引特性后，应用侧代码无需特殊修改，简单易用。 MRS 3.3.0及之后版本的集群默认启用HBase全局二级索引功能，如果需

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 配置HBase全局二级索引提升查询效率
调整Yarn任务抢占机制 - MapReduce服务 MRS

preemption.total_preemption_per_round 在一个周期内能够抢占资源的最大的比例。可使用这个值来限制从集群回收容器的速度。计算出了期望的总抢占值之后，策略会伸缩回这个限制。 0.1 yarn.resourcemanager.monitor.capacity.preemption

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn性能调优
提升HBase实时读数据效率 - MapReduce服务 MRS

片的数据，因为图片一般已经是压缩后的数据，所以压缩效果有限。常用的压缩算法是SNAPPY，因为它有较好的Encoding/Decoding速度和可以接受的压缩率。 NONE BLOCKSIZE 配置HFile中block块的大小，不同的block块大小，可以影响HBase读写数据

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase性能调优
添加ClickHouse数据源 - MapReduce服务 MRS

VARCHAR / VARBINARY Date DATE DateTime TIMESTAMP 性能优化查询下推支持使用查询下推功能，提高查询速度。 Scalar UDF下推 Scalar UDF下推功能默认打开。使用该功能前需根据需求在HetuEngine中创建映射函数。添加ClickHouse数据源约束

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
Kafka基本原理 - MapReduce服务 MRS
Kafka基本原理 - MapReduce服务 MRS

tion。消息订阅-通知机制消费者对感兴趣的主题进行订阅，并采取pull的方式消费数据，使得消费者可以根据其消费能力自主地控制消息拉取速度，同时，可以根据自身情况自主选择消费模式，例如批量、重复消费，从尾端开始消费等；另外，需要消费者自己负责维护其自身消息的消费记录。可扩展性

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Kafka
快速开发Hive HCatalog应用 - MapReduce服务 MRS

create table t1(col1 int); create table t2(col1 int,col2 int); 向源数据表t1中插入测试数据： insert into table t1 select 1 union all select 1 union all select

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
Flume业务模型配置说明 - MapReduce服务 MRS

Flume业务配置及模块选择过程中，一般要求Sink的极限吞吐量需要大于Source的极限吞吐量，否则在极限负载的场景下，Source往Channel的写入速度大于Sink从Channel取出的速度，从而导致Channel频繁被写满，进而影响性能表现。 Avro Source和Avro Sink一般都是成对出现，用于多个Flume

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume
快速配置参数 - MapReduce服务 MRS

用于串行化将通过网络发送或需要缓存的对象的类以序列化形式展现。 Java序列化的默认值适用于任何Serializable Java对象，但运行速度相当慢，所以建议使用org.apache.spark.serializer.KryoSerializer并配置Kryo序列化。可以是org

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
快速配置Spark参数 - MapReduce服务 MRS

用于串行化将通过网络发送或需要缓存的对象的类以序列化形式展现。 Java序列化的默认值适用于任何Serializable Java对象，但运行速度相当慢，所以建议使用org.apache.spark.serializer.KryoSerializer并配置Kryo序列化。可以是org

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
配置Hive表、列或数据库的用户权限 - MapReduce服务 MRS

如果为角色添加或删除数据库的查询权限，数据库中的表也将自动添加或删除查询权限。 MRS 3.2.0及之后版本，如果数据库中分区超过百万级，并且分区都在表目录下。如需加快授权速度，可以在FusionInsight Manager 界面，选择“集群 > 服务 > Hive > 配置 > 全部配置 > MetaStore（角色）

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive用户权限管理
ALM-12180 磁盘卡IO - MapReduce服务 MRS

如果IO持续飙高，会对业务操作产生影响导致业务受损，具体可能会产生如下影响：系统性能下降：卡IO会导致系统I/O性能下降，从而影响系统的响应速度和吞吐量。这可能会导致客户的业务运行变慢（例如：作业提交运行变慢、页面响应迟钝、接口响应超时等），甚至出现崩溃或错误。系统故障：卡IO可

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
使用Loader导出数据 - MapReduce服务 MRS

“名称”输入作业的名称，“类型”选择“导出”即导出。 “连接”选择一个连接。默认没有已创建的连接，单击“添加”创建一个新的连接，完成后单击“测试”，测试是否可用，待提示成功后单击“确定”。表1 连接配置参数一览表连接器类型参数名说明 generic-jdbc-connector

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导出
使用Jupyter Notebook对接MRS Spark - MapReduce服务 MRS

install helloword python3 import helloworld helloworld.say_hello("test") 测试安装第三方Python库（如pandas、sklearn）。 pip3 install pandas pip3 install backports

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
添加MySQL数据源 - MapReduce服务 MRS

EAGER：尽可能下推Join。即使表统计信息不可用， EAGER也可以下推Join，这可能会导致查询性能下降，因此仅建议将EAGER用于测试和故障排除场景。 AUTOMATIC 单击“删除”可以删除已增加的自定义配置参数。单击“确定”。登录集群客户端所在节点，执行以下命令，切换到客户端安装目录并认证用户。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源

总条数： 351

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink作业RocksDB状态后端调优 - MapReduce服务 MRS

配置ClickHouse冷热分离 - MapReduce服务 MRS

使用Spark小文件合并工具说明 - MapReduce服务 MRS

使用Spark小文件合并工具说明 - MapReduce服务 MRS

Alluxio常用操作 - MapReduce服务 MRS

使用Loader导出MRS集群内数据 - MapReduce服务 MRS

HBase全局二级索引介绍 - MapReduce服务 MRS

调整Yarn任务抢占机制 - MapReduce服务 MRS

提升HBase实时读数据效率 - MapReduce服务 MRS

添加ClickHouse数据源 - MapReduce服务 MRS

Kafka基本原理 - MapReduce服务 MRS

快速开发Hive HCatalog应用 - MapReduce服务 MRS

Flume业务模型配置说明 - MapReduce服务 MRS

快速配置参数 - MapReduce服务 MRS

快速配置Spark参数 - MapReduce服务 MRS

配置Hive表、列或数据库的用户权限 - MapReduce服务 MRS

ALM-12180 磁盘卡IO - MapReduce服务 MRS

使用Loader导出数据 - MapReduce服务 MRS

使用Jupyter Notebook对接MRS Spark - MapReduce服务 MRS

添加MySQL数据源 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线