搜索_华为云

Hive支持ZSTD压缩格式 - MapReduce服务 MRS

Hive支持ZSTD压缩格式 ZSTD（全称为Zstandard）是一种开源的无损数据压缩算法，其压缩性能和压缩比均优于当前Hadoop支持的其他压缩格式，本特性使得Hive支持ZSTD压缩格式的表。Hive支持基于ZSTD压缩的存储格式有常见的ORC、RCFile、TextFi

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive数据存储及加密配置
创建FlinkServer作业写入数据至Hudi表 - MapReduce服务 MRS

'hoodie.bucket.index.hash.field'='recordkey.field' hoodie.bucket.index.num.buckets：Hudi表中每个分区划分桶的个数，每个分区内的数据通过Hash方式放入每个桶内。建表或第一次写入数据时设置后不能修改，否则更新数据会存在异常。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业
ZooKeeper开源增强特性 - MapReduce服务 MRS

ZooKeeper上Client和Server之间的凭证由X509AuthenticationProvider执行。根据以下参数指定服务端证书及信任客户端证书，并通过这些证书初始化X509AuthenticationProvider。 zookeeper.ssl.keyStore.location

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > ZooKeeper
Kudu应用开发常用概念 - MapReduce服务 MRS

let server上，多个副本中有一个是leader tablet；所有的副本都可以读，但是写操作只有leader可以，写操作利用一致性算法（Raft）。 Tablet server Tablet server是数据存储节点，存放tablet并且响应client请求，一个tablet

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kudu开发指南（普通模式） > Kudu应用开发概述
配置Spark数据传输加密 - MapReduce服务 MRS

要生成的加密密钥的长度，支持设置为“192”或“256”。 256 spark.network.crypto.keyFactoryAlgorithm 生成加密密钥时使用的算法。 PBKDF2WithHmacSHA1 spark.io.encryption.enabled 启用本地磁盘I/O加密。安全模式：true

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群安全配置 > MRS集群安全加固
快速配置参数 - MapReduce服务 MRS

sql.hbase.HBaseSQLParser spark.shuffle.manager 处理数据的方式。有两种实现方式可用：sort和hash。sort shuffle对内存的使用率更高，是Spark 1.2及后续版本的默认选项。 SORT spark.deploy.zookeeper

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
增强有限内存下的稳定性 - MapReduce服务 MRS

有限内存下的稳定性涉及到3个子功能： ExternalSort 外部排序功能，当执行排序时如果内存不足会将一部分数据溢出到磁盘中。 TungstenAggregate 新Hash聚合功能，默认对数据调用外部排序进行排序，然后再进行聚合，因此内存不足时在排序阶段会将数据溢出到磁盘，在聚合阶段因数据有序，在内存中只保

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
增强有限内存下的稳定性 - MapReduce服务 MRS

有限内存下的稳定性涉及到3个子功能： ExternalSort 外部排序功能，当执行排序时如果内存不足会将一部分数据溢出到磁盘中。 TungstenAggregate 新Hash聚合功能，默认对数据调用外部排序进行排序，然后再进行聚合，因此内存不足时在排序阶段会将数据溢出到磁盘，在聚合阶段因数据有序，在内存中只保

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
Spark On Hudi性能调优 - MapReduce服务 MRS

建表时，可以加入如下属性，提升查询效率。默认配置下属性值等于primaryKey，即主键。 hoodie.bucket.index.hash.field=id 初始化Hudi表时，可以使用BulkInsert方式快速写入数据示例： set hoodie.combine.before

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Spark on Hudi开发规范
在MRS集群外客户端提交不了Oozie任务或两个小时才提交成功 - MapReduce服务 MRS

在MRS集群外客户端提交不了Oozie任务，或者两个小时才提交成功。原因分析通过后台日志看到一些Java安全随机数的日志，在JDK中，SecureRandom算法底层依赖操作系统提供的随机数据；在Linux中，与之相关的是“/dev/random”和“/dev/urandom”。当熵池为空时，来自“

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Oozie
实时OLAP数据查询：基于Unique表的单表检索查询和聚合查询 - MapReduce服务 MRS

应用场景本场景通过基于Unique模型表查询符合条件的数据。基于Unique模型表聚合查询，支持MIN，MAX，SUM，REPLACE四种聚合算法。方案架构 Doris支持海量数据的亚秒级查询，支持单表数据的聚合查询和多表关联查询。Doris不同的表引擎，适合不同的业务场景，可以根据业务特点选择不同的表格式。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
产品优势 - MapReduce服务 MRS
产品优势 - MapReduce服务 MRS

同时通过高性能的计算存储分离架构，打破存算一体架构并行计算的限制，最大化发挥对象存储的高带宽、高并发的特点，对数据访问效率和并行计算深度优化（元数据操作、写入算法优化等），实现性能提升。 MRS支持自研的超级调度器Superior Scheduler，性能更优。 MRS支持自研超级调度器Superior

帮助中心 > MapReduce服务 MRS > 产品介绍
网络连接超时导致FetchFailedException - MapReduce服务 MRS

insertAll(ExternalSorter.scala:217) at org.apache.spark.shuffle.hash.HashShuffleReader.read(HashShuffleReader.scala:102) at org.apache

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

需要重新设计key，以更小粒度的key使得task大小合理化。修改并行度。优化数据结构把数据按列存放，读取数据时就可以只扫描需要的列。使用Hash Shuffle时，通过设置spark.shuffle.consolidateFiles为true，来合并shuffle中间文件，减少s

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
Hudi表分区设计规范 - MapReduce服务 MRS

近一个月的数据更新占比最大，可以按照月份创建分区；近一天内的数据更新占比大，可以按照天进行分区。采用Bucket索引，写入是通过主键Hash打散的，数据会均匀的写入到分区下每个桶。因为各个分区的数据量是会有波动的，分区下桶的个数设计一般会按照最大分区数据量计算，这样会出现越细粒度的分区，桶的个数会冗余越多。例如：

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表设计规范
Hive开源增强特性 - MapReduce服务 MRS

创建Hive表时，可以指定要加密的列和加密算法。当使用insert语句向表中插入数据时，即可将对应的列进行加密。Hive列加密不支持视图以及Hive over HBase场景。 Hive列加密机制目前支持的加密算法有两种，具体使用的算法在建表时指定。 AES（对应加密类名称为：org

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Hive
配置Hive列加密功能 - MapReduce服务 MRS

列和加密算法。当使用insert语句向表中插入数据时，即可实现将对应列的数据加密。只支持对存储在HDFS上的TextFile和SequenceFile文件格式的Hive表进行列加密，不支持视图以及Hive over HBase场景。 Hive列加密机制目前支持的加密算法有两种，在建表时指定：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive数据存储及加密配置
Kudu应用开发简介 - MapReduce服务 MRS

格可序列化的一致性的选项。提供同时运行顺序读写和随机读写的良好性能。易于管理。高可用性。Master和TServer采用raft算法，该算法可确保只要副本总数的一半以上可用，tablet就可以进行读写操作。例如，如果3个副本中有2个副本或5个副本中有3个副本可用，则tabl

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kudu开发指南（安全模式） > Kudu应用开发概述
Flink SQL逻辑开发建议 - MapReduce服务 MRS

GROUP BY day, MOD(HASH_CODE(user_id), 1024) ) GROUP BY day 多流join场景建议join字段设置为主键如果join字段不为主键，会导致Flink shuffle task按照hash进行数据处理，导致在Flink中无法保序。同时状态后端中同一个join

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink SQL逻辑开发规范
Doris建表规范 - MapReduce服务 MRS
Doris建表规范 - MapReduce服务 MRS

1千万~2亿以内数据为了方便可以不设置分区（Doris内部有一个默认分区），直接用分桶策略即可。如果分桶字段存在30%以上的数据倾斜，则禁止使用Hash分桶策略，改为使用Random分桶策略，相关命令为： Create table ... DISTRIBUTED BY RANDOM BUCKETS

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Doris应用开发规范

总条数： 758

上一页
1
...
6
7
8
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hive支持ZSTD压缩格式 - MapReduce服务 MRS

创建FlinkServer作业写入数据至Hudi表 - MapReduce服务 MRS

ZooKeeper开源增强特性 - MapReduce服务 MRS

Kudu应用开发常用概念 - MapReduce服务 MRS

配置Spark数据传输加密 - MapReduce服务 MRS

快速配置参数 - MapReduce服务 MRS

增强有限内存下的稳定性 - MapReduce服务 MRS

增强有限内存下的稳定性 - MapReduce服务 MRS

Spark On Hudi性能调优 - MapReduce服务 MRS

在MRS集群外客户端提交不了Oozie任务或两个小时才提交成功 - MapReduce服务 MRS

实时OLAP数据查询：基于Unique表的单表检索查询和聚合查询 - MapReduce服务 MRS

产品优势 - MapReduce服务 MRS

网络连接超时导致FetchFailedException - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

Hudi表分区设计规范 - MapReduce服务 MRS

Hive开源增强特性 - MapReduce服务 MRS

配置Hive列加密功能 - MapReduce服务 MRS

Kudu应用开发简介 - MapReduce服务 MRS

Flink SQL逻辑开发建议 - MapReduce服务 MRS

Doris建表规范 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线