搜索_华为云

提升HBase实时读数据效率 - MapReduce服务 MRS

配置数据的压缩算法，这里的压缩是HFile中block级别的压缩。对于可以压缩的数据，配置压缩算法可以有效减少磁盘的IO，从而达到提高性能的目的。说明：并非所有数据都可以进行有效压缩。例如一张图片的数据，因为图片一般已经是压缩后的数据，所以压缩效果有限。常用的压缩算法是SNAPP

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase性能调优
Spark应用开发简介 - MapReduce服务 MRS

Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative Computation）：支持迭代计算，有效应对多步的数据处理逻辑。数据挖掘（Data Mining）：在海量数据基础上进行复杂的挖掘分析，可支持各种数据挖掘和机器学习算法。流式处理（Streaming

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
MRS集群加固策略说明 - MapReduce服务 MRS

应用程序目录下针对工程禁用自动部署功能，只部署了web、cas和client三个工程。禁用部分未使用的HTTP方法，防止被他人利用攻击。更改Tomcat服务器默认shutdown端口号和命令，避免被黑客捕获利用关闭服务器，降低对服务器和应用的威胁。出于安全考虑，更改“maxHttpHe

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群安全配置 > MRS集群安全加固
MapReduce任务commit阶段优化 - MapReduce服务 MRS

fileoutputcommitter.algorithm.version 用于指定Job的最终输出文件提交的算法版本，取值为“1”或“2”。说明：版本2为建议的优化算法版本。该算法通过让任务直接将每个task的输出结果提交到最终的结果输出目录，从而减少大作业的输出提交时间。 2 父主题：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce > MapReduce性能调优
ClickHouse表引擎适用场景说明 - MapReduce服务 MRS

CollapsingMergeTree会异步地删除（折叠）除了特定列Sign1和-1值以外的所有字段的值重复的行。 VersionedCollapsingMergeTree 是CollapsingMergeTree的升级，使用不同的collapsing算法，该算法允许使用多个线程以任何顺序插入数据。 Replicated*MergeTree

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse数据库设计
什么是MapReduce服务 - MapReduce服务 MRS

如果您是首次使用MRS的用户，建议您学习并了解如下信息：基础知识了解通过MRS组件介绍和产品功能章节的内容，了解MRS相关的基础知识，包含MRS各组件的基本原理和增强特性介绍，以及MRS服务的特有概念和功能的详细介绍。入门使用您可以参考《快速入门》学习并上手使用MRS。《快速入门

 帮助中心 > MapReduce服务 MRS > 产品介绍
配置Spark多租户模式 - MapReduce服务 MRS

表1 参数说明参数说明默认值 spark.proxyserver.hash.enabled 是否使用Hash算法连接ProxyServer。 true为使用Hash算法，使用多租户模式时，该参数需配置为true。 false为使用随机连接，多主实例模式，配置为false。 true

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强 > 配置Spark HA增强高可用
MapReduce任务commit阶段优化 - MapReduce服务 MRS

fileoutputcommitter.algorithm.version 用于指定Job的最终输出文件提交的算法版本，取值为“1”或“2”。说明：版本2为建议的优化算法版本。该算法通过让任务直接将每个task的输出结果提交到最终的结果输出目录，从而减少大作业的输出提交时间。 2 父主题：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce性能调优
批量写入Hudi表 - MapReduce服务 MRS

Hudi提供多种写入方式，具体见hoodie.datasource.write.operation配置项，这里主要介绍UPSERT、INSERT和BULK_INSERT。 INSERT（插入）：该操作流程和UPSERT基本一致，但是不需要通过索引去查询具体更新的文件分区，因此它的速度比UPSERT快。当数据源不包

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi写操作
配置Hadoop数据传输加密 - MapReduce服务 MRS

call）通道，HMaster和RegionServer间的RPC通道。设置为“privacy”表示通道加密，认证、完整性和隐私性功能都全部开启，设置为“integrity”表示不加密，只开启认证和完整性功能，设置为“authentication”表示不加密，仅要求认证报文，不要求完整性和隐私性。说明：

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群安全配置 > MRS集群安全加固
批量写入Hudi表 - MapReduce服务 MRS

Hudi提供多种写入方式，具体见hoodie.datasource.write.operation配置项，这里主要介绍UPSERT、INSERT和BULK_INSERT。 INSERT（插入）：该操作流程和UPSERT基本一致，但是不需要通过索引去查询具体更新的文件分区，因此它的速度比UPSERT快。当数据源不包

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi写操作
Spark基本原理 - MapReduce服务 MRS
Spark基本原理 - MapReduce服务 MRS

而，由于语义仅被处理一次，重新处理的结果和没有失败处理的结果是一致的。因此，Direct API消除了需要使用WAL和Receivers的情况，且确保每个Kafka记录仅被接收一次，这种接收更加高效。使得Spark Streaming和Kafka可以很好地整合在一起。总体来说，

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
MRS安全增强 - MapReduce服务 MRS
MRS安全增强 - MapReduce服务 MRS

HBase实现列族级加密，在创建表时指定采用的加密算法，即可实现对敏感数据的加密存储。从数据的存储加密、访问控制来保障用户数据的保密性。 HBase支持将业务数据存储到HDFS前进行压缩处理，且用户可以配置AES和SMS4算法加密存储。各组件支持本地数据目录访问权限设置，无权限用户禁止访问数据。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能
概述 - MapReduce服务 MRS
概述 - MapReduce服务 MRS

取模转换：对已有字段取模，生成新字段。剪切字符串：通过指定起始位置，截取已有字符串类型的字段，生成新字段。 EL操作转换：指定算法，对字段值进行运算，目前支持的算法有：md5sum、sha1sum、sha256sum和sha512sum等。字符串大小写转换：对已有的字符串类型字段，切换大小写，生成新字段。字

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 算子帮助
Loader算子说明 - MapReduce服务 MRS

取模转换：对已有字段取模，生成新字段。剪切字符串：通过指定起始位置，截取已有字符串类型的字段，生成新字段。 EL操作转换：指定算法，对字段值进行运算，目前支持的算法有：md5sum、sha1sum、sha256sum和sha512sum等。字符串大小写转换：对已有的字符串类型字段，切换大小写，生成新字段。字

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助
配置Spark多租户模式 - MapReduce服务 MRS

表1 参数说明参数说明默认值 spark.proxyserver.hash.enabled 是否使用Hash算法连接ProxyServer。 true为使用Hash算法，使用多租户模式时，该参数需配置为true。 false为使用随机连接，多主实例模式，配置为false。 true

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强 > 配置Spark HA增强高可用
ClickHouse SQL调优 - MapReduce服务 MRS

q）替代精确去重。 ClickHouse提供多种近似去重算法，通过count_distinct_implementation配置，支持将countDistinct语法转成所配置的近似算法。查询性能有数量级的提升。近似算法的误差一般在1%以内。在数据准确度要求不高，比如趋势分析等，建议使用近似去重提升用户体验。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse数据库调优
组件配置类 - MapReduce服务 MRS
组件配置类 - MapReduce服务 MRS

MRS是否支持同时运行多个Flume任务？如何修改FlumeClient的日志为标准输出日志？ Hadoop组件jar包位置和环境变量的位置在哪里？如何查看HBase日志？ HBase表如何设置和修改数据保留期？如何修改HDFS的副本数？如何修改HDFS主备倒换类？ DynamoDB的number在Hive表中用什么类型比较好？

帮助中心 > MapReduce服务 MRS > 常见问题
配置多主实例与多租户模式切换 - MapReduce服务 MRS

irscheduler.xml spark.proxyserver.hash.enabled 是否使用Hash算法连接ProxyServer。 true为使用Hash算法，使用多租户模式时，该参数需配置为true。 false为使用随机连接，多主实例模式，配置为false。 true

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强 > 配置Spark HA增强高可用
CarbonData调优思路 - MapReduce服务 MRS

dfs.datanode.sync.behind.writes true 压缩调优 CarbonData结合少数轻量级压缩算法和重量级压缩算法来压缩数据。虽然这些算法可处理任何类型的数据，但如果数据经过排序，相似值在一起出现时，就会获得更好的压缩率。 CarbonData数据加载过程

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData性能调优

总条数： 282

上一页
1
2
3
4
5
...
15
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

提升HBase实时读数据效率 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

MRS集群加固策略说明 - MapReduce服务 MRS

MapReduce任务commit阶段优化 - MapReduce服务 MRS

ClickHouse表引擎适用场景说明 - MapReduce服务 MRS

什么是MapReduce服务 - MapReduce服务 MRS

配置Spark多租户模式 - MapReduce服务 MRS

MapReduce任务commit阶段优化 - MapReduce服务 MRS

批量写入Hudi表 - MapReduce服务 MRS

配置Hadoop数据传输加密 - MapReduce服务 MRS

批量写入Hudi表 - MapReduce服务 MRS

Spark基本原理 - MapReduce服务 MRS

MRS安全增强 - MapReduce服务 MRS

概述 - MapReduce服务 MRS

Loader算子说明 - MapReduce服务 MRS

配置Spark多租户模式 - MapReduce服务 MRS

ClickHouse SQL调优 - MapReduce服务 MRS

组件配置类 - MapReduce服务 MRS

配置多主实例与多租户模式切换 - MapReduce服务 MRS

CarbonData调优思路 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线