搜索_华为云

创建高查询性能的CarbonData表 - MapReduce服务 MRS

创建高查询性能的CarbonData表操作场景本章节根据超过50个测试用例总结得出建议，帮助用户创建拥有更高查询性能的CarbonData表。表1 CarbonData表中的列 Column name Data type Cardinality Attribution msname

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData性能调优
配置SparkSQL的分块个数 - MapReduce服务 MRS

length exceeds 2147483647: 2717729270 - discarded 例如，SparkSQL运行TPCDS 500G的测试时，使用默认配置出现错误。所以当数据量较大时需要适当的调整该参数。配置参数参数入口：在Manager系统中，选择“集群 > 服务 >

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
Kudu应用程序开发思路 - MapReduce服务 MRS

开发思路作为存储引擎，通常情况下会和计算引擎一起协同工作：首先在计算引擎上（比如Impala）用SQL语句创建表对象；然后通过Kudu的驱动往这个表里写数据；于此同时可以在计算引擎上直接查询这个表里的数据。在本开发程序示例中，为了不引入额外的计算引擎，将以Kudu为主，全部通过Java

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kudu开发指南（普通模式） > 开发Kudu应用
作业管理 - MapReduce服务 MRS
作业管理 - MapReduce服务 MRS

Spark：基于内存进行计算的分布式计算框架，MRS支持提交SparkSubmit、Spark Script和Spark SQL作业。 SparkSubmit：提交Spark Jar和Spark Python程序，运行Spark Application计算和处理用户数据。 Spa

帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能
快速开发Spark应用 - MapReduce服务 MRS

Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言的应用开发。通常适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative Computation）：支持迭代计算，有效应对多步的数据处理逻辑。数据挖掘（Data

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
产品优势 - MapReduce服务 MRS
产品优势 - MapReduce服务 MRS

针对传统存算一体大数据架构中扩容困难、资源利用率低等问题，MRS采用计算存储分离架构，存储基于公有云对象存储实现11个9的高可靠，无限容量，支撑企业数据量持续增长；计算资源支持0~N弹性扩缩，百节点快速发放。存算分离后，计算节点可实现真正的极致弹性伸缩；数据存储部分基于OBS的跨AZ等

 帮助中心 > MapReduce服务 MRS > 产品介绍
配置SparkSQL的分块个数 - MapReduce服务 MRS

length exceeds 2147483647: 2717729270 - discarded 例如，SparkSQL运行TPCDS 500G的测试时，使用默认配置出现错误。所以当数据量较大时需要适当的调整该参数。配置参数参数入口：在Manager系统中，选择“集群 > 待操作集群的名称

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
如何使用IDEA远程调试业务 - MapReduce服务 MRS

address=5055,suspend=n,server=y，保存配置后重启相关实例。调试Storm程序需要先修改指定的服务端参数，并在重启服务后生效，建议在测试环境上进行调测。提交拓扑后，在Storm UI上进入到Topology界面，再单击进入要调试组件界面。图1 进入拓扑的Component界面

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发常见问题
Hive常用配置参数 - MapReduce服务 MRS

Hive常用配置参数 Hive是建立在Hadoop上的数据仓库框架，提供大数据平台批处理计算能力，能够对结构化/半结构化数据进行批量分析汇总完成数据计算。本章节主要介绍Hive常用参数。操作步骤登录FusionInsight Manager，选择“集群 > 服务 > Hive

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive运维管理
Spark应用开发简介 - MapReduce服务 MRS

Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative Computation）：支持迭代计算，有效应对多步的数据处理逻辑。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式）
Spark应用开发简介 - MapReduce服务 MRS

Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative Computation）：支持迭代计算，有效应对多步的数据处理逻辑。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式）
Spark Streaming任务一直阻塞 - MapReduce服务 MRS

ark Streaming都没有触发数据计算的任务（Spark Streaming默认有两个尝试运行的Job，就是图中两个）图2 Completed Jobs 回答经过定位发现，导致这个问题的原因是：Spark Streaming的计算核数少于Receiver的个数，导致部分

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Streaming
使用永洪BI访问MRS HetuEngine - MapReduce服务 MRS

Ranger权限，可参考添加HetuEngine的Ranger访问权限策略。创建HetuEngine计算实例。创建计算实例并确保运行正常，可参考创建HetuEngine计算实例。步骤二：获取JDBC jar包登录FusionInsight Manager。选择“集群 >

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
使用MRS Hive表对接OBS文件系统 - MapReduce服务 MRS

使用MRS集群仅作数据计算处理的存算分离场景。用户通过IAM服务的“委托”机制进行简单配置，即可实现OBS的访问。方案架构 Hive是建立在Hadoop上的数据仓库框架，提供大数据平台批处理计算能力，能够对结构化/半结构化数据进行批量分析汇总完成数据计算。提供类似SQL的Hive

帮助中心 > MapReduce服务 MRS > 最佳实践 > 周边云服务对接
MemArtsCC基本原理 - MapReduce服务 MRS

MemArtsCC基本原理 MemArtsCC是一款面向存算分离架构的分布式计算侧缓存系统，采用极轻量化的架构设计，部署在计算侧的集群中，通过智能预取远端对象存储上的数据提供高速缓存能力，从而来加速计算任务执行。 MemArtsCC在存储层面将远端对象存储(OBS)上的对象进行切

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MemArtsCC
Spark Streaming任务一直阻塞 - MapReduce服务 MRS

ark Streaming都没有触发数据计算的任务（Spark Streaming默认有两个尝试运行的Job，就是图中两个）图2 Completed Jobs 回答经过定位发现，导致这个问题的原因是：Spark Streaming的计算核数少于Receiver的个数，导致部分

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Streaming
Spark与其他组件的关系 - MapReduce服务 MRS

Spark与其他组件的关系 Spark和HDFS的关系通常，Spark中计算的数据可以来自多个数据源，如Local File、HDFS等。最常用的是HDFS，用户可以一次读取大规模的数据进行并行计算。在计算完成后，也可以将数据存储到HDFS。分解来看，Spark分成控制端(Dr

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
Alluxio - MapReduce服务 MRS
Alluxio - MapReduce服务 MRS

luxio位于计算和存储之间，为包括Apache Spark、Presto、Mapreduce和Apache Hive的计算框架提供了数据抽象层，使上层的计算应用可以通过统一的客户端API和全局命名空间访问包括HDFS和OBS在内的持久化存储系统，从而实现了对计算和存储的分离。图1

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
Spark2x与其他组件的关系 - MapReduce服务 MRS

Spark2x与其他组件的关系 Spark和HDFS的关系通常，Spark中计算的数据可以来自多个数据源，如Local File、HDFS等。最常用的是HDFS，用户可以一次读取大规模的数据进行并行计算。在计算完成后，也可以将数据存储到HDFS。分解来看，Spark分成控制端(Dr

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x
HetuEngine物化视图概述 - MapReduce服务 MRS

将高频访问的SQL查询和有高耗时的算子（连接，聚合等算子）的SQL通过建立物化视图进行预计算，然后在查询的SQL中将能匹配到物化视图的查询或者子查询转换为物化视图，避免了数据的重复计算，这种情况下往往能较大地提高查询的响应效率。物化视图通常基于对数据表进行聚合和连接的查询结果创建。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 配置HetuEngine物化视图

总条数： 806

上一页
1
2
3
4
5
...
41
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建高查询性能的CarbonData表 - MapReduce服务 MRS

配置SparkSQL的分块个数 - MapReduce服务 MRS

Kudu应用程序开发思路 - MapReduce服务 MRS

作业管理 - MapReduce服务 MRS

快速开发Spark应用 - MapReduce服务 MRS

产品优势 - MapReduce服务 MRS

配置SparkSQL的分块个数 - MapReduce服务 MRS

如何使用IDEA远程调试业务 - MapReduce服务 MRS

Hive常用配置参数 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

Spark Streaming任务一直阻塞 - MapReduce服务 MRS

使用永洪BI访问MRS HetuEngine - MapReduce服务 MRS

使用MRS Hive表对接OBS文件系统 - MapReduce服务 MRS

MemArtsCC基本原理 - MapReduce服务 MRS

Spark Streaming任务一直阻塞 - MapReduce服务 MRS

Spark与其他组件的关系 - MapReduce服务 MRS

Alluxio - MapReduce服务 MRS

Spark2x与其他组件的关系 - MapReduce服务 MRS

HetuEngine物化视图概述 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线