搜索_华为云

Hive Group By语句优化 - MapReduce服务 MRS

Reduce做聚合操作，并输出结果，这样的处理会使相同的Group By Key可能被分发到不同的Reduce中，从而达到负载均衡，第二个Job再根据预处理的结果按照Group By Key分发到Reduce中完成最终的聚合操作。 Count Distinct聚合问题当使用聚合函数count

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
产品优势 - MapReduce服务 MRS
产品优势 - MapReduce服务 MRS

员获取日志进行分析。 MRS具有开放的生态，支持无缝对接周边服务，快速构建统一大数据平台。以全栈大数据MRS服务为基础，企业可以一键式构筑数据接入、数据存储、数据分析和价值挖掘的统一大数据平台，并且与数据治理中心DataArts Studio及数据可视化等服务对接，为用户轻松解

 帮助中心 > MapReduce服务 MRS > 产品介绍
数据迁移到MRS前信息收集 - MapReduce服务 MRS

以能够更好的进行迁移决策。业务信息调研大数据平台及业务的架构图。大数据平台和业务的数据流图（包括峰值和均值流量等）。识别平台数据接入源、大数据平台数据流入方式（实时数据上报、批量数据抽取）、分析平台数据流向。数据在平台内各个组件间的流向，比如使用什么组件采集数据，采集

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
Impala - MapReduce服务 MRS
Impala - MapReduce服务 MRS

SQL查询。除了使用相同的统一存储平台之外，Impala还使用与Apache Hive相同的元数据，SQL语法（Hive SQL），ODBC驱动程序和用户界面（Hue中的Impala查询UI）。这为实时或面向批处理的查询提供了一个熟悉且统一的平台。作为查询大数据的工具的补充，Im

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
Flink作业引擎概述 - MapReduce服务 MRS

Flink作业引擎概述 Flink WebUI提供基于Web的可视化开发平台，用户只需要编写SQL即可开发作业，极大降低作业开发门槛。同时通过作业平台能力开放，支持业务人员自行编写SQL开发作业来快速应对需求，大大减少Flink作业开发工作量。 Flink WebUI功能仅支持MRS

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink
Flink作业引擎概述 - MapReduce服务 MRS

Flink作业引擎概述 Flink WebUI提供基于Web的可视化开发平台，用户只需要编写SQL即可开发作业，极大降低作业开发门槛。同时通过作业平台能力开放，支持业务人员自行编写SQL开发作业来快速应对需求，大大减少Flink作业开发工作量。 Flink WebUI特点 Flink

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink
第三方jar包跨平台（x86、TaiShan）支持 - MapReduce服务 MRS

第三方jar包跨平台（x86、TaiShan）支持问题用户自己写的jar包(比如自定义udf包)区分x86和TaiShan版本，如何让spark2x支持其正常运行。回答第三方jar包（例如自定义udf）区分x86和TaiShan版本时，混合使用方案：进入到服务端spark2x

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
第三方jar包跨平台（x86、TaiShan）支持 - MapReduce服务 MRS

第三方jar包跨平台（x86、TaiShan）支持问题用户自己写的jar包（例如自定义udf包）区分x86和TaiShan版本，如何让Spark2x支持其正常运行。回答第三方jar包（例如自定义udf）区分x86和TaiShan版本时，混合使用方案：进入到服务端Spark2x

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
第三方jar包跨平台（x86、TaiShan）支持 - MapReduce服务 MRS

第三方jar包跨平台（x86、TaiShan）支持问题用户自己写的jar包(比如自定义udf包)区分x86和TaiShan版本，如何让spark2x支持其正常运行。回答第三方jar包（例如自定义udf）区分x86和TaiShan版本时，混合使用方案：进入到服务端spark2x

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
配置通过ELB访问Doris集群 - MapReduce服务 MRS

时，无法对外提供服务。因此，MRS服务提供了基于弹性负载均衡ELB的部署架构如图1所示。基于ELB的部署架构，可以将用户访问流量自动均匀分发到多台后端节点，扩展系统对外的服务能力，实现更高水平的应用容错。当其中一台Doris后端节点发生故障时，ELB通过故障转移方式正常对外提供服务。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris企业级能力增强 > 配置Doris高可用功能
第三方jar包跨平台（x86、TaiShan）支持 - MapReduce服务 MRS

第三方jar包跨平台（x86、TaiShan）支持问题用户自己写的jar包（例如自定义udf包）区分x86和TaiShan版本，如何让Spark2x支持其正常运行。回答第三方jar包（例如自定义udf）区分x86和TaiShan版本时，混合使用方案：进入到服务端Spark2x

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
配置Spark Native引擎 - MapReduce服务 MRS

dist.files 此参数用于将libch.so和libjsig.so分发到所有节点上，以便所有节点上的executors使用spark.executorEnv.LD_PRELOAD参数提前加载。 x86平台上参数值设置为：{客户端安装目录}/Spark/spark/native/libch

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
提交Spark任务到新增Task节点 - MapReduce服务 MRS

节点。方案架构租户是MRS大数据平台的核心概念，使传统的以用户为核心的大数据平台向以多租户为核心的大数据平台转变，更好的适应现代企业多租户应用环境，如图1所示。图1 以用户为核心的平台和以多租户为核心的平台对于以用户为核心的大数据平台，用户直接访问并使用全部的资源和服务。

帮助中心 > MapReduce服务 MRS > 最佳实践 > MRS集群管理
通过Flink作业处理OBS数据 - MapReduce服务 MRS

本文将向您介绍如何在MRS集群中运行Flink作业来处理OBS中存储的数据。方案架构 Flink是一个批处理和流处理结合的统一计算框架，其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理，是业界最顶级的开源流处理引擎。 Flink最适合的应用场景是低时延的数据处理（Data

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
MRS组件应用开发简介 - MapReduce服务 MRS

MRS组件应用开发简介 MRS是企业级大数据存储、查询、分析的统一平台，能够帮助企业快速构建海量数据信息处理系统，通过对海量信息数据的分析挖掘，发现全新价值点和企业商机。 MRS提供了各组件的常见业务场景样例程序，开发者用户可基于样例工程进行相关数据应用的开发与编译，样例工程依赖

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x）
配置Spark Core广播变量 - MapReduce服务 MRS

配置Spark Core广播变量操作场景 Broadcast（广播）可以把数据集合分发到每一个节点上，Spark任务在执行过程中要使用这个数据集合时，就会在本地查找Broadcast过来的数据集合。如果不使用Broadcast，每次任务需要数据集合时，都会把数据序列化到任务里面，不但耗时，还使任务变得很大。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
PyFlink样例程序开发思路 - MapReduce服务 MRS

PyFlink样例程序开发思路假定业务平台需要提交Flink任务到MRS集群，业务平台主要使用的语言是Python，提供Python读写Kafka作业和Python提交SQL作业的样例。本场景适用于MRS 3.3.0及以后的集群版本。父主题： PyFlink样例程序

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > PyFlink样例程序
PyFlink样例程序开发思路 - MapReduce服务 MRS

PyFlink样例程序开发思路假定业务平台需要提交Flink任务到MRS集群，业务平台主要使用的语言是Python，提供Python读写Kafka作业和Python提交SQL作业的样例。本场景适用于MRS 3.3.0及以后的集群版本。父主题： PyFlink样例程序

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 开发Flink应用 > PyFlink样例程序
使用广播变量 - MapReduce服务 MRS

使用广播变量操作场景 Broadcast（广播）可以把数据集合分发到每一个节点上，Spark任务在执行过程中要使用这个数据集合时，就会在本地查找Broadcast过来的数据集合。如果不使用Broadcast，每次任务需要数据集合时，都会把数据序列化到任务里面，不但耗时，还使任务变得很大。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
配置Spark Core广播变量 - MapReduce服务 MRS

配置Spark Core广播变量操作场景 Broadcast（广播）可以把数据集合分发到每一个节点上，Spark任务在执行过程中要使用这个数据集合时，就会在本地查找Broadcast过来的数据集合。如果不使用Broadcast，每次任务需要数据集合时，都会把数据序列化到任务里面，不但耗时，还使任务变得很大。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优

总条数： 454

上一页
1
2
3
4
5
...
23
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hive Group By语句优化 - MapReduce服务 MRS

产品优势 - MapReduce服务 MRS

数据迁移到MRS前信息收集 - MapReduce服务 MRS

Impala - MapReduce服务 MRS

Flink作业引擎概述 - MapReduce服务 MRS

Flink作业引擎概述 - MapReduce服务 MRS

第三方jar包跨平台（x86、TaiShan）支持 - MapReduce服务 MRS

第三方jar包跨平台（x86、TaiShan）支持 - MapReduce服务 MRS

第三方jar包跨平台（x86、TaiShan）支持 - MapReduce服务 MRS

配置通过ELB访问Doris集群 - MapReduce服务 MRS

第三方jar包跨平台（x86、TaiShan）支持 - MapReduce服务 MRS

配置Spark Native引擎 - MapReduce服务 MRS

提交Spark任务到新增Task节点 - MapReduce服务 MRS

通过Flink作业处理OBS数据 - MapReduce服务 MRS

MRS组件应用开发简介 - MapReduce服务 MRS

配置Spark Core广播变量 - MapReduce服务 MRS

PyFlink样例程序开发思路 - MapReduce服务 MRS

PyFlink样例程序开发思路 - MapReduce服务 MRS

使用广播变量 - MapReduce服务 MRS

配置Spark Core广播变量 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线