搜索_华为云

使用HetuEngine跨源跨域访问数据源 - MapReduce服务 MRS

HetuEngine跨源功能简介出于管理和信息收集的需要，企业内部会存储海量数据，包括数目众多的各种数据库、数据仓库等，此时会面临数据源种类繁多、数据集结构化混合、相关数据存放分散等困境，导致跨源查询开发成本高，跨源复杂查询耗时长。 HetuEngine提供了统一标准SQL实现跨源协同分析，简化跨源分析操作。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
Storm应用开发简介 - MapReduce服务 MRS

一项简单特定的任务。Storm的目标是提供对大数据流的实时处理，可以可靠地处理无限的数据流。 Storm有很多适用的场景：实时分析、在线机器学习、持续计算和分布式ETL等，易扩展、支持容错，可确保数据得到处理，易于构建和操控。 Storm有如下几个特点：适用场景广泛易扩展，可伸缩性高

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（安全模式） > Storm应用开发概述
Storm应用开发简介 - MapReduce服务 MRS

一项简单特定的任务。Storm的目标是提供对大数据流的实时处理，可以可靠地处理无限的数据流。 Storm有很多适用的场景：实时分析、在线机器学习、持续计算和分布式ETL等，易扩展、支持容错，可确保数据得到处理，易于构建和操控。 Storm有如下几个特点：适用场景广泛易扩展，可伸缩性高

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发概述
Spark Python API接口介绍 - MapReduce服务 MRS

Distributed Dataset）：用于在Spark应用程序中定义RDD的类，该类提供数据集的操作方法，如map，filter。 pyspark.Broadcast：广播变量类。广播变量允许保留一个只读的变量，缓存在每一台机器上，而非每个任务保存一份复制。 pyspark.StorageLevel：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
作业管理 - MapReduce服务 MRS
作业管理 - MapReduce服务 MRS

Studio，用户可以先在线开发调试MRS HQL/SparkSQL脚本、拖拽式地开发MRS作业，完成MRS与其他20多种异构数据源之间的数据迁移和数据集成；通过强大的作业调度与灵活的监控告警，轻松管理数据作业运维。目前MRS集群支持在线创建如下几种类型的作业： MapReduce：提供快

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能
集群运维 - MapReduce服务 MRS
集群运维 - MapReduce服务 MRS

集群运维告警管理 MRS可以实时监控大数据集群，通过告警和事件可以识别系统健康状态。同时MRS也支持用户自定义配置监控与告警阈值用于关注各指标的健康情况，当监控数据达到告警阈值，系统将会触发一条告警信息。 MRS还可以与华为云消息通知服务(SMN)的消息服务系统对接，将告警信息

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能
添加HetuEngine数据源 - MapReduce服务 MRS

添加HetuEngine数据源使用HetuEngine跨源跨域访问数据源添加Hive数据源添加Hudi数据源添加ClickHouse数据源添加GAUSSDB数据源添加HBase数据源添加跨集群HetuEngine数据源添加IoTDB数据源添加MySQL数据源添加Oracle数据源

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine
Spark Python API接口介绍 - MapReduce服务 MRS

Distributed Dataset）：用于在Spark应用程序中定义RDD的类，该类提供数据集的操作方法，如map，filter。 pyspark.Broadcast：广播变量类。广播变量允许保留一个只读的变量，缓存在每一台机器上，而非每个任务保存一份复制。 pyspark.StorageLevel：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Python API接口介绍 - MapReduce服务 MRS

Distributed Dataset）：用于在Spark应用程序中定义RDD的类，该类提供数据集的操作方法，如map，filter。 pyspark.Broadcast：广播变量类。广播变量允许保留一个只读的变量，缓存在每一台机器上，而非每个任务保存一份复制。 pyspark.StorageLevel：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark应用开发简介 - MapReduce服务 MRS

用proxy user参数去提交任务。基本概念 RDD 即弹性分布数据集（Resilient Distributed Dataset），是Spark的核心概念。指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式）
Spark Python API接口介绍 - MapReduce服务 MRS

Distributed Dataset）：用于在Spark应用程序中定义RDD的类，该类提供数据集的操作方法，如map，filter。 pyspark.Broadcast：广播变量类。广播变量允许保留一个只读的变量，缓存在每一台机器上，而非每个任务保存一份复制。 pyspark.StorageLevel：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Python接口介绍 - MapReduce服务 MRS

Distributed Dataset）：用于在Spark应用程序中定义RDD的类，该类提供数据集的操作方法，如map，filter。 pyspark.Broadcast：广播变量类。广播变量允许保留一个只读的变量，缓存在每一台机器上，而非每个任务保存一份拷贝。 pyspark.StorageLevel：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
Spark应用开发简介 - MapReduce服务 MRS

用proxy user参数去提交任务。基本概念 RDD 即弹性分布数据集（Resilient Distributed Dataset），是Spark的核心概念。指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式）
Spark开源增强特性 - MapReduce服务 MRS

跨源复杂数据的SQL查询优化出于管理和信息收集的需要，企业内部会存储海量数据，包括数目众多的各种数据库、数据仓库等，此时会面临以下困境：数据源种类繁多，数据集结构化混合，相关数据存放分散等，这就导致了跨源复杂查询因传输效率低，耗时长。当前开源Spark在跨源查询时，只能对简单的filter进行

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
ALM-50223 BE所需最大内存大于机器剩余可用内存 - MapReduce服务 MRS

ALM-50223 BE所需最大内存大于机器剩余可用内存告警解释系统每30秒周期性检查BE所需最大内存是否大于机器剩余可用内存，当检查到该值不等于1（1表示小于等于，0表示大于）时产生该告警。 BE所需最大内存小于等于机器剩余可用内存时，告警清除。告警属性告警ID 告警级别

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
数据分析 - MapReduce服务 MRS
数据分析 - MapReduce服务 MRS

数据分析使用Spark2x实现车联网车主驾驶行为分析使用Hive加载HDFS数据并分析图书评分情况使用Hive加载OBS数据并分析企业雇员信息通过Flink作业处理OBS数据通过Spark Streaming作业消费Kafka数据通过Flume采集指定目录日志系统文件至HDFS

帮助中心 > MapReduce服务 MRS > 最佳实践
升级Master节点规格 - MapReduce服务 MRS

升级Master节点规格 MRS大数据集群采用Manager实现集群的管理，而管理集群的相关服务，如HDFS存储系统的NameNode，Yarn资源管理的ResourceManager，以及MRS的Manager管理服务都部署在集群的Master节点上。随着新业务的上线，集群规

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能 > 集群管理
Spark应用开发简介 - MapReduce服务 MRS

用proxy user参数去提交任务。基本概念 RDD 即弹性分布数据集（Resilient Distributed Dataset），是Spark的核心概念。指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式）
CREATE DATABASE创建数据库 - MapReduce服务 MRS

CREATE DATABASE创建数据库本章节主要介绍ClickHouse创建数据库的SQL基本语法和使用说明。基本语法 CREATE DATABASE [IF NOT EXISTS] database_name [ON CLUSTER ClickHouse集群名] ON CLUSTER

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse常用SQL语法
Spark跨源复杂数据的SQL查询优化 - MapReduce服务 MRS

Spark跨源复杂数据的SQL查询优化场景描述出于管理和信息收集的需要，企业内部会存储海量数据，包括数目众多的各种数据库、数据仓库等，此时会面临以下困境：数据源种类繁多，数据集结构化混合，相关数据存放分散等，这就导致了跨源复杂查询因传输效率低，耗时长。当前开源Spark在跨源查询时，只能对简单的filter进行

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x

总条数： 4433

上一页
1
...
4
5
6
...
222
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用HetuEngine跨源跨域访问数据源 - MapReduce服务 MRS

Storm应用开发简介 - MapReduce服务 MRS

Storm应用开发简介 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

作业管理 - MapReduce服务 MRS

集群运维 - MapReduce服务 MRS

添加HetuEngine数据源 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python接口介绍 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

Spark开源增强特性 - MapReduce服务 MRS

ALM-50223 BE所需最大内存大于机器剩余可用内存 - MapReduce服务 MRS

数据分析 - MapReduce服务 MRS

升级Master节点规格 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

CREATE DATABASE创建数据库 - MapReduce服务 MRS

Spark跨源复杂数据的SQL查询优化 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线