DLV是什么

2020-09-24 09:59:29

数据可视化 (Data Lake Visualization,简称DLV)是一站式数据可视化开发平台,适配云上云下多种数据源,提供丰富多样的2D、3D可视化组件,采用拖拽式自由布局,旨在帮助您快速定制和应用属于您自己的数据大屏。

数据存储在OBS和HDFS有什么区别

2020-09-24 09:54:42

HDFS是Hadoop分布式文件系统(Hadoop Distributed File System),OBS( Object Storage Service )即 对象存储服务 ,是一个基于对象的海量存储服务,为客户提供海量、安全、高可靠、低成本的数据存储能力。

MRS如何保证数据和业务运行安全

2020-09-24 09:52:34

MRS作为一个海量 数据管理 和分析平台,具备高安全性。主要从以下几个方面保障数据和业务运行安全

如何使用MRS

2020-09-24 09:50:10

MRS是一个在华为云上部署和管理Hadoop系统的服务,一键即可部署Hadoop集群。MRS提供租户完全可控的企业级 大数据 集群 云服务 ,轻松运行Hadoop、Spark、HBase、Kafka、Storm等大数据组件。

MRS可以做什么

2020-09-24 09:48:11

基于 开源 软件Hadoop进行功能增强、Spark内存计算引擎、HBase分布式存储 数据库 以及Hive 数据仓库 框架,提供企业级大数据存储、查询和分析的统一平台,帮助企业快速构建海量数据信息处理系统

ZooKeeper是什么

2020-09-24 09:45:48

ZooKeeper是一个分布式、高可用性的协调服务。在大数据产品中主要提供两个功能

YARN是什么

2020-09-24 09:43:16

YARN是将JobTracker的两个主要功能(资源管理和作业调度/监控)分离,主要方法是创建一个全局的ResourceManager(RM)和若干个针对应用程序的ApplicationMaster(AM)。

什么是Tez

2020-09-23 19:17:34

Tez是Apache最新的支持DAG作业的开源计算框架,它可以将多个有依赖的作业转换为一个作业从而大幅提升DAG作业的性能。如果 Hive和Pig这样的项目使用Tez而不是MapReduce作为其数据处理的骨干,那么将会显著提升它们的响应时间,Tez构建在YARN之上,能够不需要做任何改动地运行MR任务。

Storm是什么

2020-09-23 19:16:16

Apache Storm是一个分布式、可靠、容错的实时流式数据处理的系统。在Storm中,先要设计一个用于实时计算的图状结构,我们称之为拓扑(topology)。这个拓扑将会被提交给集群,由集群中的主控节点(master node)分发代码,将任务分配给工作节点(worker node)执行。

Spark是什么

2020-09-23 19:13:30

Spark是一个开源的,并行数据处理框架,能够帮助用户简单的开发快速,统一的大数据应用,对数据进行,协处理,流式处理,交互式分析等等。

Ranger是什么

2020-09-23 19:04:29

Apache Ranger提供一个集中式安全管理框架,并解决授权和审计。它可以对整个Hadoop生态中如HDFS、Hive、HBase、Kafka、Storm等进行细粒度的数据访问控制。用户可以利用Ranger提供的前端WebUI控制台通过配置相关策略来控制用户对这些组件的访问权限 。

什么是Presto

2020-09-23 19:03:03

Presto是一个开源的用户交互式分析查询的SQL查询引擎,用于针对各种大小的数据源进行交互式分析查询。其主要应用于海量结构化数据/半结构化数据分析、海量多维数据聚合/报表、ETL、Ad-Hoc查询等场景。

MapReduce

2020-09-23 16:42:15

MapReduce是Hadoop的核心,是Google提出的一个软件架构,用于大规模 数据集 (大于1TB)的并行运算。概念“Map(映射)”和“Reduce(化简)”,及他们的主要思想,都是从函数式编程语言借来的,还有从矢量编程语言借来的特性。

Loader是什么

2020-09-23 16:39:53

Loader是在开源Sqoop组件的基础上进行了一些扩展,实现MRS与关系型数据库、文件系统之间交换“数据”、“文件”,同时也可以将数据从关系型数据库或者文件服务器导入到MRS的HDFS/HBase中,或者反过来从HDFS/HBase导出到关系型数据库或者文件服务器中。

Kudu是什么

2020-09-23 16:22:26

Kudu是专为Apache Hadoop平台开发的列式存储管理器,具有Hadoop生态系统应用程序的共同技术特性:在通用的商用硬件上运行,可水平扩展,提供高可用性。

共7897条