搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

浙江移动携手华为FusionInsight打造0业务中断的融合大数据平台

华为FusionInsight融合大数据平台，在不影响集群整体业务的情况下，把大集群多个节点分批次滚动升级，一次升级只需重启少量节点，无需中断业务，直至集群所有节点升级到新版本。华为FusionInsight HDFS滚动升级示例：与传统大数据平台版本升级步骤两大关键变化点如下：传统大数据平台华为FusionInsight

开发者 > 博客

作者： Andrew007

发表时间： 2020-02-12 10:05:03

7996

0
《企业级大数据平台构建：架构与实现》——1.3.2　数据接入

等等。2）类型杂：这些原始数据拥有不同数据类型，比如文件属于非结构化的数据，关系型数据库中表属于结构化数据，而HTML页面属于半结构化数据。3）体量大：这些原始数据可能非常多，因为现如今企业内部存储的数据量正在急剧增长。特别是一些互联网企业，其每天的数据增长可能就达到TB级。由此

开发者 > 博客

作者：华章计算机

发表时间： 2019-06-06 15:27:57

5878

0
《企业级大数据平台构建：架构与实现》——2.5　Spark

S实现海量数据的共享存储，然后使用MapReduce以批处理的方式处理这些海量数据，这一切看起来似乎十分完美。但众口难调啊，有人觉得MapReduce的编程模型太难使用了，为什么不能使用SQL来分析数据呢？我们数据库领域已经有非常成熟的数据仓库模型了，为何不实现一个大数据技术的数

开发者 > 博客

作者：华章计算机

发表时间： 2019-06-06 16:22:19

3445

0
对接大数据平台
对接大数据平台

对接大数据平台支持的大数据平台简介华为云MRS对接OBS Cloudera CDH对接OBS Hortonworks HDP对接OBS 父主题：大数据场景下使用OBS实现存算分离

开发者 > 开发服务
《企业级大数据平台构建：架构与实现》——2.1.3　核心设计目标

移动计算比移动数据更划算一个应用请求的计算，距离它操作的数据越近就越高效，在数据达到海量级别的时候更是如此。因为这样就能降低网络阻塞的影响，提高系统数据的吞吐量。将计算移动到数据附近，比将数据移动到应用所在之处显然更好。HDFS提供了将应用移动到数据附近的接口的功能。

开发者 > 博客

作者：华章计算机

发表时间： 2019-06-06 15:40:33

5338

0
【转载】3.7亿条保单数据怎么分析？这个大数据平台有绝招

、各事业部、各业务条线的业务和财务数据进行统一的处理和加工，形成集团级数据资产，深化数据服务能力，推进集团数字化转型。大型集团的业财一体化大数据平台，对平台的性能、扩展性要求高，还要考虑到技术的快速迭代和数据量的指数级增长。华为云EI 智能数据湖FusionInsight为企业提

开发者 > 其他

作者：追梦小柠檬

1429

1
大数据平台启动 dlio_res_datalog_res 定时任务失败

大数据平台启动 dlio_res_datalog_res 定时任务失败

开发者 > 其他

作者： yd_216621994

75

5
《企业级大数据平台构建：架构与实现》——1.3.5　平台安全与管理

系统的用户和集群用户等。这些用户如何集成和统一也是一个问题。所以我们必须拥有一套行之有效的用户集成方案来解决这些问题。2.?数据隔离与访问授权作为一个统一存储的大数据平台，自然会存储不同业务和团队的各种数据。这些数据不应该对所有人可见。不同的应用之间应该拥有独立的数据存储空间，不

开发者 > 博客

作者：华章计算机

发表时间： 2019-06-06 15:32:09

5550

0
《企业级大数据平台构建：架构与实现》——2.4.8　使用场景

统一的资源共享型大数据平台。借助YARN我们可以真正实现通过一套资源调度系统集成所有应用组件的单一大集群架构。1.?Spark任务调度Spark是一款分布式内存计算框架，在下一小节会详细介绍它。Spark可以将自身的任务调度部分委托YARN进行管理，从而实现集群资源高效整合与利用。2

开发者 > 博客

作者：华章计算机

发表时间： 2019-06-06 16:20:53

5592

0
《企业级大数据平台构建：架构与实现》——1.4　平台辅助工具

而专业的数据科学家又不精通程序开发。能够同时精通数据分析和程序开发的人可谓是凤毛麟角。所以大数据平台应该能够提供一个可视化的数据分析系统，可以让数据科学家使用类似SQL这样简单易学的方式进行自助式的数据分析，从而可以在不需要编写任何程序的情况下直接进行多种方式的数据探索与分析。

开发者 > 博客

作者：华章计算机

发表时间： 2019-06-06 15:33:40

5924

0
华为云EI智能数据湖FusionInsight 8.0 MRS新版本：融合大数据平台

一、FusionInsight MRS概述 FusionInsight MRS是华为FusionInsigth HD企业级大数据平台本与原华为云MRS服务的融合版本，是华为云(Huawei Cloud)、HCS(Huawei Cloud Stack)统一的企业级大数据云服务。FusionInsight

开发者 > 博客

作者：沙漏

发表时间： 2020-07-02 11:47:07

12441

0
《企业级大数据平台构建：架构与实现》——2.2.4　数据模型

2.2.4　数据模型Zookeeper将Znode的数据保存在内存中，这是它能实现高吞吐量和低延迟性能的重要原因。为了增强可靠性，Zookeeper会同时将这些数据以操作日志和快照的形式持久化到磁盘之上，以免进程重启的时候数据丢失。Znode节点分为三种类型，它们分别是：Persistent

开发者 > 博客

作者：华章计算机

发表时间： 2019-06-06 15:51:57

5348

0
《企业级大数据平台构建：架构与实现》——2.3.2　数据模型

2.3.2　数据模型HBase是一个NoSQL数据库，它通过一个四维数据模型定义数据，如图2-7所示。RowKey：HBase中的每行数据都必须拥有一个唯一的行键，它类似于关系型数据库中的主键。Column Family：HBase中的每个列都归属于一个列簇，它类似于子表的概念。

开发者 > 博客

作者：华章计算机

发表时间： 2019-06-06 16:00:03

5479

0
《企业级大数据平台构建：架构与实现》—— 1.3.3　数据存储与查询

1.3.3　数据存储与查询在数据接入大数据平台之后，就需要考虑如何存储这些海量数据的问题了。根据业务场景和应用类型的不同我们会有不同的存储需求。1.?关系型数据模型试想一下数据仓库的场景。数据仓库的定位主要是应用于联机分析处理（OLAP），它不需要支持事务性的操作，只用专注于分析

开发者 > 博客

作者：华章计算机

发表时间： 2019-06-06 15:29:26

3209

0
3.7亿条保单数据怎么分析？这个大数据平台有绝招

、各事业部、各业务条线的业务和财务数据进行统一的处理和加工，形成集团级数据资产，深化数据服务能力，推进集团数字化转型。大型集团的业财一体化大数据平台，对平台的性能、扩展性要求高，还要考虑到技术的快速迭代和数据量的指数级增长。华为云EI 智能数据湖FusionInsight为企业提

开发者 > 博客

作者：技术火炬手

发表时间： 2020-08-25 14:15:52

7027

0
《企业级大数据平台构建：架构与实现》——2.1.5　数据模型

2.1.5　数据模型与很多其他的文件系统类似，HDFS也使用了数据块来作为它的最小数据存储单元。正如同在RAID技术小节里介绍的那样，HDFS通过将底层物理的文件系统抽象成逻辑数据块，从而突破了单机磁盘的物理存储极限（类似RAID 0），同时也提升了读写性能（类似RAID 1），

开发者 > 博客

作者：华章计算机

发表时间： 2019-06-06 15:43:08

4030

0
《企业级大数据平台构建：架构与实现》——2.5.2　数据模型

段能够高效的共享数据。RDD的设计者们洞穿了这一现象，于是通过高效的数据共享概念和类似MapReduce的操作设计了RDD，使得它能模拟迭代式算法、关系查询、MapReduce和流式处理等多种编程模型。同时它也是一个可容错的、可并行的数据结构，可以让用户指定将数据存储到磁盘和内存

开发者 > 博客

作者：华章计算机

发表时间： 2019-06-06 16:23:24

2764

0
《企业级大数据平台构建：架构与实现》——2.4.3　ResourceManager

2.4.3　ResourceManagerResourceManager是一个全局的资源管理器，负责整个系统的资源管理和分配以保证整个集群的高效运行。它会根据容量、队列等限制条件（如每个队列分配一定的资源，最多执行一定数量的作业等），将系统中的资源分配给各个正在运行的应用程序。R

开发者 > 博客

作者：华章计算机

发表时间： 2019-06-06 16:12:07

2516

0
《企业级大数据平台构建：架构与实现》—— 1.1.6　缺乏可复制性

1.1.6　缺乏可复制性各自为政的小集群缺乏统一的技术路线，导致大数据集群的运维工作会缺乏可复制性。因为一个部门或者团队与其他部门使用的技术组件可能完全不一样，这样一个集群的安装、维护和调试等经验就没有办法快速复制和推广到其他团队或部门。同时在大数据应用研发方面也会存在同样的问题，

开发者 > 博客

作者：华章计算机

发表时间： 2019-06-06 15:23:51

4129

0
《企业级大数据平台构建：架构与实现》——2.2.7　使用场景

特性，可以实现心跳感知的功能。例如可以在Zookeeper上创建一个根目录，如/cluster1。利用Znode临时节点类型的特性，当某个集群服务进程启动的时候，可以在/cluster1上创建代表自己服务的临时节点，用以表示其会话状态。由于临时节点是会话绑定的，所以当节点存在的时

开发者 > 博客

作者：华章计算机

发表时间： 2019-06-06 15:57:14

5027

0

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

浙江移动携手华为FusionInsight打造0业务中断的融合大数据平台

《企业级大数据平台构建：架构与实现》——1.3.2　数据接入

《企业级大数据平台构建：架构与实现》——2.5　Spark

对接大数据平台

《企业级大数据平台构建：架构与实现》——2.1.3　核心设计目标

【转载】3.7亿条保单数据怎么分析？这个大数据平台有绝招

大数据平台启动 dlio_res_datalog_res 定时任务失败

《企业级大数据平台构建：架构与实现》——1.3.5　平台安全与管理

《企业级大数据平台构建：架构与实现》——2.4.8　使用场景

《企业级大数据平台构建：架构与实现》——1.4　平台辅助工具

华为云EI智能数据湖FusionInsight 8.0 MRS新版本：融合大数据平台

《企业级大数据平台构建：架构与实现》——2.2.4　数据模型

《企业级大数据平台构建：架构与实现》——2.3.2　数据模型

《企业级大数据平台构建：架构与实现》—— 1.3.3　数据存储与查询

3.7亿条保单数据怎么分析？这个大数据平台有绝招

《企业级大数据平台构建：架构与实现》——2.1.5　数据模型

《企业级大数据平台构建：架构与实现》——2.5.2　数据模型

《企业级大数据平台构建：架构与实现》——2.4.3　ResourceManager

《企业级大数据平台构建：架构与实现》—— 1.1.6　缺乏可复制性

《企业级大数据平台构建：架构与实现》——2.2.7　使用场景

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线