内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 企业级大数据平台构建:架构与实现》—— 1.1.3 服务孤岛

    1.1.3 服务孤岛企业内部各自为政的小集群的首要任务是支撑团队或项目组自身的业务场景来满足自身的需求,所以在实现功能的时候不会以面向服务的思维来抽象提炼服务,很可能都没有可以暴露出来供小集群外部使用的服务。退一步讲就算这些小集群有提供出来的服务,那么它们也缺乏统一的顶层设计,在

    作者: 华章计算机
    发表时间: 2019-06-06 15:20:05
    2928
    0
  • 浙江移动携手华为FusionInsight打造0业务中断的融合大数据平台

    华为FusionInsight融合大数据平台,在不影响集群整体业务的情况下,把大集群多个节点分批次滚动升级,一次升级只需重启少量节点,无需中断业务,直至集群所有节点升级到新版本。华为FusionInsight HDFS滚动升级示例: 与传统大数据平台版本升级步骤两大关键变化点如下: 传统大数据平台 华为FusionInsight

    作者: Andrew007
    发表时间: 2020-02-12 10:05:03
    7996
    0
  • 企业级大数据平台构建:架构与实现》——1.3.2 数据接入

    等等。2)类型杂:这些原始数据拥有不同数据类型,比如文件属于非结构化的数据,关系型数据库中表属于结构化数据,而HTML页面属于半结构化数据。3)体量大:这些原始数据可能非常多,因为现如今企业内部存储的数据量正在急剧增长。特别是一些互联网企业,其每天的数据增长可能就达到TB级。由此

    作者: 华章计算机
    发表时间: 2019-06-06 15:27:57
    5878
    0
  • 【转载】3.7亿条保单数据怎么分析?这个大数据平台有绝招

    、各事业部、各业务条线的业务和财务数据进行统一的处理和加工,形成集团级数据资产,深化数据服务能力,推进集团数字化转型。大型集团的业财一体化大数据平台,对平台的性能、扩展性要求高,还要考虑到技术的快速迭代和数据量的指数级增长。华为云EI 智能数据湖FusionInsight为企业提

    作者: 追梦小柠檬
    1429
    1
  • 企业级大数据平台构建:架构与实现》——2.1.3 核心设计目标

    移动计算比移动数据更划算一个应用请求的计算,距离它操作的数据越近就越高效,在数据达到海量级别的时候更是如此。因为这样就能降低网络阻塞的影响,提高系统数据的吞吐量。将计算移动到数据附近,比将数据移动到应用所在之处显然更好。HDFS提供了将应用移动到数据附近的接口的功能。

    作者: 华章计算机
    发表时间: 2019-06-06 15:40:33
    5338
    0
  • 对接大数据平台

    对接大数据平台 支持的大数据平台简介 华为云MRS对接OBS Cloudera CDH对接OBS Hortonworks HDP对接OBS 父主题: 大数据场景下使用OBS实现存算分离

  • 企业级大数据平台构建:架构与实现》——1.3.5 平台安全与管理

    系统的用户和集群用户等。这些用户如何集成和统一也是一个问题。所以我们必须拥有一套行之有效的用户集成方案来解决这些问题。2.?数据隔离与访问授权作为一个统一存储的大数据平台,自然会存储不同业务和团队的各种数据。这些数据不应该对所有人可见。不同的应用之间应该拥有独立的数据存储空间,不

    作者: 华章计算机
    发表时间: 2019-06-06 15:32:09
    5550
    0
  • 企业级大数据平台构建:架构与实现》——2.4.8 使用场景

    统一的资源共享型大数据平台。借助YARN我们可以真正实现通过一套资源调度系统集成所有应用组件的单一大集群架构。1.?Spark任务调度Spark是一款分布式内存计算框架,在下一小节会详细介绍它。Spark可以将自身的任务调度部分委托YARN进行管理,从而实现集群资源高效整合与利用。2

    作者: 华章计算机
    发表时间: 2019-06-06 16:20:53
    5592
    0
  • 企业级大数据平台构建:架构与实现》——1.4 平台辅助工具

    而专业的数据科学家又不精通程序开发。能够同时精通数据分析和程序开发的人可谓是凤毛麟角。所以大数据平台应该能够提供一个可视化的数据分析系统,可以让数据科学家使用类似SQL这样简单易学的方式进行自助式的数据分析,从而可以在不需要编写任何程序的情况下直接进行多种方式的数据探索与分析。

    作者: 华章计算机
    发表时间: 2019-06-06 15:33:40
    5924
    0
  • 大数据平台启动 dlio_res_datalog_res 定时任务失败

    大数据平台启动  dlio_res_datalog_res  定时任务失败

    作者: yd_216621994
    73
    5
  • 华为云EI智能数据湖FusionInsight 8.0 MRS新版本:融合大数据平台

    一、FusionInsight MRS概述        FusionInsight MRS是华为FusionInsigth HD企业级大数据平台本与原华为云MRS服务的融合版本,是华为云(Huawei Cloud)、HCS(Huawei Cloud Stack)统一的企业级大数云服务。FusionInsight

    作者: 沙漏
    发表时间: 2020-07-02 11:47:07
    12441
    0
  • 企业级大数据平台构建:架构与实现》——2.4.3 ResourceManager

    2.4.3 ResourceManagerResourceManager是一个全局的资源管理器,负责整个系统的资源管理和分配以保证整个集群的高效运行。它会根据容量、队列等限制条件(如每个队列分配一定的资源,最多执行一定数量的作业等),将系统中的资源分配给各个正在运行的应用程序。R

    作者: 华章计算机
    发表时间: 2019-06-06 16:12:07
    2516
    0
  • 企业级大数据平台构建:架构与实现》——2.2.4 数据模型

    2.2.4 数据模型Zookeeper将Znode的数据保存在内存中,这是它能实现高吞吐量和低延迟性能的重要原因。为了增强可靠性,Zookeeper会同时将这些数据以操作日志和快照的形式持久化到磁盘之上,以免进程重启的时候数据丢失。Znode节点分为三种类型,它们分别是:Persistent

    作者: 华章计算机
    发表时间: 2019-06-06 15:51:57
    5348
    0
  • 企业级大数据平台构建:架构与实现》——2.3.2 数据模型

    2.3.2 数据模型HBase是一个NoSQL数据库,它通过一个四维数据模型定义数据,如图2-7所示。RowKey:HBase中的每行数据都必须拥有一个唯一的行键,它类似于关系型数据库中的主键。Column Family:HBase中的每个列都归属于一个列簇,它类似于子表的概念。

    作者: 华章计算机
    发表时间: 2019-06-06 16:00:03
    5479
    0
  • 企业级大数据平台构建:架构与实现》—— 1.3.3 数据存储与查询

    1.3.3 数据存储与查询在数据接入大数据平台之后,就需要考虑如何存储这些海量数据的问题了。根据业务场景和应用类型的不同我们会有不同的存储需求。1.?关系型数据模型试想一下数据仓库的场景。数据仓库的定位主要是应用于联机分析处理(OLAP),它不需要支持事务性的操作,只用专注于分析

    作者: 华章计算机
    发表时间: 2019-06-06 15:29:26
    3209
    0
  • 3.7亿条保单数据怎么分析?这个大数据平台有绝招

    、各事业部、各业务条线的业务和财务数据进行统一的处理和加工,形成集团级数据资产,深化数据服务能力,推进集团数字化转型。大型集团的业财一体化大数据平台,对平台的性能、扩展性要求高,还要考虑到技术的快速迭代和数据量的指数级增长。华为云EI 智能数据湖FusionInsight为企业提

    作者: 技术火炬手
    发表时间: 2020-08-25 14:15:52
    7027
    0
  • 企业级大数据平台构建:架构与实现》——2.1.5 数据模型

    2.1.5 数据模型与很多其他的文件系统类似,HDFS也使用了数据块来作为它的最小数据存储单元。正如同在RAID技术小节里介绍的那样,HDFS通过将底层物理的文件系统抽象成逻辑数据块,从而突破了单机磁盘的物理存储极限(类似RAID 0),同时也提升了读写性能(类似RAID 1),

    作者: 华章计算机
    发表时间: 2019-06-06 15:43:08
    4030
    0
  • 企业级大数据平台构建:架构与实现》——2.5.2 数据模型

    段能够高效的共享数据。RDD的设计者们洞穿了这一现象,于是通过高效的数据共享概念和类似MapReduce的操作设计了RDD,使得它能模拟迭代式算法、关系查询、MapReduce和流式处理等多种编程模型。同时它也是一个可容错的、可并行的数据结构,可以让用户指定将数据存储到磁盘和内存

    作者: 华章计算机
    发表时间: 2019-06-06 16:23:24
    2764
    0
  • 企业级大数据平台构建:架构与实现》—— 1.1.6 缺乏可复制性

    1.1.6 缺乏可复制性各自为政的小集群缺乏统一的技术路线,导致大数集群的运维工作会缺乏可复制性。因为一个部门或者团队与其他部门使用的技术组件可能完全不一样,这样一个集群的安装、维护和调试等经验就没有办法快速复制和推广到其他团队或部门。同时在大数据应用研发方面也会存在同样的问题,

    作者: 华章计算机
    发表时间: 2019-06-06 15:23:51
    4129
    0
  • 企业级大数据平台构建:架构与实现》—— 2.3.6 MemStore与HFile

    6 MemStore与HFile为了提高数据写入时的吞吐量,HBase并不会实时的将写入的数据直接刷入磁盘,而是先将数据放入内存中进行保管,MemStroe对象就是负责此项任务的逻辑对象,它将数据以Key-Values的形式保存在内存中。将数据直接放入内存读写虽然很快,但这样做并不

    作者: 华章计算机
    发表时间: 2019-06-06 16:06:38
    5316
    0