数据治理中心数据分析

2023-05-27 18:21:53

业务痛点 数据异构多源,数据准备耗费大量人力投入 计算、存储资源不易扩展,无法应对业务数据峰谷变化和快速分析需求 核心需求 异构数据快速集成,自动数据转换 快速构建数据处理流程作业,支持高性能数据计算 资源 弹性伸缩 ,快速应对数据和业务变化 优势 - 一站式可视化数据开发平台, 集成 大数据 和AI数据作业开 发,支持百万级别任务调度。 - 实时 数据集 成,分钟级数据准备,支持直接基于原始数据 分析。 - 存储和计算分离解耦,资源弹性伸缩,支持业务高峰的海 量数据快速计算。

云搜索服务数据库查询加速

2023-05-27 18:21:53

数据库 查询加速 电商、物流企业有订单查询业务场景,数据量大、查询并发高、吞吐大、且要求查询延迟低。 关系型数据库具备较好的事务性与原子性,但其TP与AP处理能力较弱,通过将CSS作为备数据库,可提升整个系统的TP与AP处理能力。 优势 高性能 支持文本、时间、数字、空间等数据类型;亿级数据查询毫秒级响应; 高可扩展性 支持200+数据节点,支持1000+个数据字段; 业务"0"中断 规格变更、配置更新采用滚动重启,双副本场景下业务0中断。 建议搭配使用: 云数据库 MySQL、分布式消息服务 Kafka

表格存储服务Web/移动应用后端

2023-05-27 18:21:53

ServerLess Web/移动应用后端 使用CloudTable和函数服务FunctionStage结合,用户可以快速构建高可用、自动伸缩的Web/移动应用后端 优势 高可用 利用CloudTable, OBS的高可用性实现网站数据的高可靠性,利用API Gateway和FunctionStage的高可用性实现网站逻辑的高可用 超高性能 单盘最高20000 IOPS,350MB/s吞吐量 灵活扩展 业务爆发时可以自动调度资源运行更多函数实例以满足处理需求 低成本 只针对函数处理文件数据的时间进行计费,存储按使用量计费,弹性扩容,对于非峰值处理,无需购买冗余的资源 建议搭配使用: 对象存储服务 OBS、 函数工作流 FunctionGraph

表格存储服务位置大数据应用

2023-05-27 18:21:53

车联网:位置大数据应用 在车联网中,通常会包含几类数据:车辆、驾驶员等基本信息,车况、电池、电机等监控数据,车辆行驶路径数据。CloudTable的引入了地理大数据处理套件GeoMesa,可以帮助物联网存储和分析海量时空(spatio-temporal)数据,提供路径查询、区域分布统计、区域查询、密度分析、聚合、OD分析等功能 优势 多模数据库能力 针对不同的数据提供不同的索引能力,为其提供最优的性能和查询分析能力 丰富的查询分析函数 GeoMesa提供高性能路径查询、区域分布统计、区域查询、密度分析、聚合、OD分析等功能 无缝对接分析能力 时空数据库可以和UQuery服务无缝对接,提供对于时间+空间数据的良好分析能力,例如热力图等 建议搭配使用: 实时流计算服务 CS、 数据接入服务 DIS、 数据湖探索 DLI、设备管理 IoTDM、 对象存储 服务 OBS、 云数据迁移 CDM

云数据仓库分布式存储

2023-05-27 18:21:53

GaussDB(DWS)采用水平分表的方式,将数据表格的元组按照一定的分布策略分散存储到多个节点。查询的时候可以通过查询条件过滤不必要的数据,快速定位到数据存储位置,从而极大提升数据库性能。 在水平分表的基础上,GaussDB(DWS)支持数据分区(Partition),即根据表的一列或者多列,将要插入表的记录分为不重叠的若干个范围,为每个范围创建一个分区,用来存储相应的数据。 在不同场景下,基于时间分片的方式分区后带来的收益。 当表中访问率较高的行位于一个单独分区或少数几个分区时:大幅减少搜索空间,从而提升访问性能。 当需要查询或更新一个分区的大部分记录时:仅需要连续扫描对应分区,而非扫描整个表,因此可大幅提升性能。 当需要大量加载或者删除的记录位于一个单独分区或少数几个分区时:可直接读取或删除对应分区,从而提升处理性能;同时由于避免大量零散的删除操作,可减少清理碎片工作量。 数据分区带来的好处如下: 改善可管理性 利用分区,可以将表和索引划分为一些更小、更易管理的单元。这样,数据库管理员在进行 数据管理 时就能采取“分而治之”的方法。 有了分区,维护操作可以专门针对表的特定部分执行。 可提升删除操作的性能 删除数据时可以删除整个分区,与分别删除每行相比,这种操作非常高效和快速。 改善查询性能 通过限制要检查或操作的数据数量,分区可带来许多性能优势,包括: --分区剪枝: 分区剪枝(也称为分区消除)是CN在执行时过滤掉不需要扫描的分区,只对相关的分区进行扫描的技术。分区剪枝通常可以将查询性能提高若干数量级 --智能化分区联接: 通过使用一种称为智能化分区联接的技术,分区还可以改善多表联接的性能。当将两个表联接在一起,并且至少其中一个表使用联接键进行分区时,可以应用智能化分区联接。智能化分区联接将一个大型联接分为多个较小的联接,这些较小的联接包含与联接的表“相同”的数据集。这里,“相同”定义为恰好包含联接的两端中相同的分区键值集,因此可以确保只有这些“相同”数据集的联接才会有效,而不必考虑其他数据集。

实时流计算服务功能描述

2023-05-27 18:21:53

丰富的StreamSQL在线分析能力 支持window、join等聚合函数,用SQL表达业务逻辑,简便快捷实现业务 低时延高吞吐 从DIS中读取数据,服务支持自然反压机制,支持高吞吐压力;毫秒级延迟,满足实时计算的业务场景 安全可靠 租户安全机制保障,确保作业安全运行 分布式实时计算 支持大规模集群计算,集群弹性伸缩,节省成本

实时流计算服务主要功能

2023-05-27 18:21:53

StreamingML 提供多种流式机器学习方法对数据进行实时分析与预测,用户仅需编写SQL调用相关函数便可实现数据统计,异常检测,实时聚类,时间序列分析等场景 地理位置分析 提供地理位置分析函数对地理空间数据进行实时分析,用户仅需编写SQL便可实现例如偏航检测,电子围栏等地理分析场景 CEP SQL 提供基于Match Recognize的模式匹配检测,帮助业务人员使用SQL实现基于复杂事件规则的异常检测业务。典型应用场景如欺诈检测、车辆异常行为检测、工业设备异常运行状态检测等 可视化 提供多种图表类型实时展示作业数据输出,用户可以通过API网关服务自由访问作业数据,接入自定义工作流中

数据湖探索金融行业

2023-05-27 18:21:53

实时风控 为了提高消灭或减少风险事件发生的各种可能性,需要使用风控系统对典型的场景包括:注册风控、登录风控、交易分控等进行风控 痛点 风控系统对实时性要求很高 优势 高吞吐低时延 采用Apache Flink的Dataflow模型,完全的实时计算框架。采用 高性能计算 资源,单CPU每秒吞吐1千~2万条消息 丰富的云生态 使用SQL就可以将处理后的数据流式写入CloudTable、 SMN 等多个 云服务 建议搭配使用:数据接入服务 DIS、 消息通知 服务 SMN

数据湖探索大企业

2023-05-27 18:21:53

日志分析 大企业的部门比较多,不同部门在使用云服务时,需要对不同部门的员工的权限进行管理,包括计算资源的创建、删除、使用、隔离等。同时,也需要对不同部门的数据进行管理,包括数据的隔离、共享等 优势 细粒度权限控制 列级别权限控制;INSERTINTO/OVERWRITE单独权限控制;表元数据只读权限控制 统一的管理机制 使用统一的 IAM 管理用户(无需单独创建DLI用户),支持IAM细粒度授权

MapReduce服务车联网行业

2023-05-27 18:21:53

车联网 基于 开源 生态,提供快速高效数据处理计算引擎,帮助车联网企业快速上云,灵活构建开放、统一、全栈式的数据分析大数据平台 优势 统一全栈式大数据平台,灵活弹性 MRS具备企业级大数据的平台能力,计算和存储分离,灵活方便,省事又省心 拥有多引擎混合负载处理能力 MRS提供了丰富的开源组件,灵活搭配,满足客户实时、离线等混合复杂业务处理诉求 高性能,低成本 可以通过MRS Kafka和Storm实时获取流数据,实现高吞吐量、低延时的实时计算、分析能力 兼容开源标准接口 MRS基于开源,拥抱开源,完全兼容开源Apache Hadoop生态API 场景适用服务: MapReduce服务 MRS、云数据库 MySQL、对象存储服务 OBS

MapReduce服务功能

2023-05-27 18:21:53

一站式融合平台 提供Kafka、Flink、Spark、HBase、ClickHouse、Presto等全栈大数据引擎,支持 数据湖 ,数仓、BI、AI融合,助力客户走向融合的一站式大数据平台 一键式平台搬迁 100%兼容开源大数据生态,提供一键式搬迁工具,能够帮助客户快速完成自建平台的平滑 迁移 ,整个迁移过程可做到“代码0修改,业务0中断” 资源灵活弹性伸缩 资源灵活配比,可以选择鲲鹏/x86不同配比的Flavor规格,集群异构混合部署,峰谷任务灵活配置策略,自动弹性伸缩,百节点分钟级发放,大大降低TCO 企业级驾驶舱管理 可视化的企业级集群管理系统,精细化集群监控告警,支持在线变更配置和集群补丁更新,保障业务不中断,日志在线检索,支持多集群统一管理

云搜索服务站内搜索

2023-05-27 18:21:53

站内搜索 对网站内容进行关键字检索、对电商网站商品进行检索与推荐 优势 实时检索 站内资料或商品信息更新数秒至数分钟内即可被检索 分类统计 检索同时可以将符合条件的商品进行分类统计 高亮提示 提供高亮能力,页面可自定义高亮显示方式 建议搭配使用:对象存储服务 OBS、MapReduce服务、云 数据迁移 CDM

云数据仓库IoT数据分析

2023-05-27 18:21:53

实时数据分析 移动互联网、IoT场景下会产生大量实时数据,为了快速获取数据价值,需要对数据进行实时分析,DWS的快速入库和查询能力可支持实时数据分析 优势 流式数据实时入库 IoT、互联网等数据经过流计算及AI服务处理后,可实时写入DWS 实时监控与预测 围绕数据进行分析和预测,对设备进行监控,对行为进行预测,实现控制和优化 AI融合分析 AI服务对图像、文本等数据的分析结果可在DWS中与其他业务数据进行关联分析,实现融合数据分析 建议搭配使用:数据接入服务 DIS、实时流计算服务 CS、 AI开发平台 ModelArts

云数据仓库数据湖分析

2023-05-27 18:21:53

数据湖分析 整合数据资源,构建大数据平台,发现数据价值,成为企业经营的新趋势和迫切诉求。DWS Express可直接对存储在 对象存储OBS 上的大数据平台集成、处理后的数据进行分析 优势 统一分析入口 以DWS的SQL作为上层应用的统一入口,应用开发人员使用熟悉的SQL语言即可访问所有数据 实时交互式分析 针对即时的分析需求,分析人员通过DWS Express,可实时从大数据平台中获取信息 弹性伸缩 客户可使用DWS Express提供的由成百上千节点组成的加速集群,相比本地托管集群,效率提升数百倍。 建议搭配使用:数据湖探索 DLI、MapReduce服务、数据湖治理中心 DGC

云数据仓库传统数仓替换

2023-05-27 18:21:53

传统数仓替换 传统数据库或数仓产品面临数据存不下、查不出、扩容难、成本高的痛点。GaussDB(DWS)作为新一代全场景 数据仓库 ,具备极致性能、高扩展、极简易用、一站式分析等特性,满足大数据时代企业构建新型数仓的需求。 优势 平滑迁移 提供配套的迁移工具,可支持Teradata、Oracle/Exadata、Greenplum等数据分析系统的平滑迁移 完备的数据库及SQL能力 支持SQL 2003标准,兼容Oracle/Teradata的部分语法和数据结构,支持全局事务、存储过程、数据强一致性保证 库仓一体 逻辑集群,支持一套集群容纳数据集市、数据仓库 建议搭配使用:数据接入服务 DIS、云数据迁移 CDM、数据湖治理中心 DGC

共11135条