检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过Flume采集指定目录日志系统文件至HDFS 基于Kafka的Word Count数据流统计案例 实时OLAP数据分析 物联网时序数据分析
实时OLAP数据分析 实时OLAP场景介绍 离线数据加载:通过CDM将Hive外表数据迁移到Doris 离线数据加载:通过Doris Catalog读取Hive外表数据并写入Doris 离线数据加载:通过Doris Catalog读取RDS-MySQL数据并写入Doris 离线数
可以更好的满足物联网场景下时序数据分析的需求。 物联网时序数据分析架构如图1所示。 图1 物联网时序数据分析 数据源:物联网时序数据,包括离线的CSV文件数据、实时采集器采集的数据、或支持MQTT协议的物联网终端设备。 大数据平台:物联网时序数据分析的核心平台,包括实时数据管道、实时数据处理引擎、时序数据库等模块。
可以根据业务特点选择不同的表格式。 图4 实时OLAP数据查询 表模型选择: Aggregate模型可以通过预聚合,极大地降低聚合查询时所需扫描的数据量和查询的计算量,适合有固定模式的报表类查询场景,但是该模型不适用于count(*)查询。同时因为固定了Value列上的聚合方式
物联网时序数据分析 物联网时序数据分析场景介绍 手动将CSV离线数据导入至IoTDB 使用HetuEngine查询IoTDB时序数据 使用Grafana对接IoTDB数据库 父主题: 数据分析
CarbonData数据分析 新建CarbonData Table 删除CarbonData Table 修改CarbonData Table 加载CarbonData表数据 删除CarbonData表Segments 合并CarbonData表Segments 父主题: 使用CarbonData(MRS
CarbonData数据分析 新建CarbonData表 删除CarbonData表 修改CarbonData表 加载CarbonData表数据 删除CarbonData表Segments 合并CarbonData表Segments 父主题: 使用CarbonData
实时OLAP数据查询:基于Unique表的单表检索查询和聚合查询 应用场景 本场景通过基于Unique模型表查询符合条件的数据。基于Unique模型表聚合查询,支持MIN,MAX,SUM,REPLACE四种聚合算法。 方案架构 Doris支持海量数据的亚秒级查询,支持单表数据的聚
ris 应用场景 本地CSV文件数据通过StreamLoad导入到Doris,需要写入Doris的数据不重复,通过引入 Unique 数据模型保证 Key 的唯一性。 方案架构 离线数据可以从数据湖加载,也可以直接加载本地文件。从数据湖加载可以使用工具CDM,在没有CDM工具时,
Doris数据分析 导出Doris数据至HDFS 导出Doris查询结果集 父主题: 使用Doris
MRS支持在大数据存储容量大、计算资源需要弹性扩展的场景下,用户将数据存储在OBS服务中,使用MRS集群仅作数据计算处理的存算分离模式,从而实现按需灵活扩展资源、低成本的海量数据分析方案。 大数据存算分离场景,请务必使用OBS并行文件系统(并行文件系统),使用普通对象桶会对集群性能产生较大影响。 当集群已对接了OBS
FS中进行批量分析,在1小时内MRS可以完成10TB的天气数据分析。 图1 环保行业海量数据分析场景 该场景下MRS的优势如下所示。 低成本:利用OBS实现低成本存储。 海量数据分析:利用Hive实现TB/PB级的数据分析。 可视化的导入导出工具:通过可视化导入导出工具Loader,将数据导出到DWS,完成BI分析。
hive表数据共20行,其中10行数据对应Doris的unique字段重复: Doris的unique表数据: 父主题: 实时OLAP数据分析
步骤2:准备应用程序:准备用于进行分析的源数据及程序。 步骤3:上传jar包及源数据:将相关程序和数据上传至MRS集群内。 步骤4:运行作业并查看结果:运行程序并查看数据分析结果。 步骤1:创建MRS集群 创建并购买一个包含有Spark2x、Kafka组件的MRS集群,详情请参见购买自定义集群。 本文以购买的MRS
lineorder_noid; 例如执行后结果如下,MySQL数据写入Doris成功,且按照UNIQUE KEY指定字段自动去除重复数据。 父主题: 实时OLAP数据分析
使用JDBC提交数据分析任务 功能简介 本章节介绍如何使用JDBC样例程序完成数据分析任务。 样例代码 使用Hive JDBC接口提交数据分析任务,该样例程序在“hive-examples/hive-jdbc-example”的“JDBCExample.java”中,实现该功能的模块如下:
from wxk.lineorder_orc02; 例如执行后结果如下,数据写入Doris成功,且数据符合预期结果。 父主题: 实时OLAP数据分析
lineorder_brokerload_u 可以查看到MySQL数据导入Doris成功,且根据UNIQUE KEY指定字段自动去重 父主题: 实时OLAP数据分析
lineorder02 例如执行后结果如下,数据写入Doris成功,且按照UNIQUE KEY指定字段自动去除重复数据。 父主题: 实时OLAP数据分析
数据库名称; select * from lineorder_u; 例如查看到如下信息,表示查询新增的数据成功。 父主题: 实时OLAP数据分析