检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过Flume采集指定目录日志系统文件至HDFS 基于Kafka的Word Count数据流统计案例 实时OLAP数据分析 物联网时序数据分析
物联网时序数据分析 物联网时序数据分析场景介绍 手动将CSV离线数据导入至IoTDB 使用HetuEngine查询IoTDB时序数据 使用Grafana对接IoTDB数据库 父主题: 数据分析
CarbonData数据分析 新建CarbonData Table 删除CarbonData Table 修改CarbonData Table 加载CarbonData表数据 删除CarbonData表Segments 合并CarbonData表Segments 父主题: 使用CarbonData(MRS
实时OLAP数据分析 实时OLAP场景介绍 离线数据加载:通过CDM将Hive外表数据迁移到Doris 离线数据加载:通过Doris Catalog读取Hive外表数据并写入Doris 离线数据加载:通过Doris Catalog读取RDS-MySQL数据并写入Doris 离线数
好的满足物联网场景下时序数据分析的需求。 物联网时序数据分析架构如图1所示。 图1 物联网时序数据分析 数据源:物联网时序数据,包括离线的CSV文件数据、实时采集器采集的数据、或支持MQTT协议的物联网终端设备。 大数据平台:物联网时序数据分析的核心平台,包括实时数据管道、实时数据处理引擎、时序数据库等模块。
CarbonData数据分析 新建CarbonData表 删除CarbonData表 修改CarbonData表 加载CarbonData表数据 删除CarbonData表Segments 合并CarbonData表Segments 父主题: 使用CarbonData
Doris数据分析 导出Doris数据至HDFS 导出Doris查询结果集 父主题: 使用Doris
Doris全面综合的性能表现也能在轻量化大数据场景中独立承担数据从加工到查询的全链路数据处理需求。 实时OLAP场景化方案 实时OLAP场景化方案如图1所示。 图1 实时OLAP场景化方案 数据源:业务系统产生的数据,可以是离线的文件数据,关系型数据库数据,或者实时采集的流式数据等。 大数据平台:实时OLA
rk离线大规模分布式数据存储和计算,进行海量数据分析与查询。 本实践基于华为云MapReduce服务,用于指导您创建MRS集群后,使用Hive对OBS中存储的原始数据进行导入、分析等操作,展示了如何构建弹性、低成本的存算分离大数据分析。 本实践中,雇员信息的原始数据包含以下两张表:
hive表数据共20行,其中10行数据对应Doris的unique字段重复: Doris的unique表数据: 父主题: 实时OLAP数据分析
使用JDBC提交数据分析任务 功能简介 本章节介绍如何使用JDBC样例程序完成数据分析任务。 样例代码 使用Hive JDBC接口提交数据分析任务,该样例程序在“hive-examples/hive-jdbc-example”的“JDBCExample.java”中,实现该功能的模块如下:
example_db.lineorder_stream_u; 例如查询结果如下,查询数据成功,且符合预期,表示导入成功。 父主题: 实时OLAP数据分析
from wxk.lineorder_orc02; 例如执行后结果如下,数据写入Doris成功,且数据符合预期结果。 父主题: 实时OLAP数据分析
使用JDBC接口提交数据分析任务 功能简介 本章节介绍如何使用JDBC样例程序完成数据分析任务。 样例代码 使用Hive JDBC接口提交数据分析任务,该样例程序在“hive-examples/hive-jdbc-example”的“JDBCExample.java”中,实现该功能的模块如下:
having LO_CUSTKEY<= 10 and LO_CUSTKEY>= 5; 例如,执行结果如下,表示查询成功: 父主题: 实时OLAP数据分析
lineorder02 例如执行后结果如下,数据写入Doris成功,且按照UNIQUE KEY指定字段自动去除重复数据。 父主题: 实时OLAP数据分析
lineorder_brokerload_u 可以查看到MySQL数据导入Doris成功,且根据UNIQUE KEY指定字段自动去重 父主题: 实时OLAP数据分析
lineorder_noid; 例如执行后结果如下,MySQL数据写入Doris成功,且按照UNIQUE KEY指定字段自动去除重复数据。 父主题: 实时OLAP数据分析
数据库名称; select * from lineorder_u; 例如查看到如下信息,表示查询新增的数据成功。 父主题: 实时OLAP数据分析
通过Flink作业处理OBS数据 应用场景 MRS支持在大数据存储容量大、计算资源需要弹性扩展的场景下,用户将数据存储在OBS服务中,使用MRS集群仅做数据计算处理的存算分离模式。 本文将向您介绍如何在MRS集群中运行Flink作业来处理OBS中存储的数据。 方案架构 Flink