检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
冷热分离概述 海量大数据场景下,随着业务和数据量的不断增长,数据存储与消耗的资源也日益增长。根据业务系统中用户对不同时期数据的不同使用需求,对膨胀的数据本身进行“冷热”分级管理,不仅可以提高数据分析性能还能降低业务成本。 背景 在数据分析的实际场景中,冷热数据面临着不同的查询频次及响应速度要求
创建Connection 功能介绍 HBase通过ConnectionFactory.createConnection(configuration)方法创建Connection对象。传递的参数为上一步创建的Configuration。 Connection封装了底层与各实际服务器的连接以及与
普通查询 功能介绍 CloudTable标签索引基于Lucene语法,提供了自研的查询接口LemonTable.query(LemonQuery query)。 样例代码 public void testNormalQuery() { LOG.info("Entering testNormalQuery
分页查询 功能介绍 先执行query接口返回简要数据信息,而后调用listRows接口翻页。 可以参考以下样例代码。 样例代码 public void testPagingQuery() { LOG.info("Entering testPagingQuery."); try
配置参数 执行样例代码前,必须在hbase-site.xml配置文件中,配置正确的ZooKeeper集群的地址。配置项如下: <property> <name>hbase.zookeeper.quorum</name> <value>xxx-zk1.cloudtable.com,xxx-zk2
创建表 功能介绍 HBase通过org.apache.hadoop.hbase.client.Admin对象的createTable方法来创建表,并指定表名、列族名、冷热时间线。 创建表有两种方式(强烈建议采用预分Region建表方式): 快速建表,即创建表后整张表只有一个Region
修改表 功能介绍 HBase通过org.apache.hadoop.hbase.client.Admin的modifyTable方法修改表信息。 代码样例 取消冷热时间线。 public void testModifyTable() { LOG.info("Entering testModifyTable
查看ClickHouse集群的基本信息 集群创建完成后,可对集群进行监控和管理。在CloudTable管理控制台单击集群管理,在集群列表中找到所要查看的集群并单击集群名称,进入集群基本信息页面,用户可查看集群信息和集群的网络配置。 表1 集群信息 参数 说明 集群名称 集群的名称,
创建索引 场景介绍 对于未建立索引的用户表,该工具允许用户同时添加和构建索引。 使用方法 在HBase客户端执行以下命令即可添加或创建索引,执行命令后,指定的索引将被添加到表中并且将处于ACTIVE状态: hbase org.apache.hadoop.hbase.hindex.global.mapreduce.GlobalTableIndexer
ClickHouse冷热分离命令简介 此章节主要介绍CloudTable ClickHouse冷热分离命令的使用,ClickHouse集群基本命令使用请参见Clickhouse命令简介。 创建冷热分离数据表。 CREATE TABLE hot_cold_table ( `f1` String
最佳实践 因为数据模型在建表时就已经确定,且无法修改。所以,选择一个合适的数据模型非常重要。 数据模型选择 Doris数据模型上目前分为三类:AGGREGATE KEY,UNIQUE KEY,DUPLICATE KEY。三种模型中数据都是按KEY进行排序。 Aggregate模型。
最佳实践 关于Partition和Bucket的数量和数据量的建议 一个表的Tablet总数量等于 (Partition num*Bucket num)。 一个表的Tablet数量,在不考虑扩容的情况下,推荐略多于整个集群的磁盘数量。 单个Tablet的数据量理论上没有上下界,但建议在
CREATE MATERIALIZED VIEW 本章节介绍如何在ClickHouse中创建物化视图。 创建物化视图 CREATE MATERIALIZED VIEW [IF NOT EXISTS] [db.]Materialized_name [TO[db.]name] [ON
HBase表格存储的每日新增数据使用量怎么查看? HBase集群无法查看单个表的增量值,需要通过后台帮您查询,或者可以通过控制台查看每日新增数据,查看详情页已经使用的存储容量,通过记录存储容量值计算增量。 父主题: 数据读写类
SHOW显示数据库和表信息 此章节主要介绍ClickHouse显示数据库和表信息的SQL基本语法和使用说明。 基本语法 show databases; show tables; 示例: 查询数据库。 show databases; 查询表信息。 show tables; 父主题:
节点重启 当CloudTable集群节点状态异常时,可通过执行重启节点操作尝试将该节点状态恢复正常。 注意事项 重启节点过程中,节点不可用。 重启后节点请在业务低谷期进行重启,避免对高峰期业务造成影响。 节点重启时,磁盘扩容、节点扩容、规格变更按钮置灰,不可操作。 节点重启是进程重启
查看调测结果 运行结果中没有异常或失败信息即表明运行成功。 图1 运行成功 在Windows环境运行样例代码时会出现下面的异常,但是不影响业务: java.io.IOException: Could not locate executable null\bin\winutils.exe
数据模型 Doris的数据模型主要分为3类: Aggregate模型。 Unique模型。 Duplicate。 Aggregate模型 以实际的例子来说明什么是聚合模型,以及如何正确的使用聚合模型。 示例1:导入数据聚合 假设业务有以下模式: 表1 参数说明 ColumnName
使用Get读取数据 功能介绍 要从表中读取一条数据,首先需要实例化该表对应的Table实例,然后创建一个Get对象。也可以为Get对象设定参数值,如列族的名称和列的名称。查询到的行数据存储在Result对象中,Result中可以存储多个Cell。 针对开启冷热分离特性的列族,可以从冷热存储中查询数据
JDBC通过非ssl方式连接doris 在应用层进行代码重试和负载均衡时,代码重试需要应用自己多个配置doris前端节点地址。比如发现一个连接异常退出,就自动在其他连接上进行重试。 JDBC Connector 如果使用mysql jdbc connector来连接Doris,可以使用