检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
全局二级索引介绍 场景介绍 使用HBase二级索引可以加速带Filter的条件查询,支持HIndex(本地索引,即Local Secondary Index )和全局二级索引(Global Secondary Index)。全局二级索引相较于本地索引(HIndex),查询性能更好,适合读时延要求高的场景。
使用全局二级索引工具 创建索引 索引信息查询 删除索引 修改索引状态 父主题: 使用全局二级索引
全局二级索引API 使用全局索引的API都在类“org.apache.hadoop.hbase.hindex.global.GlobalIndexAdmin”中,相关接口介绍如下: 操作 接口 描述 添加索引 addIndices() 将索引添加到没有数据的表中。调用此接口会将用
全局二级索引限制与约束 使用场景限制 GSI不支持与HIndex(LSI)同时使用,即不支持在同一个数据表上同时创建本地索引与全局索引。 索引表不支持容灾。 不支持直接对索引表执行DISABLE、DROP、MODIFY和TRUNCATE操作。 索引DDL操作支持修改索引状态、删除
创建索引 场景介绍 对于未建立索引的用户表,该工具允许用户同时添加和构建索引。 使用方法 在HBase客户端执行以下命令即可添加或创建索引,执行命令后,指定的索引将被添加到表中并且将处于ACTIVE状态: hbase org.apache.hadoop.hbase.hindex.global
删除索引 场景介绍 用户可以使用全局二级索引工具删除某个索引。 使用方法 在HBase客户端执行以下命令可删除某个索引: hbase org.apache.hadoop.hbase.hindex.global.mapreduce.GlobalTableIndexer -Dtablename
修改索引状态 索引状态介绍 索引状态反映了索引当前的使用情况,全局二级索引支持以下五种状态: ACTIVE:索引正常,可以正常读写。 UNUSABLE:索引被禁用,索引数据会正常写入,查询时无法使用这个索引。 INACTIVE:索引异常,索引数据与数据表不一致,跳过生成这个索引的索引数据,查询数据时无法使用这个索引。
索引信息查询 场景介绍 用户可以使用全局二级索引工具批量查看某个数据表相关索引的定义及状态。 使用方法 在HBase客户端执行以下命令可索引的定义及状态: hbase org.apache.hadoop.hbase.hindex.global.mapreduce.GlobalTableIndexer
使用全局二级索引 全局二级索引介绍 全局二级索引限制与约束 使用全局二级索引工具 全局二级索引API 基于索引查询数据 父主题: HBase用户指南
基于索引查询数据 基于索引查询 在具有索引的用户表中,可以使用SingleColumnValueFilter来查询数据。当查询条件可以命中索引时,查询速度远快于原表查询。 索引的命中规则如下: 多个AND条件查询。 当用于查询的列至少包含索引第一个列时,使用索引会提高查询性能。 例如,为C1、C2和C3创建组合索引。
RANDOM BUCKETS 10 ... 【建议】建表时第一个字段一定是最常查询使用的列,默认有前缀索引快速查询能力,选取分区分桶外最长查询且高基数的列,前缀索引36位,如果列超长也不能使用前缀索引能力。 【建议】亿级别以上数据,如果有模糊匹配或者等值/in条件,可以使用倒排索引或者是
同的数组下标。数组下标是隐式的,不需要存储。表中所有的行按照维度列,做多重排序,排序后的位置就是该行的行号。 索引 StarRocks通过前缀索引 (Prefix Index) 和列级索引,能够快速找到目标行所在数据块的起始行号。 加速处理 StarRocks通过预先聚合、分区分
ExplicitColumnName:指定列。 FamilyOnlyName:某一ColumnFamily下的所有列。 PrefixColumnName:拥有某一前缀的列。 (3) 定义列的抽取标签的规则,可选值如下: QualifierExtractor:表示按照列名来抽取标签。 例如,qualifi
HBase用户指南 HBase集群管理 HBase数据批量导入 HBase监控集群 HBase热点自愈 使用全局二级索引
Thrift Server概述 HBase ThriftServer是一个运行在HBase集群上的服务程序,它通过Thrift接口提供对HBase数据库的访问,它可以将不同语言的代码生成为对应的客户端和服务端代码。 Thrift Serve特性仅支持HBase 2.4.14及以上版本。
HBase集群管理 HBase产品简介 HBase是一个稳定可靠,性能卓越、可伸缩、面向列的分布式云存储系统,适用于海量数据存储以及分布式计算的场景,用户可以利用HBase搭建起TB至PB级数据规模的存储系统,对数据轻松进行过滤分析,毫秒级得到响应,快速发现数据价值。 HBase适用场景有:
基于分区键(partitioning key)的数据分区分块存储。 数据索引排序(基于primary key和order by)。 支持数据复制(带Replicated前缀的表引擎)。 支持数据抽样。 在写入数据时,该系列引擎表会按照分区键将数据分成不同的文件夹,文件夹内每列数据为不同的独立文件,以及创建数据
最佳实践 关于Partition和Bucket的数量和数据量的建议 一个表的Tablet总数量等于 (Partition num*Bucket num)。 一个表的Tablet数量,在不考虑扩容的情况下,推荐略多于整个集群的磁盘数量。 单个Tablet的数据量理论上没有上下界,但
成长地图 | 华为云 表格存储服务 表格存储服务(CloudTable)为用户提供专属集群,即开即用,适合业务吞吐量大,时延要求低的用户。轻松运行HBase、Doris、ClickHouse等大数据组件。 产品介绍 立即使用 立即使用 成长地图 由浅入深,带您玩转CloudTable
label可以再次被使用。 column_separator 用于指定导入文件中的列分隔符,默认为\t。如果是不可见字符,则需要加\x作为前缀,使用十六进制来表示分隔符。 如hive文件的分隔符\x01,需要指定为-H "column_separator:\x01"。 可以使用多个字符的组合作为列分隔符。