检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ThriftServer是一个运行在HBase集群上的服务程序,它通过Thrift接口提供对HBase数据库的访问,它可以将不同语言的代码生成为对应的客户端和服务端代码。 Thrift Serve特性仅支持HBase 2.4.14及以上版本。 背景 HBase需要支持多语言访问HBase的能力。 使用限制 Thrift
索引名需要符合正则要求,不支持其他字符。正则要求支持的字符为:[a-zA-Z_0-9-.]: 数据表必须存在,要创建的索引不能已存在。 索引表不支持多版本。 不支持在多版本(VERSION>1)的数据表上创建索引,且索引表的版本VERSION=1。 单个数据表的索引个数不能超过5个。 不建议为单个
HBase集群报错,hmaster域名不识别。 原因分析 运行程序的机器上没有配置CloudTable HBase实例节点的内网域名和ip映射,导致无法识别hmaster节点的内网域名,链接异常。 处理方法 在运行程序机器的host文件中,配置CloudTable HBase的内网域名和ip映射。修改步骤请参见准备弹性云服务器章节。
CloudTable作为大数据存储服务,提供高效的kv随机查询能力。在此基础上,CloudTable服务引入自研的分布式多维标签索引能力,存储格式与计算基于位图进行。用户可以根据自身业务需求来定义HBase表中的哪些字段需要构建标签索引,用户写入数据时将自动生成标签数据。同时,标签索引基于Lucene的语法,提供高
每个分桶文件就是一个数据分片(Tablet),Tablet是数据划分的最小逻辑单元。每个Tablet包含若干数据行。各个Tablet之间的数据没有交集,并且在物理上是独立存储的。 一个Tablet只属于一个Partition,相应的多个Tablet在逻辑上归属于不同的分区(Partition)。而一个Par
该接口的使用场景为用户想要在具有大量预先存在用户数据的表上批量添加索引,然后使用GlobalTableIndexer工具来构建索引数据。 addIndicesWithData() 将索引添加到有数据的表中。此方法将用户指定的索引添加到表中,并会对已经存在的用户数据创建对应的索引数
able的客户端工具,然后在弹性云服务器上使用CloudTable客户端访问CloudTable集群。所申请的弹性云服务器和CloudTable集群必须在相同的区域、虚拟私有云、子网和安全组,并且,您还需要为弹性云服务器配置正确的DNS服务器地址。关于准备弹性云服务器的详细信息,请参见准备弹性云服务器。
关于Partition和Bucket的数量和数据量的建议 一个表的Tablet总数量等于 (Partition num*Bucket num)。 一个表的Tablet数量,在不考虑扩容的情况下,推荐略多于整个集群的磁盘数量。 单个Tablet的数据量理论上没有上下界,但建议在1G-10G的范围内。如果单
画像通常用一些标签来刻画自然人/物的特征,而每一个自然人/物所拥有的标签集合是不确定的,数据更新非常频繁,这类数据被广泛应用于市场决策、推荐以及广告系统中。 优势 稀疏矩阵 HBase的稀疏矩阵模型,天然适合非结构化数据的存储,数据表无需预先定义schema,行与行之间不需要严格的列定义。 支持任意更新
时所需扫描的数据量和查询的计算量,非常适合有固定模式的报表类查询场景。但是该模型对count( * ) 查询很不友好。同时因为固定了Value列上的聚合方式,在进行其他类型的聚合查询时,需要考虑语意正确性。 Aggregate Key相同时,新旧记录进行聚合,目前支持的聚合函数有
部分数据的存储成本将会极大的节省企业的成本。 原理介绍 CloudTable HBase支持对同一张表的数据进行冷热分离存储。用户在表上配置数据冷热时间分界点后,HBase会依赖用户写入数据的时间戳(毫秒)和时间分界点来判断数据的冷热。数据开始存储在热存储上,随着时间的推移慢慢往
节点费用:根据所选节点规格和节点数量计算的费用。 存储费用:根据选择的存储规格和容量计算的费用 计费周期 包年/包月CloudTable资源的计费周期是根据您购买的时长来确定的(以UTC+8时间为准)。一个计费周期的起点是您开通或续费资源的时间(精确到秒),终点则是到期日的23:59:59。 例如,如果您在2023/03/08
SETTINGS storage_policy = 'hot_to_cold'; 参数说明: storage_policy:指定存储策略,值指定为hot_to_cold。存储策略一旦指定,后期无法更改。 更新TTL。 修改元数据: ALTER TABLE hot_cold_table MODIFY
数据表 在Doris中,数据以表的形式进行逻辑上的描述。表是具有相同模式的同质数据的集合。 一张表包括行(Row)和列(Column)。Row即用户的一行数据。Column用于描述一行数据中不同的字段,可以根据实际情况采用不同的数据类型(如整型、字符串、布尔型等)。 从OLAP场
hadoop.hbase.client.Admin对象的createTable方法来创建表,并指定表名、列族名、冷热时间线。 创建表有两种方式(强烈建议采用预分Region建表方式): 快速建表,即创建表后整张表只有一个Region,随着数据量的增加会自动分裂成多个Region。 预分R
drop table t1 SYNC; 在删除复制表时,因为复制表需要在Zookeeper上建立一个路径,存放相关数据。ClickHouse默认的库引擎是原子数据库引擎,删除Atomic数据库中的表后,它不会立即删除,而是会在24小时后删除。在删除表时,加上SYNC字段,即可解决该问题,例如:drop
trash;命令后,容易导致数据不均衡,触发二次数据均衡,再次产生垃圾文件。 回收站时间过短,容易误删、异常原因导致被删除的tablet无法被恢复。建议根据实际业务,观察回收站占用的磁盘空间的平均值,并根据占用磁盘空间和所需的防误删时间窗口,设置合理时间值。 curl -X POST http://{be_ip}
因此在欠费前请及时充值。 续费相关的功能 包年/包月云服务器续费相关的功能如表1所示。 表1 续费相关的功能 功能 说明 手动续费 包年/包月云服务器从购买到被自动删除之前,您可以随时在CloudTable控制台为集群续费,以延长云服务器的使用时间。 自动续费 开通自动续费后,
单击“Ecs”退出编辑界面。 保存添加内容。 :wq 进入安装客户端目录下进行客户端配置,将如下配置添加到客户端conf目录下的hbase-site.xml文件中。 编辑hbase-site.xml文件。 vi hbase-site.xml 在hbase-site.xml文件最后添加内容: <property>
令中自定义的名称。通过这个label,用户可以查看对应导入任务的执行情况。 label的另一个作用,是防止用户重复导入相同的数据。强烈推荐用户同一批次数据使用相同的 label。这样同一批次数据的重复请求只会被接受一次,保证了At-Most-Once。当label对应的导入作业状