检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
哪些场景会影响数据均衡? Doris运行中,FE节点会监控元数据中各磁盘的负载情况,一旦出现数据不均衡,会立刻将高负载磁盘上的数据拷贝一份至低负载磁盘,直到各磁盘间数据均衡。 哪些场景会影响数据均衡? 频繁写入数据,导致各节点、磁盘的负载一直在变化,容易触发数据均衡。 数据均衡过
HBase集群节点扩容 为了提升系统的计算能力、存储能力,用户可以通过节点扩容来扩容集群。节点扩容将会产生相应的费用。用户可根据实际需要或业务情况,动态的增加节点的个数,集群将自适应的实现负载均衡,保证业务不中断,平滑扩容。 注意事项 扩容过程中,不会自动重启集群,保证业务不中断,平滑扩容。
重启集群 当集群处于非均衡或不能正常工作时,可能需要通过重启集群进行恢复。 如果集群欠费,可能会导致该功能被限制不可用,请及时充值确保集群可正常使用。 对系统的影响 重启期间集群将无法提供服务。因此,在重启前,请确定集群中没有正在运行的任务,并且所有数据都已经保存。 如果集群正在
重启集群 当集群处于非均衡或不能正常工作时,可能需要通过重启集群进行恢复。 如果集群欠费,可能会导致该功能被限制不可用,请及时充值确保集群可正常使用。 对系统的影响 重启期间集群将无法提供服务。因此,在重启前,请确定集群中没有正在运行的任务,并且所有数据都已经保存。 如果集群正在
使用HBase Shell访问集群 用户在弹性云服务器里可以通过手动安装客户端或一键部署客户端的方法,使用HBase Shell访问集群。如果集群开启了安全通道,连接集群的方法请参考HBase安全集群连接步骤。 一键部署客户端 准备Linux弹性云服务器。 使用一键部署客户端工具
HBase是一个面向列的数据库,一行数据,可能对应多个列族,而一个列族又可以对应多个列。通常,写入数据的时候,我们需要指定要写入的列(含列族名称和列名称)。HBase通过HTable的put方法来Put数据,可以是一行数据也可以是数据集。 开启冷热分离特性表的写入逻辑和正常表写入逻辑一致。 代码样例 public
典型场景说明 通过典型场景,我们可以快速学习和掌握HBase冷热分离的开发过程,并且对关键的接口函数有所了解。 场景说明 假定用户开发一个应用程序,用于实时记录和查询城市的气象信息,记录数据如下表: 表1 原始数据 城市 区域 时间 温度 湿度 Shenzhen Longgang
每天写入100亿行数据,查询并发QPS上万,99分位的查询延时150ms。 即席查询(Ad-hoc Query):面向分析师的自助分析,查询模式不固定,要求较高的吞吐。Doris构建了增长分析平台(Growing Analytics,GA),利用用户行为数据对业务进行增长分析,平均查询
维度列,做多重排序,排序后的位置就是该行的行号。 索引 StarRocks通过前缀索引 (Prefix Index) 和列级索引,能够快速找到目标行所在数据块的起始行号。 加速处理 StarRocks通过预先聚合、分区分桶、物化视图、列级索引等机制实现数据的加速处理。 数据模型
CLUSTER ClickHouse集群名。 SELECT ... SELECT子句。当数据写入视图中SELECT子句所指定的源表时,插入的数据会通过SELECT子句查询进行转换并将最终结果插入到视图中。 示例: 创建源表。 create table DB.table1 ON CLUSTER
定了POPULATE关键字,则在创建时将SELECT子句所指定的源表数据插入到物化视图中。不指定POPULATE关键字时,物化视图只会包含在物化视图创建后新写入源表的数据。 说明: 一般不推荐使用POPULATE关键字,因为在物化视图创建期间写入源表的数据将不会写入物化视图中。 SELECT
问及使用云服务。华为云将会通过邮件、短信等方式向您发送提醒,提醒您续费或充值。 保留期是指宽限期满后客户的包年/包月资源仍未续订或按需资源仍未缴清欠款,将进入保留期。保留期内客户不能访问及使用云服务,但对客户存储在云服务中的数据仍予以保留。华为云将会通过邮件、短信等方式向您发送提醒,提醒您续费或充值。
在购买页面勾选此选项,集群到期后会自动续费,不勾选集群到期需要手动续费。 图2 集群和网络配置 表2 集群和网络配置 参数 参数说明 名称 集群的名称。 必须以字母开头,由字母、数字、中划线组成,不能包含其他的特殊字符,并且长度为4~32个字符。 虚拟私有云 VPC即虚拟私有云,是通过逻辑方式进行网络隔离,提供安全、隔离的网络环境。
建的集群增加节点数(节点扩容)或对集群的节点增加磁盘容量(纵向扩容)。Doris可以很方便地对节点FE、BE进行节点扩容。一般情况下,可以通过将FE扩展至3个以上实现FE的高可用,且FE节点的扩容过程,不影响当前系统运行。BE节点的扩容过程,不影响当前系统运行以及正在执行的任务,
历史数据删除需求:如有删除历史数据的需求(比如仅保留最近N天的数据)。使用复合分区,可以通过删除历史分区来达到目的。也可以通过在指定分区内发送DELET语句进行数据删除。 解决数据倾斜问题:每个分区可以单独指定分桶数量。如按天分区,当每天的数据量差异很大时,可以通过指定分区的分桶数,合理划分不同分区的数据,分桶列建议选择区分度大的列。
数据表复制样例代码 用户可以开发应用程序,通过调用HBase API接口的方式,将一个表的部分数据或全部数据复制到同一个集群或另一个集群中。目标表必须预先存在。 环境准备 要将表复制到另一个集群,请先获取CloudTable目标集群的“ZK链接地址(内网)”。 登录表格存储服务管
HBase是一个面向列的数据库,一行数据,可能对应多个列族,而一个列族又可以对应多个列。 通常,写入数据的时候,我们需要指定要写入的列(含列族名称和列名称)。 HBase通过HTable的put方法来Put数据,可以是一行数据也可以是数据集。 代码样例 public void testPut() { LOG
many open files。打开的文件句柄数超过了Linux系统限制。需修改Linux系统的句柄数限制。 如果创建数据分片时超时,也可以通过在fe.conf中设置tablet_create_timeout_second=xxx以及max_create_table_timeout
预分区每个splitkey必须由\x01开头。 indexspecs.to.addandbuild(可选):表示创建时同时生成索引数据,数据表数据量较大时不建议使用,建议使用索引数据生成工具完成索引数据生成。 上述命令中的参数描述如下: idx1、idx2、idx3:表示索引名称。 cf1、cf2:表示列族名称。
简单易用:通过控制台分钟级构建分析集群,提供完善的集群运维管理、监控告警等功能,使您无需关注底层基础设施,利用完善的SQL语句支持,专注于数据价值的分析。 首次使用CloudTable 如果您是首次使用CloudTable的用户,建议您学习并了解如下信息: 基础知识了解 通过Clou