检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查询时能够有效裁剪数据扫描量,最大限度地利用集群的并发性能,从而提升查询性能。 父主题: 集群管理功能简介
执行“scan”命令扫描表,扫描时需要指定表的名称,即可以全表扫描,也可以指定范围扫描。
虚拟专用网络(VPN):VPN用于在线下数据中心和云上VPC之间建立一条安全加密的公网通信隧道。更多信息请参见什么是虚拟专用网络章节。 CloudTable集群访问对端集群,需要为集群添加路由。 说明: 路由添加请联系技术人员。
Aggregate模型可以通过预聚合,极大地降低聚合查询时所需扫描的数据量和查询的计算量,非常适合有固定模式的报表类查询场景。但是该模型对count( * ) 查询很不友好。同时因为固定了Value列上的聚合方式,在进行其他类型的聚合查询时,需要考虑语意正确性。
CloudTable提供GB~PB级数据存储和分析能力,用于在线查询、数据仓库、数据集市、实时分析等场景。可被广泛应用于互联网、物联网、车联网、金融、政府、物流、制造、零售等行业。
如果一个查询条件不包含所有分桶列的等值条件,那么该查询会触发所有分桶同时扫描,这样查询的吞吐会增加,单个查询的延迟随之降低。这个方式适合大吞吐低并发的查询场景。 如果仅选择一个或少数分桶列,则对应的点查询可以仅触发一个分桶扫描。
应用场景 支持离线、在线海量KeyValue数据高速写入,并提供低延时的查询服务,用于在线应用或者报表展现等。扩展简单,实现高可用、低时延的海量数据存储和查询。 父主题: 应用场景
场景说明 某在线付费学习APP给会员打上各种属性标签,以方便后续的资源投放和精准定位营销。例如,需要ms级统计拥有学士和硕士学位的用户数量是多少?以及是哪些用户?
例如查询指定分区,通过指定分区字段会减少底层数据库扫描的文件数量,提升查询性能。
当表的分桶模式被设置为RANDOM时,因为没有分桶列,无法根据分桶列的值仅对几个分桶查询,对表进行查询的时候将对命中分区的全部分桶同时扫描,该设置适合对表数据整体的聚合查询分析而不适合高并发的点查询。
也就是说,在count( * ) 查询中,Doris必须扫描所有的AGGREGATE KEY列(这里就是user_id 和 date),并且聚合后,才能得到语意正确的结果。当聚合列非常多时,count( * )查询需要扫描大量的数据。
索引在线变更 支持索引在线创建、删除和修改状态,不影响数据表读写。 索引在线修复 当查询命中的索引数据无效时,可以触发索引修复,保障最终查询结果正确。 索引工具 支持索引一致性检查、索引修复、索引创建/删除/修改状态、索引数据重建等功能。 父主题: 使用全局二级索引
产品优势 性能优异:自带高效的列式存储引擎,减少数据扫描量的同时还实现了超高的数据压缩比例。同时Doris还提供了丰富的索引结构来加速数据读取与过滤,利用分区分桶裁剪功能,Doris可以支持在线服务业务的超高并发,单节点最高可支持上千QPS。
以下是一些适用于包年/包月计费模式的业务场景: 稳定业务需求:对于长期运行且资源需求相对稳定的业务,如企业官网、在线商城、博客等。 长期项目:对于周期较长的项目,如科研项目、大型活动策划等。
在查询客户所有记录等信息的范围查询中,CloudTable可以扫描热存储和冷存储中的数据。查询结果将根据数据行按写入表时的时间戳降序返回。在大多数情况下,热数据出现在冷数据之前。
在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 您可以在API Explorer中具体API页面的“代码示例”页签查看对应编程语言类型的SDK代码,如图1所示。
【强制】分桶的列不要设置太多,一般情况下1或2个列,同时需要兼顾数据分布均匀和查询吞吐之间的均衡,考虑数据均匀是为了避免某些桶的数据存在倾斜影响数据均衡和查询效率,考虑查询吞吐是为了利用查询SQL的分桶剪裁优化避免全桶扫描提升查询性能,所以优先考虑哪些数据较为均匀且常用于查询条件的列适合做分桶列
根据当前BE的个数和原始文件的大小修改单个BE的最大扫描量和最大并发数。 修改fe配置项。 max_broker_concurrency=BE个数。 当前导入任务单个BE处理的数据量=原始文件大小/max_broker_concurrency。