检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据分区和分桶 Doris支持两层的数据划分。第一层是Partition(分区),支持Range(按范围)和List(按枚举值)的划分方式。第二层是Bucket(分桶),仅支持Hash的划分方式。分区和分桶都是对数据进行横向分隔。 也可以仅使用一层分区。使用一层分区时,只支持Bu
表格存储服务(CloudTable)是基于HBase、Doris、ClickHouse、StarRocks提供的全托管数据存储和分析服务。CloudTable提供GB~PB级数据存储和分析能力,用于在线查询、数据仓库、数据集市、实时分析等场景。可被广泛应用于互联网、物联网、车联网、金融、政府、物流、制造、零售等行业。
Cloud,简称VPC)为集群提供网络拓扑,实现多个不同集群互相隔离并控制访问。 了解更多VPC的相关信息,请参见虚拟私有云。 对象存储服务OBS CloudTable使用对象存储服务(Object Storage Service,简称OBS)存储集群数据的备份和快照,实现安全、高可靠和低成本的存储需求。
典型场景说明 通过典型场景,我们可以快速学习和掌握标签索引的开发过程,并且对关键的接口函数有所了解。 场景说明 某在线付费学习APP给会员打上各种属性标签,以方便后续的资源投放和精准定位营销。例如,需要ms级统计拥有学士和硕士学位的用户数量是多少?以及是哪些用户? 用户信息表字段如下:
入一个分片,这样将能提高数据导入的并发度和吞吐量,减少数据导入和Compaction导致的写放大问题,保障集群的稳定性。 复合分区与单分区 复合分区。 第一级称为Partition,即分区。用户可以指定某一维度列作为分区列(当前只支持整型和时间类型的列),并指定每个分区的取值范围。
正常情况下,建表语句会在几秒或十几秒内返回。如果超过一分钟,建议直接取消掉这个操作,前往FE或BE的日志查看相关错误。 父主题: 数据分区和分桶
绍。 不论分区列是什么类型,在写分区值时,都需要加双引号。 分区数量理论上没有上限。 当不使用Partition建表时,系统会自动生成一个和表名同名的,全值范围的Partition。该Partition对用户不可见,并且不可删改。 创建分区时不可添加范围重叠的分区。 Range分区
典型场景说明 通过典型场景,用户可以快速学习和掌握ClickHouse的开发过程,并且对关键的接口函数有所了解。 场景说明 假定用户需要开发一个应用程序,用于存储或根据一定条件查询人员的姓名、年龄和入职日期。主要操作步骤: 建立数据库的连接。 建立一张人员信息表。 插入数据(样例代码中数据为随机生成)。
用,计算和存储分离保证高可靠,内核深度优化。 易使用:支持二级索引,满足数据非主键查询需求,简单易用。 低成本:支持冷热分离,满足数据归档、访问频率较低历史数据存储需求,降低存储成本。 稳定可靠:支持热点诊断和自愈,提升系统稳定性。 可视化监控运维:提供常用的监控信息和自定义告警规则,简化系统运维。
通过典型场景,我们可以快速学习和掌握HBase的开发过程,并且对关键的接口函数有所了解。 场景说明 假定用户开发一个应用程序,用于管理企业中的使用A业务的用户信息,如表1所示,A业务操作流程如下: 创建用户信息表。 在用户信息中新增用户的学历、职称等信息。 根据用户编号查询用户姓名和地址。 根据用户姓名进行查询。
典型场景说明 通过典型场景,我们可以快速学习和掌握Doris的开发过程,并且对冷热分离的应用场景有所了解。 场景说明 假定用户开发一个网站系统,test_tbl用于实时用户访问网站的记录,记录数据如下表: 表1 原始数据 timestamp type error_code error_msg
典型场景说明 通过典型场景,我们可以快速学习和掌握ClickHouse冷热分离的开发过程,并且对关键的接口函数有所了解。 场景说明 假定用户开发一个网站系统,test_tbl用于实时用户访问网站的记录,记录数据如下表: 表1 原始数据 timestamp type error_code
典型场景说明 通过典型场景,我们可以快速学习和掌握HBase冷热分离的开发过程,并且对关键的接口函数有所了解。 场景说明 假定用户开发一个应用程序,用于实时记录和查询城市的气象信息,记录数据如下表: 表1 原始数据 城市 区域 时间 温度 湿度 Shenzhen Longgang
充分发挥现代化CPU并行计算能力,辅以智能物化视图技术实现预聚合加速,并可以通过查询优化器同时进行基于规划和基于代价的查询优化。 简单易用:支持标准ANSI SQL语法,包括单表聚合、排序、过滤和多表Join、子查询等,还支持窗口函数、Grouping Set等复杂SQL语法。除
或2个列,同时需要兼顾数据分布均匀和查询吞吐之间的均衡,考虑数据均匀是为了避免某些桶的数据存在倾斜影响数据均衡和查询效率,考虑查询吞吐是为了利用查询SQL的分桶剪裁优化避免全桶扫描提升查询性能,所以优先考虑哪些数据较为均匀且常用于查询条件的列适合做分桶列。 【强制】2000kw
SHOW显示数据库和表信息 此章节主要介绍ClickHouse显示数据库和表信息的SQL基本语法和使用说明。 基本语法 show databases; show tables; 示例: 查询数据库。 show databases; 查询表信息。 show tables; 父主题:
个表的数据的划分规则。 分桶列可以是多列,Aggregate和Unique模型必须为Key列,Duplicate模型可以是Key列和Value列。分桶列可以和Partition列相同或不同。 分桶列的选择,是在查询吞吐和查询并发之间的一种权衡: 如果选择多个分桶列,则数据分布更均
准备开发和运行环境 准备开发环境 在进行应用开发时,要准备的开发和运行环境如表1所示。 表1 开发环境 准备项 说明 操作系统 开发环境:Windows系统,支持Windows7以上版本。 运行环境:Linux系统。 如需在本地调测程序,运行环境需要和集群业务平面网络互通。 安装JDK
配置并导入工程 背景信息 将CloudTable样例代码工程导入到Eclipse,就可以开始CloudTable应用开发样例的学习。 前提条件 运行环境已经正确配置,请参见准备Windows运行环境。 操作步骤 把样例工程上传到Windows开发环境中。样例工程的获取方法请参见下载样例工程。
batchNum 10 写入数据的总批次。 clickhouse_dataSource_ip_list - clickhouse节点的ip和http端口集合,例如配置为:cloudtable-wlr-cli-server-1-1-2lIWzDO9.mycloudtable.com:8123