检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
插入数据 功能简介 HBase是一个面向列的数据库,一行数据,可能对应多个列族,而一个列族又可以对应多个列。 通常,写入数据的时候,我们需要指定要写入的列(含列族名称和列名称)。 HBase通过HTable的put方法来Put数据,可以是一行数据也可以是数据集。 代码样例 public
Catalog可以直接对应到外部数据目录。目前支持的外部数据目录包括: Hive JDBC: 对接数据库访问的标准接口(JDBC)来访问各式数据库的数据。 该功能将作为之前外表连接方式(External Table)的补充和增强,帮助用户进行快速的多数据目录联邦查询。 基础概念
在CDM集群中,在“表/文件迁移”页面,新建一个作业。 有关新建“表/文件迁移”作业的详细操作,请参见《云数据迁移用户指南》的新建表/文件迁移作业章节。 在新建“表/文件迁移”类型的作业时,如果待迁移的源端的表/文件在目的端CloudTable集群中不存在相应的HBase表,在作业中为目
新建的用户名。 全局权限 查询、插入、更改、创建、删除。 各级权限 数据库和表:创建的数据库和表。 高危权限:创建表、删除表。 普通权限:查询、插入、更改。 组件支持查看账户对数据库的操作权限。 父主题: Doris用户管理
立即启动”。作业状态为“运行中”表示作业运行成功。 步骤四:结果验证 待MRS Flink任务和DLI任务运行成功后,回到ClickHouse集群运行命令的窗口,进入集群客户端。 查看数据库。 show databases; 使用数据库。 use databases; 查看数据表。 show tables;
show databases; 查看表。 show tables; 删除数据库和表。 删除表。 drop table demo_t; 删除数据表前,需确认此数据表是否应用中,以免引起不必要的麻烦。 删除数据表后可在24小时内恢复,超过24小时无法恢复。恢复命令如下: set allo
集群创建完成后,可对集群进行监控和管理。在CloudTable管理控制台单击集群管理,在集群列表中找到所要查看的集群并单击集群名称,进入集群基本信息页面,用户可查看集群信息和集群的网络配置。 集群基本信息参数说明如表1和表2所示。 表1 集群信息 参数 参数说明 集群名称 集群的名称,创建集群时设置。 集群ID
Doris数据表和数据模型 数据表 数据模型 最佳实践 父主题: 建表
Distribution的设置以及使用场景 如果OLAP表没有更新类型的字段,将表的数据分桶模式设置为RANDOM,则可以避免严重的数据倾斜(数据在导入表对应的分区的时候,单次导入作业每个batch的数据将随机选择一个tablet进行写入)。 当表的分桶模式被设置为RANDOM时,因为没有分
不同的数据源选择不同的数据导入方式。 Broker Load Stream Load 支持的数据格式 不同的导入方式支持的数据格式不同。 表1 导入方式说明 导入方式 支持格式 Broker Load parquet、orc、obs Stream Load csv、json、parquet、orc
default: 1" ); 可以看到,这是一个典型的用户信息和访问行为的事实表。在一般星型模型中,用户信息和访问行为一般分别存放在维度表和事实表中。这里我们为了更加方便的解释Doris的数据模型,将两部分信息统一存放在一张表中。 表中的列按照是否设置了AggregationType,分为Key
source表。 load data inpath '/tmp/source_text.txt' into table ods_source; 示例1,Parquet格式表导入。 在hive中创建parquet分区表并写入数据。 创建ods_demo_detail表。 CREATE
分区用于将数据划分成不同区间,逻辑上可以理解为将原始表划分成了多个子表。可以方便的按分区对数据进行管理。 Partition列可以指定一列或多列,分区列必须为KEY列。多列分区的使用方式在后面多列分区小结介绍。 不论分区列是什么类型,在写分区值时,都需要加双引号。 分区数量理论上没有上限。 当
HTTP连接数 HTTP协议连接个数。 Count 60 number_of_databases 数据库数量 每个节点数据库数量。 Count 60 number_of_tables 表数量 每个节点本地表数量。 Count 60 write_size_per_second 每秒写入大小 每个节点单位时间写入的数据量。
load导入结果参数如下表。 表3 参数说明 参数 说明 TxnId 导入的事务ID。用户可不感知。 Label 导入Label。由用户指定或系统自动生成。 Status 导入完成状态。 Success:表示导入成功。 Publish Timeout:该状态也表示导入已经完成,只是数据可能会延迟可见,无需重试。
基于索引查询数据 基于索引查询 在具有索引的用户表中,可以使用SingleColumnValueFilter来查询数据。当查询条件可以命中索引时,查询速度远快于原表查询。 索引的命中规则如下: 多个AND条件查询。 当用于查询的列至少包含索引第一个列时,使用索引会提高查询性能。 例如,为C1、C2和C3创建组合索引。
运行状态为“运行中”时,对应的操作列中会出现“结束查询”操作。 表3 状态说明 状态 描述 已完成 表示SQL语句已经执行完毕。 运行中 表示SQL语句正在运行中,可手动选择是否结束运行中的SQL语句。 已取消 表示SQL语句已被取消执行。 父主题: Doris集群管理
运行状态为“运行中”时,对应的操作列中会出现“结束查询”操作。 表3 状态说明 状态 描述 已完成 表示SQL语句已经执行完毕。 运行中 表示SQL语句正在运行中,可手动选择是否结束运行中的SQL语句。 已取消 表示SQL语句已被取消执行。 父主题: ClickHouse集群管理
登录表格存储服务管理控制台,在左侧导航树单击集群管理,然后在集群列表中找到所需要的集群,并获取相应的“ZK链接地址(内网)”。 在复制表数据前,需要先确保在CloudTable目标集群中目标表已经存在。如果目标表不存在,请先创建目标表。 创建表的具体步骤,请参考创建HBase集群。 下载样例代码,然后参考准备开发环境章节准备开发环境。
mysql> help 创建数据库。 执行“CREATE DATABASE”命令创建数据库,创建数据库必须指定数据库的名字。 mysql> CREATE DATABASE demo; Query OK, 0 rows affected (0.00 sec) 使用数据库。 mysql> USE