检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过典型场景,我们可以快速学习和掌握HBase的开发过程,并且对关键的接口函数有所了解。 场景说明 假定用户开发一个应用程序,用于管理企业中的使用A业务的用户信息,如表1所示,A业务操作流程如下: 创建用户信息表。 在用户信息中新增用户的学历、职称等信息。 根据用户编号查询用户姓名和地址。 根据用户姓名进行查询。
“提交”,成功提交集群创建任务。 集群创建成功后,进入详情页面打开“同时开启安全通道和非安全通道”按钮,弹出确认框,确认无误后,单击“确定”。 在详情页面开启安全通道后,集群会重启。 安全通道和非安全通道同时开启后无法关闭。 安全集群连接步骤 安全集群创建后,打开详情页面,下载证书。
保留期到期后,如果您仍未支付账户欠款,那么计算资源(vCPU和内存)、云硬盘和弹性公网IP都将被释放,数据无法恢复。 图1 按需计费CloudTable集群生命周期 华为云根据客户等级定义了不同客户的宽限期和保留期时长。宽限期和保留期的详细说明请参见宽限期保留期。 避免和处理欠费 及时清理不再使用资源、设置费用预警可以有效避免欠费。
新建角色 角色管理功能提供新增角色、删除角色、查看角色权限、修改角色权限等功能。角色管理支持管理用户对库表数据的权限,包括授权和撤销。 创建角色 登录表格存储服务管理控制台。 单击管理控制台左上角的,选择区域。 单击左侧集群管理,显示当前集群列表,选择需要操作的集群,进入角色管理页面。
角色管理 角色管理功能提供新增角色、删除角色、查看角色权限、修改角色权限等功能。角色管理支持管理用户对库表数据的权限,包括授权和撤销。 创建角色 登录表格存储服务管理控制台。 单击管理控制台左上角的,选择区域。 单击左侧集群管理,显示当前集群列表,选择需要操作的集群,进入角色管理页面。
使用过滤器Filter 功能简介 HBase Filter主要在Scan和Get过程中进行数据过滤,通过设置一些过滤条件来实现,如设置RowKey、列名或者列值的过滤条件。 具体过滤条件根据用户使用场景选取。 代码样例 public void testSingleColumnValueFilter()
动态分区线程的执行频率,默认为600(10分钟),即每10分钟进行一次调度。 max_routine_load_task_concurrent_num 5 否 int 未更改 - (0,10) 5 该参数限制了一个例行导入作业最大的子任务并发数。建议维持默认值。设置过大,可能导致同时并发的任务数过多,占用集群资源。
全部通过clickhouse-jdbc API接口来进行描述。 设置属性:设置连接ClickHouse服务实例的参数属性。 建立连接:建立和ClickHouse服务实例的连接。 创建库:创建ClickHouse数据库。 创建表:创建ClickHouse数据库下的表。 插入数据:插入数据到ClickHouse表中。
conn.getAdmin(); // Obtain the table descriptor. HTableDescriptor htd = admin.getTableDescriptor(tableName); // Check whether the column
conn.getAdmin(); // Obtain the table descriptor. HTableDescriptor htd = admin.getTableDescriptor(tableName); // Check whether the column
【强制】分桶的列不要设置太多,一般情况下1或2个列,同时需要兼顾数据分布均匀和查询吞吐之间的均衡,考虑数据均匀是为了避免某些桶的数据存在倾斜影响数据均衡和查询效率,考虑查询吞吐是为了利用查询SQL的分桶剪裁优化避免全桶扫描提升查询性能,所以优先考虑哪些数据较为均匀且常用于查询条件的列适合做分桶列。
HBase应用场景 消息日志类数据存储和查询 应用场景: 消息数据、报表数据、推荐类数据、风控类数据、日志数据、订单数据等结构化、半结构化的KeyValue数据均可以存储和查询。 优势: 海量存储 支持离线、在线海量KeyValue数据存储,存储容量可扩展。 高性能读写 亿级写入
可以看到,这是一个典型的用户信息和访问行为的事实表。在一般星型模型中,用户信息和访问行为一般分别存放在维度表和事实表中。这里我们为了更加方便的解释Doris的数据模型,将两部分信息统一存放在一张表中。 表中的列按照是否设置了AggregationType,分为Key(维度列)和Value(指标列
功能简介 要从表中读取一条数据,首先需要实例化该表对应的Table实例,然后创建一个Get对象。 可以为Get对象设定参数值,如列族的名称和列的名称。 查询到的行数据存储在Result对象中,Result中可以存储多个Cell。 代码样例 public void testGet()
在执行数据导入Stream Load操作之前,必须确保Doris集群的安全组端口开放,即8030和8040端口,否则Stream Load操作将会连接超时。 创建导入 Stream Load通过HTTP协议提交和传输数据。这里通过curl命令展示如何提交导入。 用户也可以通过其他HTTP client进行操作。
租户命令简介 此章节主要介绍SQL基本语法和使用说明。 新增租户。 create workload group if not exists test_group properties ( "cpu_share"="10", "memory_limit"="30%"
族又可以对应多个列。通常,写入数据的时候,我们需要指定要写入的列(含列族名称和列名称)。HBase通过HTable的put方法来Put数据,可以是一行数据也可以是数据集。 开启冷热分离特性表的写入逻辑和正常表写入逻辑一致。 代码样例 public void testPut() {
数据导入导出 本章节主要介绍使用ClickHouse客户端导入导出文件数据的基本语法和使用说明。 CSV格式数据导入导出 CSV格式数据导入。 非安全集群 cat csv_ssl | ./clickhouse client --host 192.168.x.x --port port
存储规格:高IO,容量500GB/节点 节点数量:2个。 zookeeper节点 计算规格:4U16G。 存储规格:超高io,容量100GB/节点 节点数量:默认3个,不可修改。 计费构成分析 基于此样例,可以详细计算出变更规格前后的消费情况。 表1 变更计费模式 计费模式 计算规则 付费周期 费用计算
HBase热点自愈 HBase是一个分布式的KV数据库,Region是HBase数据管理的最小单元。如果用户在规划表和设计rowkey不合理,请求过于集中在少量固定Region时,会导致业务压力集中在单节点,造成业务侧可感知的性能下降甚至请求失败。 HBase服务增加了Metri