检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
因此,在重启前,请确定集群中没有正在运行的任务,并且所有数据都已经保存。 如果集群正在处理业务数据,如导入数据、查询数据,一旦重启集群,有可能会导致文件损坏或重启失败。因此,建议停止所有集群任务后,再重启集群。
可以通过修改log4j.properties文件来实现,如: hbase.root.logger=INFO,console log4j.logger.org.apache.zookeeper=INFO #log4j.logger.org.apache.hadoop.fs.FSNamesystem
显示“浏览文件夹”对话框。如图1所示。 选择样例工程文件夹,单击“Finish”。
了解更多常见问题、案例和解决方案 热门案例 能直接通过ssh访问CloudTable的计算节点吗?
虚拟专用网络(VPN):VPN用于在线下数据中心和云上VPC之间建立一条安全加密的公网通信隧道。更多信息请参见什么是虚拟专用网络章节。 CloudTable集群访问对端集群,需要为集群添加路由。 说明: 路由添加请联系技术人员。
是否开启通道加密 通过https端口和安全tcp端口访问clickhouse,保证客户数据通信加密。 创建集群开启安全通道加密选项,后续无法关闭。 创建集群选择ZooKeeper节点未开启安全通道加密选项,后续可在集群详情页面开启。
数据分区和分桶 Doris支持两层的数据划分。第一层是Partition(分区),支持Range(按范围)和List(按枚举值)的划分方式。第二层是Bucket(分桶),仅支持Hash的划分方式。分区和分桶都是对数据进行横向分隔。 也可以仅使用一层分区。
操作步骤 未开启加密通道的HBase集群 在开发环境中(例如Eclipse中),右击“TestMain.java”,单击“Run as > Java Application”运行对应的应用程序工程。
将“clickhouse-examples\out\artifacts\clickhouse_examples.jar”目录下的所有jar文件和“clickhouse-examples”目录下的“conf”文件夹拷贝到ECS的同一目录下。
创建表有两种方式(强烈建议采用预分Region建表方式): 快速建表,即创建表后整张表只有一个Region,随着数据量的增加会自动分裂成多个Region。 预分Region建表,即创建表时预先分配多个Region,此种方法建表可以提高写入大量数据初期的数据写入速度。
冷热分离概述 CloudTable HBase支持冷热分离功能,将数据分类存储在不同介质上,有效降低存储成本。针对数据使用场景,可以将数据按照时间访问频率分为热数据和冷数据。冷热数据主要从数据访问频率、更新频率划分。
创建数据表开启标签索引 功能介绍 建表功能同创建表,在此基础上,表属性配置标签索引schema。
访问Linux弹性云服务器,建议使用SSH密码方式登录Linux弹性云服务器。 具体登录操作步骤请参见《弹性云服务器用户指南》中的登录Linux弹性云服务器。 访问Windows弹性云服务器,建议使用MSTSC远程桌面连接的方式登录。
HBase应用场景 消息日志类数据存储和查询 应用场景: 消息数据、报表数据、推荐类数据、风控类数据、日志数据、订单数据等结构化、半结构化的KeyValue数据均可以存储和查询。 优势: 海量存储 支持离线、在线海量KeyValue数据存储,存储容量可扩展。
在海量大数据场景下,表中的部分业务数据随着时间的推移仅作为归档数据或者访问频率很低,同时这部分历史数据体量非常大,比如订单数据或者监控数据,如果降低这部分数据的存储成本将会极大的节省企业的成本。 父主题: 开发HBase冷热分离应用
AutoBucket: 根据数据量,计算分桶数。 对于分区表,可以根据历史分区的数据量、机器数、盘数,确定一个分桶。 分桶的数量理论上没有上限。 父主题: 数据分区和分桶
能直接通过ssh访问CloudTable的计算节点吗? 不能。CloudTable的底层计算单元运行在一个VPC网络中,VPC即虚拟私有云,是通过逻辑方式进行网络隔离,提供安全、隔离的网络环境,为您的数据提供了一层保护。
请确认您的弹性云服务器上“/etc/resolv.conf”文件中配置了正确的nameserver,具体配置方法请参见《表格存储服务用户指南》中的准备弹性云服务器。 父主题: 连接访问类
应用背景 CloudTable ClickHouse支持冷热数据分离特性。通过该特性,您可以将冷热数据分别存储在不同类型的存储介质中,以降低存储成本。 Hot(热数据):访问、更新频率较高,未来被调用的概率较高的数据,对访问的响应时间要求很高的数据。
单个Tablet的数据量理论上没有上下界,但建议在1G-10G的范围内。如果单个Tablet数据量过小,则数据的聚合效果不佳,且元数据管理压力大。