检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
企业经营分析。 在企业经营分析中,把规模庞大的业务数据导入到云数据仓库ClickHouse,对数亿记录或更大规模的大宽表和数百维度的查询,都能在亚秒级内响应,得到查询结果。让客户随时进行个性化统计和不间断的分析,辅助商业决策。 访客来源分析展示。 通过批量离线计算对用户访问日志中的用户行为
Schema中字段数比较多, 聚合模型中可能key列比较多, 导入过程中需要排序的列会增加。 维度信息更新会反应到整张表中,而更新的频率直接影响查询的效率。 使用过程中,建议用户尽量使用Star Schema区分维度表和指标表。频繁更新的维度表也可以放在MySQL外部表中。而如果只有少量更新
可正常使用。 删除HBase按需集群 登录表格存储服务管理控制台。 单击管理控制台左上角的,选择区域。 选中需要删除的集群名,在对应的“操作”列中,单击“ 更多 > 删除”。 在弹出的对话框中,输入“DELETE”或者单击“一键输入”,输入后单击“确定”,删除集群。 图1 确认删除窗口
default: 1" ); 可以看到,这是一个典型的用户信息和访问行为的事实表。在一般星型模型中,用户信息和访问行为一般分别存放在维度表和事实表中。这里我们为了更加方便的解释Doris的数据模型,将两部分信息统一存放在一张表中。 表中的列按照是否设置了AggregationType,
多节点:选择集群中的节点个数,支持的节点范围为2~20之间。 单节点个数默认为1。 表4 ZooKeeper节点参数说明 参数 参数说明 计算规格 请根据业务需求合理选择计算规格。在计算规格列表中展示了每一种计算规格单个节点的CPU、内存和建议使用场景。 说明: 支持的计算规格: 4U16G。
续费相关的功能 包年/包月云服务器续费相关的功能如表1所示。 表1 续费相关的功能 功能 说明 手动续费 包年/包月云服务器从购买到被自动删除之前,您可以随时在CloudTable控制台为集群续费,以延长云服务器的使用时间。 自动续费 开通自动续费后,CloudTable会在每次
Doris暂不支持使用Catalog对接数据存储在并行文件系统的OBS MRS Hive集群 。 创建MRS Hive连接步骤 登录表格存储服务管理控制台。 用户在CloudTable集群管理界面,选择需要操作的集群进入集群详情页面。 单击tab页中的“连接设置”,弹出连接页面。 单击左上角“新建连接”创建MRS
功能分解 根据上述的业务场景进行功能分解,需要开发的功能点如表1所示。 表1 在HBase中开发的功能 序号 步骤 代码实现 1 根据典型场景说明中的信息创建表。 请参见创建表。 2 导入用户数据。 请参见插入数据。 3 增加“教育信息”列族,在用户信息中新增用户的学历、职称等信息。
Doris暂不支持使用Catalog对接数据存储在并行文件系统的OBS MRS Hive集群 。 创建MRS Hive连接步骤 登录表格存储服务管理控制台。 用户在CloudTable集群管理界面,选择需要操作的集群进入集群详情页面。 单击tab页中的“连接设置”,弹出连接页面。 单击左上角“新建连接”创建MRS
单击确定后,集群状态变更为“亚健康”,任务状态为“规格变更中”,当集群变更完毕后,集群状态更新为“服务中”,任务状态清空。 规格变更状态 表1 规格变更任务状态说明 状态 说明 规格变更中 表示集群正在变更中。 服务中 当集群变更成功并正常提供服务时,其集群状态为服务中。 规格变更失败 表示集群变更失败。
完毕后进入新的计费周期。计费的起点以CloudTable集群创建成功的时间点为准,终点以实例删除时间为准。 云服务器从创建到启动需要一定时长,计费的起点是创建成功的时间点,而非创建时间。您可以在云服务器详情页“基本信息”页签查看这两个时间,创建成功的时间点对应界面上的“启动时间”。
l是用户在导入命令中自定义的名称。通过这个label,用户可以查看对应导入任务的执行情况。 label的另一个作用,是防止用户重复导入相同的数据。强烈推荐用户同一批次数据使用相同的 label。这样同一批次数据的重复请求只会被接受一次,保证了At-Most-Once。当label
查看调测结果 运行结果中没有异常或失败信息即表明运行成功。 图1 运行成功 在Windows环境运行样例代码时会出现下面的异常,但是不影响业务: java.io.IOException: Could not locate executable null\bin\winutils.exe
开发思路 功能分解 根据上述的业务场景进行功能分解,需要开发的功能点如表1所示。 表1 在HBase中开发冷热分离的功能 序号 步骤 代码实现 1 根据典型场景说明中的信息创建表。 请参见创建表。 2 写入数据。 请参见插入数据。 4 根据城市、区域、时间查询温度和湿度。 请参见使用Get读取数据。
使用SELECT的结果写入。 INSERT INTO [db.]table [(c1, c2, c3)] SELECT ... 写入的列与SELECT的列的对应关系是使用位置来进行对应的,它们在SELECT表达式与INSERT中的名称可以是不同的。需要对它们进行对应的类型转换。 除
集群的名称,创建集群时设置。 集群ID 集群的ID。 集群状态 集群状态信息。 已使用存储容量(GB) 显示已经使用的存储容量。 计费模式 显示集群的计费模式。 集群版本 集群内核版本。 创建时间 显示集群创建的时间。 企业项目 企业项目管理帮助您将相关的资源(如具有相同使用用途的资源)集中在一起,按企业项目的方式来管理云资源。
部分数据的存储成本将会极大的节省企业的成本。 原理介绍 CloudTable HBase支持对同一张表的数据进行冷热分离存储。用户在表上配置数据冷热时间分界点后,HBase会依赖用户写入数据的时间戳(毫秒)和时间分界点来判断数据的冷热。数据开始存储在热存储上,随着时间的推移慢慢往
HBase通过加载配置文件来获取配置项。 加载配置文件是一个比较耗时的操作,如非必要,请尽量使用同一个Configuration对象。 样例代码未考虑多线程同步的问题,如有需要,请自行增加。其它样例代码也一样,不再一一进行说明。 代码样例 下面代码片段在com.huawei.cloudtable.lemonIndex
缩能力,方便用户在性能或容量需要改变时,改变集群资源,轻松构建企业海量数据存储系统。 实时查询。 HBase的列式KeyValue存储机制,适用于企业用户明细数据即时查询,基于主键的低时延点查,响应时延一般为秒级或毫秒级,方便用户对数据的实时分析。 HBase的架构和详细原理介绍,请参见:https://hbase
ClickHouse集群名] 在每一个节点上都创建一个视图,固定为ON CLUSTER ClickHouse集群名。 SELECT ... SELECT子句。当数据写入视图中SELECT子句所指定的源表时,插入的数据会通过SELECT子句查询进行转换并将最终结果插入到视图中。 示例: 创建源表。