检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
附录 TPC-H测试集 TPC-DS测试集
e时,period不能小于1day。 表级参数ttl不支持单独存在,必须要提前或同时设置period,并且要大于或等于period。 集群在线扩容期间,自动增加分区会失败,但是由于每次增分区时,都预留了足够的分区,所以不影响使用。 创建ECS 参见自定义购买弹性云服务器购买。购买
基因查询优化器 介绍基因查询优化器相关的参数。基因查询优化器(GEQO)是一种启发式的查询规划算法。这个算法减少了对复杂查询规划的时间,而且生成规划的开销有时也小于正常的详尽的查询算法。 geqo 参数说明:控制基因查询优化的使用。 参数类型:USERSET 取值范围:布尔型 on表示使用。
基因查询优化器 介绍基因查询优化器相关的参数。基因查询优化器(GEQO)是一种启发式的查询规划算法。这个算法减少了对复杂查询规划的时间,而且生成规划的开销有时也小于正常的详尽的查询算法。 geqo 参数说明:控制基因查询优化的使用。 参数类型:USERSET 取值范围:布尔型 on表示使用。
基于表结构设计和调优提升GaussDB(DWS)查询性能 调优前:学习表结构设计 步骤1:创建初始表并加装样例数据 步骤2:测试初始表结构下的系统性能并建立基线 步骤3:调优表操作具体步骤 步骤4:创建新表并加载数据 步骤5:测试新的表结构下的系统性能 步骤6:调优表性能评估 附录:表创建语法
64]:打开固定SMP功能,系统会使用固定并行度。 0:打开SMP自适应功能,系统会根据资源情况和计划特征动态为每个查询选取[1,8]之间(x86平台),[1,64]之间(鲲鹏平台)的最优的并行度。 [-64,-1]:打开SMP自适应功能,并限制自适应选取的最大并行度。 对于短查询为主的TP类业务中,如
资源池监控 进入资源池监控页面 登录GaussDB(DWS) 管理控制台。 在“专属集群 > 集群列表”页面,找到需要查看监控的集群。 在指定集群所在行的“操作”列,单击“监控面板”,系统将显示数据库监控页面。 在左侧导航栏选择“监控 > 资源池监控”,进入资源池监控页面。 在资
ADD COLUMN 增加列、DROP COLUMN 删除列、SET TYPE 修改列、TRUNCATE 清空表数据。 Binlog表在线或者离线扩容期间会等待Binlog记录的消费,只有Binlog记录消费完毕才可以继续进行接下来的扩缩容步骤,默认等待时间为1小时,可通过g
表诊断 GaussDB(DWS)提供了集群中数据表关键运行状态的统计数据与诊断工具。其中包括: 表倾斜率:对于集群中数据表统计信息进行监控分析,展示倾斜率高于5%且表大小TOP50的表信息。 表脏页率:对于集群中数据表统计信息进行监控分析,展示脏页率高于50%且表大小TOP50的表信息。
全文检索 介绍 在数据库表中搜索文本 控制文本搜索 附加功能 文本搜索解析器 词典 文本搜索配置示例 测试和调试文本搜索
全文检索 实时数仓(单机部署)暂不支持全文检索功能。 介绍 表和索引 控制文本搜索 附加功能 解析器 词典 配置示例 测试和调试文本搜索 限制约束
使用DLI Flink作业实时同步MySQL数据至(GaussDB)DWS集群 本实践演示如何使用华为云DLI服务的Flink作业,将MySQL数据实时同步到GaussDB(DWS)。 了解DLI请参见数据湖产品介绍。 本实践预计时长60分钟,实践用到的云服务包括虚拟私有云 VPC及子网、云数据库
Thesaurus词典 Thesaurus词典,也叫做分类词典(缩写为TZ),是一组定义了词以及词组间关系的集合,包括广义词(BT)、狭义词(NT)、首选词、非首选词、相关词等。根据词典文件中的定义,TZ词典用一个指定的短语替换对应匹配的所有短语,并且可选择保留原始短语进行索引。
JSON数组(array,最外层由[]构造)导入,但支持JSON对象内部数组的导入。 Hudi即Apache Hudi,是一个事务性数据湖平台。当前版本支持将OBS外表的format参数指定为Hudi来访问相应的Hudi表数据集,并提供访问Hudi表增量/实时视图的方法。 fol
Thesaurus词典 Thesaurus词典,也叫做分类词典(缩写为TZ),是一组定义了词以及词组间关系的集合,包括广义词(BT)、狭义词(NT)、首选词、非首选词、相关词等。根据词典文件中的定义,TZ词典用一个指定的短语替换对应匹配的所有短语,并且可选择保留原始短语进行索引。
使用CDM迁移MySQL数据至GaussDB(DWS)集群 本入门提供通过云数据迁移服务CDM将MySQL数据批量迁移到GaussDB(DWS)集群的指导。 本入门的基本内容如下所示: 迁移前数据检查 创建GaussDB(DWS)集群 创建CDM集群 创建连接 新建作业和迁移 迁移后数据一致性验证
统计信息收集策略 场景 特点 策略 流式增量加工 数据流式增量变化,无合理ANALYZE时机 开启动态采样,查询按需自动收集统计信息,且全局共享 在线批量加工 (数据湖) 数据加工与查询会并发,要求查询稳定 开启动态采样,或一个事务中完成数据加工和ANALYZE。 begin; truncate
GaussDB(DWS)入门实践 当用户完成集群创建后,可以根据自身的业务需求使用GaussDB(DWS)提供的一系列常用实践。 表1 常用最佳实践 实践 描述 数据导入导出 从OBS导入数据到集群 本教程旨在通过演示将样例数据上传OBS,及将OBS的数据导入进GaussDB(D
作业管理 在创建集群实例后,用户可以自定义作业,启用作业,进行数据迁移。 作业分为数据迁移和自动建表: 数据迁移:把kafka中的数据迁移到GaussDB(DWS)中。 自动建表:把源数据库中的表与字段,同步到GaussDB(DWS)中,但不迁移数据。 创建作业 登录GaussDB(DWS)控制台。
配置Oracle数据源连接 数据从Oracle迁移到GaussDB(DWS),首先要配置Oracle数据源连接。 操作步骤 在CDM管理控制台的“集群管理”页面,单击集群操作列的“作业管理”,选择“连接管理 > 驱动管理”。 单击“ORACLE”右侧的“上传”,选择Oracle驱