检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
(12 rows) GaussDB(DWS)对SubLink的优化 针对SubLink的优化策略主要是让内层的子查询提升(pullup),能够和外表直接做关联查询,从而避免生成SubPlan+Broadcast內表的执行计划。判断子查询是否存在性能风险,可以通过explain查询
(12 rows) GaussDB(DWS)对SubLink的优化 针对SubLink的优化策略主要是让内层的子查询提升(pullup),能够和外表直接做关联查询,从而避免生成SubPlan+Broadcast內表的执行计划。判断子查询是否存在性能风险,可以通过explain查询
(12 rows) GaussDB(DWS)对SubLink的优化 针对SubLink的优化策略主要是让内层的子查询提升(pullup),能够和外表直接做关联查询,从而避免生成SubPlan+Broadcast內表的执行计划。判断子查询是否存在性能风险,可以通过explain查询
GaussDB(DWS)是云端托管的PB级高并发实时数据仓库,专注于服务OLAP领域,提供按量付费和包年包月两种付费方式。 本次性能测试基于华为云基础环境,分别在同等硬件配置和同等数据规模下,基于TPC-H、TPC-DS标准测试集,对DWS 9.1.0版本和8.3.0版本进行性能对比
ble_skewness等系列视图的查询能够秒级返回结果。 schema空间管控能够统计全量空间,解除当前约束。 user/schema空间管控校准函数能够快速执行,schema空间校准函数自动执行。 schema空间配额的SQL接口能够按照schema总空间分配而非DN级别。 空间管理
GaussDB(DWS)暂不支持跨库访问,可以通过schema进行资源隔离。详情请参见CREATE SCHEMA。 端到端数据分析流程 数据仓库服务与华为云平台其他一系列服务已无缝集成,以便用户能够快速部署端到端的数据分析和解决方案。 端到端数据分析流程如下图所示,该流程展示了每个过程可以使用的云服务。 图2 端到端数据分析流程
2.0及以上集群版本,默认值为light。 autoanalyze_cache_num 参数说明:设置轻量化autoanalyze最多缓存多少张表的统计信息,超过该值后会触发淘汰,淘汰清理前100张表统计信息。该参数仅8.2.0及以上版本支持。 参数类型:SIGHUP 取值范围:整型,100
2表示在1的基础上,使用随机性更优的analyze采样算法,以提高统计信息准确性。 默认值:1 debug_assertions 参数说明:控制打开各种断言检查。能够协助调试,当遇到奇怪的问题或者崩溃,请把此参数打开,因为它能暴露编程的错误。要使用这个参数,必须在编译GaussDB(DWS)的时候定义宏
量数据中寻找少量数据),在对过滤条件列增加索引后,计划依然是Seq Scan而没有走Index Scan。 对目标表ANALYZE后,计划能够自动选择索引,性能从3s+优化到2ms+,极大降低IO消耗。 常见场景:行存大表的查询场景,从大量数据中访问极少数据,没走索引扫描而是走顺
不同类型的业务对资源使用周期有不同的要求,为每一类业务确定合适的计费模式,灵活组合以达到最优效果。 针对长期稳定的成熟业务,使用包年/包月计费模式。 针对不能中断的短期、突增或不可预测的业务,使用按需计费模式。 实现自动化运维 华为云也提供了丰富的运维类产品,帮助您提升运维效率,降低运维的人力成本。例如:
U锁问题: 1 2 3 BEGIN; BEGIN DELETE col where a = 2; 使用HStore表重复上面实验,能够观察到会话2直接执行成功,不会锁等待。 1 2 3 4 BEGIN; BEGIN DELETE hs where a = 2; DELETE
的大小)大小的50%或者30%,并调大磁盘缓存的大小(见下文)。 最小容量: 性能客户:保证每个DN主备各挂载的磁盘容量最少要500G(以达到每块盘350MB/s的带宽),比如一个ECS上部署了2主2备,该机器要至少挂载 4 * 500G 磁盘容量。 成本敏感客户:每个DN主备各
分布列的列值应比较离散,以便数据能够均匀分布到各个DN。例如,考虑选择表的主键为分布列,如在人员信息表中选择身份证号码为分布列。 在满足上面原则的情况下,考虑选择查询中的连接条件为分布列,以便Join任务能够下推到DN中执行,且减少DN之间的通信数据量。 如果找不到一个合适的分布列,使数据能够均匀分布到
_QUERY。 新增query_exception_count_limit参数用于设置作业可以触发的异常规则次数上限,作业触发异常规则次数达到上限后自动加入黑名单,后续禁止执行,只有移除黑名单后才能恢复运行。 新增作业异常信息记录函数: gs_increase_except_num(unique_sql_id
S)服务进行精细的权限管理,您可以使用统一身份认证服务(identity and Access Management,简称IAM),如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用GaussDB(DWS)服务的其它功能。 默认情况下,新
估算,并支持子查询常量输出列进行join时的倾斜优化识别。 默认值:1 debug_assertions 参数说明:控制打开各种断言检查。能够协助调试,当遇到奇怪的问题或者崩溃,请把此参数打开,因为它能暴露编程的错误。要使用这个参数,必须在编译GaussDB(DWS)的时候定义宏
功能且系统能够并发处理的最大任务数。 启用定时任务功能后,job_scheduler线程会在定时时间间隔轮询pg_jobs系统表,系统设置定时任务检查周期默认为1s。 由于并行运行的任务数太多会消耗更多的系统资源,因此需要设置系统并发处理的任务数,当前并发的任务数达到job_qu
估算,并支持子查询常量输出列进行join时的倾斜优化识别。 默认值:1 debug_assertions 参数说明:控制打开各种断言检查。能够协助调试,当遇到奇怪的问题或者崩溃,请把此参数打开,因为它能暴露编程的错误。要使用这个参数,必须在编译GaussDB(DWS)的时候定义宏
分布列的列值应比较离散,以便数据能够均匀分布到各个DN。例如,考虑选择表的主键为分布列,如在人员信息表中选择身份证号码为分布列。 在满足上面原则的情况下,考虑选择查询中的连接条件为分布列,以便Join任务能够下推到DN中执行,且减少DN之间的通信数据量。 如果找不到一个合适的分布列,使数据能够均匀分布到
功能且系统能够并发处理的最大任务数。 启用定时任务功能后,job_scheduler线程会在定时时间间隔轮询pg_jobs系统表,系统设置定时任务检查周期默认为1s。 由于并行运行的任务数太多会消耗更多的系统资源,因此需要设置系统并发处理的任务数,当前并发的任务数达到job_qu