检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ment(策略权限语句),其中Statement可以有多个,表示不同的授权项。 图1 策略结构 策略语法 在IAM左侧导航窗格中,单击“策略”,单击策略名称,可以查看策略的详细内容,以“DWS ReadOnlyAccess”为例,说明细粒度策略的语法。 图2 设置策略 {
他磁盘,极端情况下会导致集群只读。对于Hash分表策略,存在数据倾斜情况下,查询时出现部分DN的I/O短板,从而影响整体查询性能。合理的选择分布列,并对已经创建的表,进行分布列的调整,对表查询的性能至关重要。 采用Hash分表策略之后需对表的数据进行数据倾斜性检查,以确保数据在各
切换至“快照”页签,再单击二级页签中的“策略列表”。在“策略列表”页面,会展示当前集群所有的策略(包括默认的自动快照策略)。 (可选)单击“自动快照”开关,开启自动快照策略。 表示开启自动创建快照策略,默认为开启状态,保留天数默认为7天。 表示关闭自动创建快照策略,关闭后设置的快照策略不会触发自动快照。
重分布 集群重分布是集群扩容后的一项重要且耗时的任务,集群扩容前业务数据都集中分布在老节点上,扩容之后会新增空的可用节点,此时将老节点的数据均匀分布到新扩容节点的过程称为数据“重分布”,数据“重分布”后将大大提升业务响应速率。 默认情况下,在扩容之后将自动调起重分布任务,为了增强
objects 专属分布式存储池列表对象。 count Integer 专属分布式存储池数量。 表3 DssPool 参数 参数类型 描述 id String 专属分布式存储池ID。 name String 专属分布式存储池名称。 type String 专属分布式存储池的存储类型。 SSD:超高IO专属分布式存储池。
分布式执行框架 GS_235100005 错误码: Stream plan check failed. Execution datanodes list of stream node[%d] mismatch in parent node[%d]. 解决方案:请使用INTERNAL
缺点:每个DN都保留了表的完整数据,数据的冗余,占用更多存储空间。 小表、维度表。 规则2.10 创建表时必须选择正确的存储方式 违反规范的影响: 行存表使用不当导致查询场景性能差,资源过载。 列存表使用不当导致CU膨胀,性能差,资源过载。 方案建议: 创建表时通过orientation参数显式指定表的存储类型,存储类型的选择原则如下表所示。
算力需求和资源负荷情况调整计算和存储资源配置,以达到性能最优和降低成本的目的。 一般分布式架构软件弹性伸缩都涉及如下几个维度: Scale Out(即横向扩展,向外扩展) Scale out代表分布式计算的能力,通过在原有系统上增加节点来扩展存储能力和计算能力。对于DWS数仓来说
BackupStrategyDetail 参数 是否必选 参数类型 描述 policy_id 否 String 策略ID。 policy_name 否 String 策略名称。添加备份策略时为必选字段。 策略名称在4位到92位之间,必须以字母开头,不区分大小写,可以包含字母、数字、中划线或者下划线,不能包含其他特殊字符,并且名称唯一。
删除快照策略 功能介绍 该接口用于删除一个快照策略。 调用方法 请参见如何调用API。 URI DELETE /v1.0/{project_id}/clusters/{cluster_id}/snapshot-policies/{id} 表1 路径参数 参数 是否必选 参数类型 描述
TABLESPACE对象设计规范 规则2.8 禁止自定义TABLESPACE表空间 违反规则的影响: 分布式场景建表使用自定义表空间,导致表数据无法按照各DN分布式存储,出现存储倾斜。 方案建议: 创建表对象使用内置默认表空间。 父主题: GaussDB(DWS)对象设计规范
策略语法:RBAC 策略结构 策略结构包括:策略版本号(Version)、策略授权语句(Statement)和策略依赖(Depends)。 图1 RBAC策略结构 策略语法 给用户组选择策略时,单击策略下方的,可以查看策略的详细内容,以“DWS Administrator”为例,说明RBAC策略的语法。
BackupStrategyDetail 参数 参数类型 描述 policy_id String 策略ID。 policy_name String 策略名称。 backup_strategy String 执行策略。 backup_type String 备份类型: full:全量。 increment:增量。
目前,GaussDB(DWS)优化器在分布式框架下制定语句的执行策略时,有三种执行计划方式:生成下推语句计划、生成分布式执行计划、生成发送语句的分布式执行计划。 下推语句计划:指直接将查询语句从CN发送到DN进行执行,然后将执行结果返回给CN。 分布式执行计划:指CN对查询语句进行编译
asp。 选择存储方式 表的存储模型选择是表定义的第一步。业务属性是表的存储模型的决定性因素,根据下表选择适合当前业务的存储模型。 一般情况下,如果表的字段比较多(大宽表),查询中涉及到的列不多的情况下,适合列存储。如果表的字段个数比较少,查询大部分字段,那么选择行存储比较好。 存储模型
缺点:每个DN都保留了表的完整数据,数据的冗余,占用更多存储空间。 小表、维度表。 规则2.10 创建表时必须选择正确的存储方式 违反规范的影响: 行存表使用不当导致查询场景性能差,资源过载。 列存表使用不当导致CU膨胀,性能差,资源过载。 方案建议: 创建表时通过orientation参数显式指定表的存储类型,存储类型的选择原则如下表所示。
TABLESPACE对象设计规范 规则2.8 禁止自定义TABLESPACE表空间 违反规则的影响: 分布式场景建表使用自定义表空间,导致表数据无法按照各DN分布式存储,出现存储倾斜。 方案建议: 创建表对象使用内置默认表空间。 父主题: GaussDB(DWS)对象设计规范
步骤3:调优表操作具体步骤 选择存储方式 此实践中所使用的样例表为典型的TPC-DS表,是典型的多字段表,统计分析类查询场景多,因此选择列存存储方式。 1 WITH (ORIENTATION = column) 选择压缩级别 在步骤1:创建初始表并加装样例数据中没有指定压缩比,
目前,GaussDB(DWS)优化器在分布式框架下制定语句的执行策略时,有三种执行计划方式:生成下推语句计划、生成分布式执行计划、生成发送语句的分布式执行计划。 下推语句计划:指直接将查询语句从CN发送到DN进行执行,然后将执行结果返回给CN。 分布式执行计划:指CN对查询语句进行编译
PGXC_DEADLOCK PGXC_DEADLOCK视图获取导致分布式死锁产生的锁等待信息。 目前,PGXC_DEADLOCK视图只收集locktype为relation、partition、page、tuple和transactionid的锁等待信息。 表1 PGXC_DEADLOCK字段