检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
表诊断 GaussDB(DWS)提供了集群中数据表关键运行状态的统计数据与诊断工具。其中包括: 表倾斜率:对于集群中数据表统计信息进行监控分析,展示倾斜率高于5%且表大小TOP50的表信息。 表脏页率:对于集群中数据表统计信息进行监控分析,展示脏页率高于50%且表大小TOP50的表信息。
GAUSS-01151 -- GAUSS-01160 GAUSS-01151: "COPY_FILE_SEGMENT does not implement in CopySendEndOfRow" SQLSTATE: XX000 错误原因:Copy to指定的目标数据源不支持。 解决办法:请修改Copy
EXPLAIN 功能描述 显示SQL语句的执行计划。 执行计划将显示SQL语句所引用的表采用的扫描方式,如:简单的顺序扫描、索引扫描等。如果引用了多个表,执行计划还会显示使用的JOIN算法。 执行计划的最关键部分是语句的预计执行开销,即计划生成器估算执行该语句将花费多长的时间。
如何使用GaussDB(DWS)的\copy导入导出? 由于云上GaussDB(DWS)是全托管服务,用户无法登录后台,无法使用copy进行导入导出文件,所以云上将copy语法禁掉。云上推荐将数据文件放到obs上,使用obs外表进行入库,如果需要使用copy导入导出数据,可以参考如下方法:
CURSOR 功能描述 CURSOR命令定义一个游标,用于在一个大的查询里面检索少数几行数据。 为了处理SQL语句,存储过程进程分配一段内存区域来保存上下文联系。游标是指向上下文区域的句柄或指针。借助游标,存储过程可以控制上下文区域的变化。 注意事项 游标命令只能在事务块里使用。
PG_STATISTIC_EXT PG_STATISTIC_EXT系统表存储有关该数据库中表的扩展统计数据。收集的扩展统计数据范围由用户指定,需要有系统管理员权限才可以访问此系统表。 表1 PG_STATISTIC_EXT字段 名称 类型 描述 starelid oid 所描述的字段所属的表或者索引。
设置 synchronous_commit 参数说明:设置当前事务的同步方式。 参数类型:USERSET 取值范围:枚举类型 on表示将备机的同步日志刷新到磁盘。 off表示异步提交。 local表示为本地提交。 remote_write表示要备机的同步日志写到磁盘。 remot
附录:表创建语法 本节所附为调优表实践中使用到的SQL测试语句,推荐您将每节的SQL语句拷贝并另存为.sql文件。例如,创建一个包含“创建初始表”SQL语句的create_table_fir.sql文件。创建后使用SQL客户端工具执行.sql文件效率更高,且利于统计用例的总耗费时间。使用gsql运行
SQL调优流程 对慢SQL语句进行分析,通常包括以下步骤: 操作步骤 收集SQL中涉及到的所有表的统计信息。在数据库中,统计信息是规划器生成计划的源数据。没有收集统计信息或者统计信息陈旧会造成执行计划严重劣化,从而导致性能问题。从经验数据来看,10%左右性能问题是因为没有收集统计信息。具体请参见更新统计信息。
EXPLAIN 功能描述 显示SQL语句的执行计划。 执行计划将显示SQL语句所引用的表采用的扫描方式,如:简单的顺序扫描、索引扫描等。如果引用了多个表,执行计划还会显示使用的JOIN算法。 执行计划的最关键部分是语句的预计执行开销,即计划生成器估算执行该语句将花费多长的时间。
SQL调优流程 对慢SQL语句进行分析,通常包括以下步骤: 操作步骤 收集SQL中涉及到的所有表的统计信息。在数据库中,统计信息是规划器生成计划的源数据。没有收集统计信息或者统计信息陈旧会造成执行计划严重劣化,从而导致性能问题。从经验数据来看,10%左右性能问题是因为没有收集统计信息。具体请参见更新统计信息。
配置LLVM LLVM(Low Level Virtual Machine)动态编译技术可以为每个查询生成定制化的机器码用于替换原本的通用函数。通过减少实际查询时冗余的条件逻辑判断、虚函数调用并提高数据局域性,从而达到提升查询整体性能的目的。 由于LLVM需要消耗额外的时间预生成
冷热表用户函数 pg_obs_cold_refresh_time(table_name, time) 描述:用来修改冷热表的冷数据切换至OBS上的时间,默认为每日0点。 table_name为冷热表的表名,类型为name,time为数据切换任务调度时间,类型为Time。 返回值:SUCCESS,任务时间修改成功。
PG_STATISTIC_EXT PG_STATISTIC_EXT系统表存储有关该数据库中表的扩展统计数据。收集的扩展统计数据范围由用户指定,需要有系统管理员权限才可以访问此系统表。 表1 PG_STATISTIC_EXT字段 名称 类型 描述 starelid oid 所描述的字段所属的表或者索引。
数据倾斜调优 数据倾斜问题是分布式架构的重要难题,它破坏了MPP架构中各个节点对等的要求,导致单节点(倾斜节点)所存储或者计算的数据量远大于其他节点,所以会造成以下危害: 存储上的倾斜会严重限制系统容量,在系统容量不饱和的情况下,由于单节点倾斜的限制,使得整个系统容量无法继续增长。
Teradata SQL配置 设置Teradata配置参数可在迁移Teradata数据库脚本时自定义迁移工具的行为。 打开config文件夹中的features-teradata.properties文件,并根据实际需要设置表1中的参数。 表1 features-teradata
SQL语句出错自动重试 GaussDB(DWS)支持在SQL语句执行出错时自动重试(下文简称CN Retry)。对于来自gsql客户端、JDBC、ODBC驱动的SQL语句,在SQL语句执行失败时,CN端能够自动识别语句执行过程中的报错,并重新下发任务进行自动重试。 该功能的限制和约束如下:
快速入门 本节通过调用一系列API,以集群管理为例,介绍使用GaussDB(DWS) API的基本流程。集群管理的流程如下: 调用认证鉴权获取用户的Token,因为在后续的请求中需要将Token放到请求消息头中作为认证。 调用查询节点类型接口获取支持的节点类型。 调用创建集群接口创建集群。
SQL语句出错自动重试 GaussDB(DWS)支持在SQL语句执行出错时自动重试(下文简称CN Retry)。对于来自gsql客户端、JDBC、ODBC驱动的SQL语句,在SQL语句执行失败时,CN端能够自动识别语句执行过程中的报错,并重新下发任务进行自动重试。 该功能的限制和约束如下:
数据倾斜调优 数据倾斜问题是分布式架构的重要难题,它破坏了MPP架构中各个节点对等的要求,导致单节点(倾斜节点)所存储或者计算的数据量远大于其他节点,所以会造成以下危害: 存储上的倾斜会严重限制系统容量,在系统容量不饱和的情况下,由于单节点倾斜的限制,使得整个系统容量无法继续增长。