检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
空间始终是1280bytes常数级别。 当前默认规格下可计算最大distinct值的数量为1.6e+12个,误差率最大仅2.3%。用户应注意如果计算结果超过当前规格下distinct最大值会导致计算结果误差率变大,或导致计算结果失败并报错。 用户在首次使用该特性时,应该对业务的distinct
视图涉及全库查并计算非常全面的倾斜字段,所以可能会花费比较长的时间(小时级),建议参考PGXC_GET_TABLE_SKEWNESS视图定义,执行以下操作: 8.1.2及之前集群版本中使用table_distribution()函数自定义输出,减少输出列进行计算优化,例如: 1 2
功能的实现使用户可以根据实际需求动态调整集群CN数量。具体操作如下: 增加CN节点 删除CN节点 该特性仅8.1.1及以上集群版本支持。 在线增删CN以及多CN并行增加仅8.1.3.300及以上集群版本支持(不包含8.2.0版本)。 约束与限制 资源发放时默认CN数量为3,用户可
针对即时的分析需求,分析人员可实时从大数据平台上获取信息。 弹性伸缩 增加节点,即可扩展系统的数据存储能力和查询分析的性能,可支持PB级数据的存储和计算。 增强型ETL和实时BI分析 数据仓库在整个BI系统中起到了支柱的角色,更是海量数据收集、存储、分析的核心。为金融、教育、移动互联网、O2O(Online
定。该索引将在创建索引表的模式中自动创建。 图1 输入:索引 图2 输出:索引 输入:基于CASE函数的索引 函数索引是基于列函数或表达式计算结果创建的索引。 输入 1 2 3 4 5 6 7 8 9 CREATE UNIQUE index GCC_RSRC_ASSIGN_U1
GaussDB(DWS)使用流程 数据仓库服务是一种基于华为云基础架构和平台的在线数据处理数据库,提供即开即用、可扩展且完全托管的分析型数据库服务。GaussDB(DWS)是基于华为融合数据仓库GaussDB产品的云原生服务,兼容标准ANSI SQL 99和SQL 2003,同时
DROP ROLE若提示role is being used by other users错误,可能原因为CLEAN CONNECTION过程存在线程无法及时响应信号,出现连接清理不完全的情况,需要再次执行CLEAN CONNECTION。 DROP对象操作(如DATABASE、USE
分析函数 分析函数根据一组行计算一个聚合值。它与聚集函数的不同之处在于,它为每个组返回多行。分析函数通常用于计算累积值,数据移动值,中间值和报告聚合值。DSC支持分析函数,包括RATIO_TO_REPORT函数。 输入:分析函数 1 2 3 4 5 SELECT empno, ename
offset, count,兼容concat函数。 to_date与to_timestamp处理空串返回NULL。 在线扩容期间支持insert overwrite语法,不阻塞业务。在线扩容后执行分区表exchange partition不会因新增drop列而报错。 适配DLI外表修改。 支持热加载MRS数据源。
9 创建表时必须选择正确的分布方式和分布列 违反规范的影响: 分布式和分布列选择错误,导致表数据存储倾斜,访问性能下降,严重情况会触发存储和计算资源过载。 方案建议: 创建表时通过DISTRIBUTE BY显式指定分布方式和分布列,分布列选择原则如下表所示。 表1 分布列选择原则 分布方式
9 创建表时必须选择正确的分布方式和分布列 违反规范的影响: 分布式和分布列选择错误,导致表数据存储倾斜,访问性能下降,严重情况会触发存储和计算资源过载。 方案建议: 创建表时通过DISTRIBUTE BY显式指定分布方式和分布列,分布列选择原则如下表所示。 表1 分布列选择原则 分布方式
帮助与支持 如果您在使用GaussDB(DWS)产品中遇到任何问题,推荐使用GaussDB(DWS)的智能机器人-小D助手,24小时在线为您服务,解决您的日常问题,当前小D助手能解决日常SQL语法咨询、功能介绍、故障案例、报错信息等Top问题。 如何使用 使用华为云账户登录GaussDB(DWS)管理控制台。
DROP ROLE若提示role is being used by other users错误,可能原因为CLEAN CONNECTION过程存在线程无法及时响应信号,出现连接清理不完全的情况,需要再次执行CLEAN CONNECTION。 DROP对象操作(如DATABASE、USE
和存储倾斜相比,计算倾斜更难以提前识别,因此GaussDB提出了RLBT(Runtime Load Balance Technology)方案,用于解决运行时的计算倾斜问题,该特性由参数skew_option控制。RLBT方案主要分为两个层面,第一步是计算倾斜识别,第二步是计算倾斜解决。下面分别进行介绍。
导入数据最佳实践 从OBS并行导入数据 将导入数据拆分为多个文件 导入大数据量的数据时,通常需要较长的时间及耗费较多的计算资源。 从OBS上导入数据时,如下方法可以提升导入性能:将数据文件存储到OBS前,尽可能均匀地将文件切分成多个,文件的数量为DN的整数倍更适合。 在导入前后验证数据文件
circle 24 字节 圆 <(x,y),r> (圆心和半径) GaussDB(DWS)提供了一系列的函数和操作符用来进行各种几何计算,如拉伸、转换、旋转、计算相交等。详细信息请参考几何函数和操作符。 点 点是几何类型的基本二维构造单位。用下面语法描述point的数值: ( x , y
管理GaussDB(DWS)集群访问域名 概述 域名(Domain Name)是由一串用“点”分隔的字符组成的Internet上某一台计算机或计算机组的名称,如www.example.com。用户在Web浏览器的地址栏输入域名来访问某个网站或者Web应用程序。 GaussDB(D
STATS_AUTO_RECALC STATS_AUTO_RECALC指定是否为InnoDB表自动重新计算持久性统计信息。GaussDB(DWS)不支持该属性,DSC迁移时会将该关键字属性。 输入示例 1 2 3 4 5 6 7 8 9 10 11 12 13 14
GAUSS-04421 -- GAUSS-04430 GAUSS-04421: "standby_rec=%x/%x standby latest record's crc %u and primary corresponding record's crc %u not matched"
数值大小相同的参数使用不同数据类型的哈希函数计算,最后结果会不一样,因为不同类型哈希函数会选取不同的哈希计算策略。 hll_hash_smallint(smallint, int32) 描述:设置hash seed(即改变哈希策略)同时对smallint类型数据计算哈希值。 返回值类型:hll_hashval