检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
助定位问题,处理错误表。 处理数据导入错误 根据获取的错误信息,请对照下表,处理数据导入错误。 表2 处理数据导入错误 错误信息 原因 解决办法 missing data for column "r_reason_desc" 数据源文件中的列数比外表定义的列数少。 对于TEXT格
RT语句,多个类似任务同时执行。 可能产生结果:由于不同线程在不同节点更新顺序可能不同,在存在并发更新同一行的场景里可能会有死锁问题。 解决办法: 减小GUC参数lockwait_timeout值(默认20min)。分布式死锁会等待lockwait_timeout时间然后报错。通
使用此类型语句在指定的DN执行AVG聚集计算时,返回结果集是以数组形式返回,如{4,2},表示sum结果为4,count结果为2。 由于CN节点不存储用户表数据,没有必要指定CN节点执行用户表上的SELECT查询。如果查询语句中含有隐藏的远程调用开启事务逻辑,则会报错“Cannot send
导出文件命名规则 GaussDB(DWS)导出ORC数据的文件命名规则如下: 导出至MRS(HDFS):从DN节点导出数据时,以segment的格式存储在HDFS中,文件命名规则为“mpp_数据库名_模式名_表名称_节点名称_n.orc”。这里的“n”是从0开始按照自然数0、1、2、3递增。
这些业务场景都有一些共同的特点: 数据量庞大,运算量极大。 用户规模庞大,标签多,字段多,占用存储空间也多。 圈选的特征条件多样化,很难找到固定索引,如果每个字段一个索引,存储空间又会暴增。 性能要求高,因为实时营销要求秒级响应。 数据更新时效要求高,用户画像几乎要求实时更新。
这些业务场景都有一些共同的特点: 数据量庞大,运算量极大。 用户规模庞大,标签多,字段多,占用存储空间也多。 圈选的特征条件多样化,很难找到固定索引,如果每个字段一个索引,存储空间又会暴增。 性能要求高,因为实时营销要求秒级响应。 数据更新时效要求高,用户画像几乎要求实时更新。
算法参数password_encryption_type,打开MD5算法。 修改密码的原因:GaussDB(DWS) 中是不会存储您的密码原文的,而是存储的密码HASH摘要(默认是SHA256摘要),在密码校验时该摘要会与客户端发来的密码摘要进行比对(中间会有加盐操作)。故当您只
分布的方式,将业务数据表的元组按合适的分布策略分散存储在所有的DN。 当前产品支持复制(Replication)、散列(Hash)和轮询(Roundrobin)三种用户表分布策略。 Replication方式:在每一个DN上存储一份全量表数据。对于数据量比较小的表建议采取Replication分布策略。
性变更规格等轻量级操作。功能特性具体适用场景如下表所示: 表1 特性功能区别 功能特性 适用场景 备注 扩容 随着您的业务规模扩张,对数据存储容量和性能有更高的要求时,或者集群整体CPU不足时,建议通过扩容集群进行集群节点的扩容 存算一体(单机部署)不支持扩容集群。 缩容 集群容
类型)外,其余的字段定义与对应视图相同,且各表的分布键均为snapshot_id。 例如,SNAP_PGXC_OS_RUN_INFO,用于存储PGXC_OS_RUN_INFO视图的快照,其字段新增了snapshot_id,其余字段含义均与PGXC_OS_RUN_INFO视图相同。
类型)外,其余的字段定义与对应视图相同,且各表的分布键均为snapshot_id。 例如,SNAP_PGXC_OS_RUN_INFO,用于存储PGXC_OS_RUN_INFO视图的快照,其字段新增了snapshot_id,其余字段含义均与PGXC_OS_RUN_INFO视图相同。
二进制类型 GaussDB(DWS)支持的二进制类型请参见表1。 表1 二进制类型 名称 描述 存储空间 BLOB 二进制大对象 目前BLOB支持的外部存取接口仅为: DBMS_LOB.GETLENGTH DBMS_LOB.READ DBMS_LOB.WRITE DBMS_LOB
CONFIGURATION 'confpath']; 参数说明 schema_name 要修改的外部模式的名字。 SOURCE 外部元数据存储引擎的类型,当前source_type仅支持dli,lakeformation,hive。 DATABASE 指定外部SCHEMA所对应的要访问的数据库。
二进制类型 GaussDB(DWS)支持的二进制类型请参见表1。 表1 二进制类型 名称 描述 存储空间 BLOB 二进制大对象 目前BLOB支持的外部存取接口仅为: DBMS_LOB.GETLENGTH DBMS_LOB.READ DBMS_LOB.WRITE DBMS_LOB
使用SQL客户端工具,以管理员用户连接数据库,执行以下命令定期清理和回收存储空间。 1 VACUUM FULL; GaussDB(DWS)数据仓库中保存的数据在删除后,可能没有释放占用的磁盘空间形成脏数据,导致磁盘浪费,建议定期清理存储空间。 建议用户检查磁盘容量,分析现有集群规格是否满足业务
k_mem来设置,可以设置较大的值来使用更大的内存进行排序。 排序的数据量是通过表的存储参数PARTIAL_CLUSTER_ROWS来设置,降低这个数值,可减少一次排序的数据量。这个参数通常与存储参数MAX_BATCHROW配置使用。PARTIAL_CLUSTER_ROWS设置值
"human_resource" DETAIL: User does not have CONNECT privilege. 网络连接故障。 解决办法 系统连接超过最大连接数量。 用户可在GaussDB(DWS) 控制台设置最大连接数max_connections。 max_connections设置方法如下:
ation(默认值为180秒),用于过滤存储过程中执行时间小于该参数的子语句,仅归档执行时间大于该参数的子语句。且从8.2.1版本开始,GUC参数enable_track_record_subsql默认值由off变更为on,默认将会记录存储过程中的子语句。如果一条子语句被记录,那么它必然满足以下几个条件:
k_mem来设置,可以设置较大的值来使用更大的内存进行排序。 排序的数据量是通过表的存储参数PARTIAL_CLUSTER_ROWS来设置,降低这个数值,可减少一次排序的数据量。这个参数通常与存储参数MAX_BATCHROW配置使用。PARTIAL_CLUSTER_ROWS设置值
RT语句,多个类似任务同时执行。 可能产生结果:由于不同线程在不同节点更新顺序可能不同,在存在并发更新同一行的场景里可能会有死锁问题。 解决办法: 减小GUC参数lockwait_timeout值(默认20min)。分布式死锁会等待lockwait_timeout时间然后报错。通