检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Studio服务创建GaussDB(DWS)的OBS外表,并且在创建外表语句中指定OBS文件编码格式是UTF-8,但是导入数据时报错,如何处理? 原因分析 存储在OBS中的源文件含有非UTF-8的数据。 处理方法 排查报错的源文件,检查是否含有非UTF-8的数据,例如中文字符。如果源文件中含有非UTF-8的数据,请
使后续的搜索更快速。预处理过程包括: 将文档解析成token。 为每个文档标记不同类别的token是非常有必要的,例如:数字、文字、复合词、电子邮件地址,这样就可以针对不同类别做不同的处理。原则上token的类别依赖于具体的应用,但对于大多数的应用来说,可以使用一组预定义的token类。
0rc1/tools目录后,执行以下命令生成数据。 因为tpcds 1000X的数据,单个表的数据文件较大,我们采取分片生成的策略。 Tpcds 1000X数据文件总大小约930GB,请确认ECS的磁盘空间足够。 由于生成的数据较大,只启动一个GDS导入数据会比较慢,建议均分两个数据盘来生成
低。 处理方式: 对按照时间特征存储和访问的大表设计成分区表。 分区键一般选离散度高、常用于查询过滤条件中的时间类型的字段。 分区间隔一般参考高频的查询所使用的间隔,需要注意的是针对列存表,分区间隔过小(例如按小时)可能会导致小文件过多的问题,一般建议最小间隔为按天。 场景6:行存表求count值
使用GDS从远端服务器上导入表数据到GaussDB(DWS)集群 教程指引 本教程旨在演示使用GDS(General Data Service)工具将远端服务器上的数据导入GaussDB(DWS)中的过程,帮助您学习如何通过GDS进行数据导入的方法。 GaussDB(DWS)支持
42601 错误原因:非hash分布的表的分布列不能超过1。 解决办法:修改建表语句,指定一个列作为分布列。 GAUSS-04415: "Compatibility args %s is invalid\n" SQLSTATE: 22023 错误原因:指定的兼容行参数不对。 解决办法:指定参数为'ORA'或者'TD'。
将hdfs上的数据写入到管道文件而不需要占用额外的磁盘空间。 当用户导入前需要清洗数据时,用户可以根据自己的需求编写程序,将需要处理的数据流式实时的写入管道文件,完成导入的数据清洗工作。 当前版本暂不支持SSL模式下GDS导入,请勿以SSL方式使用GDS。 本章涉及的所有管道文件都是指Linux上的命名管道。
此视图是建立分区表的某个分区上的,查询此视图时需要访问到对应的分区,从而必须首先查询对应的分区是否存在。当对应的分区已经被删除后,无法访问到此分区,从而导致视图访问也失败,报出如上类似的信息。 解决办法 确定是针对视图对象进行的SQL操作,并获得视图的名字。 直接检查SQL语句的FROM对
dictionary:regdictionary类型,用来识别token的词典。如果为空,则不做识别。 lexemes:text数组类型,词典识别token时生成的词素。如果为空,则不生成词素。空数组({})意味着token将被识别成停用词。 一个简单的例子: 1 2 3 4 5 6 7 8
解决办法:视图没有真正的存储,定义视图时不能指定为UNLOGGED。 GAUSS-00562: "unrecognized value for EXPLAIN option '%s': '%s'" SQLSTATE: 22023 错误原因:EXPLAIN FORMAT的参数无法识别。 解决办
dictionary:regdictionary类型,用来识别token的词典。如果为空,则不做识别。 lexemes:text数组类型,词典识别token时生成的词素。如果为空,则不生成词素。空数组({})意味着token将被识别成停用词。 一个简单的例子: 1 2 3 4 5 6 7 8
创建分区表 分区是指根据特定方案将逻辑上的一个大表分成较小的物理片区。基于该逻辑的表称为分区表,物理片区称为分区。数据不存储在较大的逻辑分区表上,而是这些较小的物理分区上。 执行以下步骤在数据库中定义表: 在“对象浏览器”窗格中,右键单击“普通表”,选择“创建分区表”。 定义基本
tribute的计划;如果不同,且另一表分布列与join列相同,只能生成redistribute的计划,不会生成broadcast的计划,指定相应的hint则不会被使用。 对于AGG重分布列的hint,hint未被使用的可能原因如下: 指定的分布键包含不支持重分布的数据类型。 执行计划中不需要重分布。
tribute的计划;如果不同,且另一表分布列与join列相同,只能生成redistribute的计划,不会生成broadcast的计划,指定相应的hint则不会被使用。 对于AGG重分布列的hint,hint未被使用的可能原因如下: 指定的分布键包含不支持重分布的数据类型。 执行计划中不需要重分布。
GS_WAIT_EVENTS GS_WAIT_EVENTS视图显示当前节点上各类等待状态和事件的统计信息。 仅在GUC参数enable_track_wait_event为on的情况下,视图中各统计字段的数值才会被累加。若在运行过程中将enable_track_wait_event
22023 错误原因:数据中出现异常终止符。 解决办法:请检查复制的数据中终止符是否正确。 GAUSS-01174: "invalid value of FIX" SQLSTATE: 22023 错误原因:不识别copy中fix选项的值。 解决办法:检查copy参数fix是否正确。 GAUSS-01175:
通过CN节点查看PGXC_THREAD_WAIT_STATUS视图,可以查看集群全局各个节点上所有SQL语句产生的线程之间的调用层次关系,以及各个线程的阻塞等待状态,从而更容易定位进程停止响应问题以及类似现象的原因。 PGXC_THREAD_WAIT_STATUS视图和PG_THREAD_W
可以在文本搜索配置中定义一个解析器,以及一组用于处理该解析器的输出标记词典。对于解析器返回的每个标记类型,可以在配置中指定不同的词典列表进行处理。当解析器输出一种类型的标记后,在对应列表的每个词典中会查阅该标记,直到某个词典识别它。如果它被识别为一个停用词, 或者没有任何词典识别,该token将被丢弃,即不被
存储资源:资源池的存储空间。 磁盘使用率:资源池的实时磁盘使用率。 内存资源:资源池的内存配置的百分比。 内存使用率:资源池实时内存使用率。 实时简单语句并发:资源池的简单查询并发数使用量(判定为简单并发的查询不受资源池的管控)。 简单语句并发:资源池的简单并发数配额。 实时复杂
可以在文本搜索配置中定义一个解析器,以及一组用于处理该解析器的输出标记词典。对于解析器返回的每个标记类型,可以在配置中指定不同的词典列表进行处理。当解析器输出一种类型的标记后,在对应列表的每个词典中会查阅该标记,直到某个词典识别它。如果它被识别为一个停用词, 或者没有任何词典识别,该token将被丢弃,即不被