检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用SQL客户端工具连接:支持gsql、Data Studio。 • 使用JDBC/ODBC连接。 • 使用SQL编辑器连接。 • 使用Python第三方库psycopg2、PyGreSQL连接。 发布区域:全部 连接DWS集群 使用gsql命令行客户端连接集群 使用Data Studio图形界面客户端连接集群
dictionary:regdictionary类型,用来识别token的词典。如果为空,则不做识别。 lexemes:text数组类型,词典识别token时生成的词素。如果为空,则不生成词素。空数组({})意味着token将被识别成停用词。 一个简单的例子: 1 2 3 4
准备需要导入数据库的源数据文件,并上传至数据服务器。 详细内容请参见准备源数据。 启动GDS。 在数据服务器上安装配置并启动GDS。 详细内容请参见安装配置和启动GDS。 创建外表。 创建外表用于识别数据源文件中的数据。外表中保存了数据源文件的位置、文件格式、存放位置、编码格式、数据间的分隔符等信息。
'0x0a' ,file_type 'pipe',auto_create_pipe 'false'); GDS启用‐r递归参数时只识别一个管道文件,即GDS只会识别当前数据目录下的一个管道文件而不会递归寻找,因此-r参数在管道文件导入导出场景下不生效。 管道文件的导入导出不支持CN Re
for encoding '%s': %s" SQLSTATE: 22021 错误原因:无法识别的字符序列。 解决办法:请参考PostgreSQL中文文档中“字符集支持”小节检查数据中是否有无法识别的字符编码。 GAUSS-02607: "character with byte sequence
步骤2:测试初始表结构下的系统性能并建立基线 在优化表结构前后,请测试和记录以下详细信息以对比系统性能差异: 数据加载时间。 表占用的存储空间大小。 查询性能。 本次实践中的示例基于使用8节点的dws.d2.xlarge集群。因为系统性能受到许多因素的影响,即使您使用相同的集群配置,结果也会有所不同。
错误原因:不识别copy中fix选项的值。 解决办法:检查copy参数fix是否正确。 GAUSS-01175: "option '%s' not recognized" SQLSTATE: 42601 错误原因: 不识别copy中某个选项的值。 解决办法:检查copy中该不识别的参数是否正确。
GAUSS-01372: "unrecognized deserialize_deflist state: %d" SQLSTATE: XX000 错误原因:无法识别全文检索目录反序列化过程状态机。 解决办法:内部错误,请联系技术支持工程师提供技术支持。 GAUSS-01373: "Unexpected
本搜索类型。不同的是基本tsquery以token表面值作为输入,而to_tsquery使用指定或默认分词器将每个token标准化成词素,并依据分词器丢弃属于停用词的token。例如: 1 2 3 4 5 SELECT to_tsquery('english', 'The & Fat
本搜索类型。不同的是基本tsquery以token表面值作为输入,而to_tsquery使用指定或默认分词器将每个token标准化成词素,并依据分词器丢弃属于停用词的token。例如: 1 2 3 4 5 SELECT to_tsquery('english', 'The & Fat
false:不忽略所有的标点等特殊符号。 seg_with_duality 是否将闲散文字自动以二字分词法聚合。 true:将闲散文字自动以二字分词法聚合。 false(默认值):不将闲散文字自动以二字分词法聚合。 multi_short 分词执行时是否执行针对长词复合切分。 t
false:不忽略所有的标点等特殊符号。 seg_with_duality 是否将闲散文字自动以二字分词法聚合。 true:将闲散文字自动以二字分词法聚合。 false(默认值):不将闲散文字自动以二字分词法聚合。 multi_short 分词执行时是否执行针对长词复合切分。 t
false:不忽略所有的标点等特殊符号。 seg_with_duality 是否将闲散文字自动以二字分词法聚合。 true:将闲散文字自动以二字分词法聚合。 false(默认值):不将闲散文字自动以二字分词法聚合。 multi_short 分词执行时是否执行针对长词复合切分。 t
集群服务端口,取值范围为8000~30000,默认值:8000。 name 是 String 集群名称,要求唯一性,必须以字母开头并只包含字母、数字、中划线或下划线,长度为4~64个字符且不超过64个字节,1个中文字符为3个字节,其他字符为1个字节。 user_name 是 String DWS集群管理员用户名。用户命名要求如下:
本搜索类型。不同的是基本tsquery以token表面值作为输入,而to_tsquery使用指定或默认分词器将每个token标准化成词素,并依据分词器丢弃属于停用词的token。例如: 1 2 3 4 5 SELECT to_tsquery('english', 'The & Fat
如何处理? 原因分析 存储在OBS中的源文件含有非UTF-8的数据。 处理方法 排查报错的源文件,检查是否含有非UTF-8的数据,例如中文字符。如果源文件中含有非UTF-8的数据,请先将源文件转换成UTF-8的格式,并重新上传到OBS,然后再执行导入数据的操作。 父主题: 数据导入/导出
XX000 错误原因:不可识别的模式。 解决办法:请使用normal,shared,private模式,再次执行操作。 GAUSS-03989: "LOAD format '%s' not recognized" SQLSTATE: 22023 错误原因:不可识别的模式。 解决办法:请
本章通过介绍性能调优最基本的数据库命令ANALYZE和EXPLAIN,来详细解读EXPLAIN展示的数据库执行计划,介绍如何通过执行计划了解数据库的执行过程、识别性能瓶颈,针对性调优。另外,通过介绍性能参数、典型应用场景、SQL诊断、SQL性能调优和SQL改写案例等性能调优的实际操作,为数据库性能调优提供全方位的参考指导。
审视和修改表定义 SQL调优进阶 使用Plan Hint进行调优 例行维护表 例行重建索引 SQL语句出错自动重试 query_band负载识别 父主题: GaussDB(DWS)性能调优
"unrecognized operator type: %d" SQLSTATE: XX000 错误原因:输入了错误的操作符。 解决办法:检查输入的操作符,只识别! | & 三种。 GAUSS-03214: "unrecognized tsquery node type: %d" SQLSTATE: