检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
词典进行解决。 实时数仓(单机部署)暂不支持全文检索功能。 文本检索缺乏信息系统所要求的必要属性: 没有语义支持,即使是英语也是如此。 要识别派生词并不是那么容易,即使正则表达式也不能满足要求。例如satisfies和satisfy,当使用正则表达式寻找satisfy时,并不会查
面分别进行介绍。 倾斜识别 计算倾斜的识别,即预先识别计算过程中的重分布列是否存在倾斜数据。RLBT方案中给出了三个解决手段,统计信息识别,hint方式指定以及规则识别: 统计信息识别 需要用户先执行ANALYZE收集各表的统计信息,然后优化器能够自动利用统计信息对重分布键上的倾
使用gsql命令行客户端连接 使用Data Studio客户端连接 使用JDBC/ODBC连接 使用IAM认证方式连接 使用Python第三方库psycopg2连接集群 使用Python第三方库PyGreSQL连接集群 集群运维 创建DWS 2.0集群 创建DWS 3.0集群 修改集群参数 备份与恢复
FORMAT的参数无法识别。 解决办法:FORMAT参数只能是text、xml、json、yaml之一。 GAUSS-00563: "unrecognized EXPLAIN option '%s'" SQLSTATE: 42601 错误原因:EXPLAIN的参数无法识别。 解决办法:E
XX000 错误原因:lock method不识别。 解决办法:请联系技术支持工程师提供技术支持。 GAUSS-04089: "unrecognized lock mode: %d" SQLSTATE: XX000 错误原因:lock mode不识别。 解决办法:请联系技术支持工程师提供技术支持。
dictionary:regdictionary类型,用来识别token的词典。如果为空,则不做识别。 lexemes:text数组类型,词典识别token时生成的词素。如果为空,则不生成词素。空数组({})意味着token将被识别成停用词。 一个简单的例子: 1 2 3 4
dictionary:regdictionary类型,用来识别token的词典。如果为空,则不做识别。 lexemes:text数组类型,词典识别token时生成的词素。如果为空,则不生成词素。空数组({})意味着token将被识别成停用词。 一个简单的例子: 1 2 3 4
dictionary:regdictionary类型,用来识别token的词典。如果为空,则不做识别。 lexemes:text数组类型,词典识别token时生成的词素。如果为空,则不生成词素。空数组({})意味着token将被识别成停用词。 一个简单的例子: 1 2 3 4
错误原因:不识别copy中fix选项的值。 解决办法:检查copy参数fix是否正确。 GAUSS-01175: "option '%s' not recognized" SQLSTATE: 42601 错误原因: 不识别copy中某个选项的值。 解决办法:检查copy中该不识别的参数是否正确。
sql兼容模式下才能正确导出(导入)。 相关概念 数据源文件:存储有数据的TEXT、CSV文件。 OBS:对象存储服务,是一种可存储文档、图片、影音视频等非结构化数据的云存储服务。从GaussDB(DWS)并行导出数据时,数据对象放置在OBS服务器上。 桶(Bucket):对OB
配置中指定不同的词典列表进行处理。当解析器输出一种类型的标记后,在对应列表的每个词典中会查阅该标记,直到某个词典识别它。如果它被识别为一个停用词, 或者没有任何词典识别,该token将被丢弃,即不被索引或检索到。通常情况下,第一个返回非空结果的词典决定了最终结果,后继词典将不会继
for encoding '%s': %s" SQLSTATE: 22021 错误原因:无法识别的字符序列。 解决办法:请参考PostgreSQL中文文档中“字符集支持”小节检查数据中是否有无法识别的字符编码。 GAUSS-02607: "character with byte sequence
配置中指定不同的词典列表进行处理。当解析器输出一种类型的标记后,在对应列表的每个词典中会查阅该标记,直到某个词典识别它。如果它被识别为一个停用词, 或者没有任何词典识别,该token将被丢弃,即不被索引或检索到。通常情况下,第一个返回非空结果的词典决定了最终结果,后继词典将不会继
配置中指定不同的词典列表进行处理。当解析器输出一种类型的标记后,在对应列表的每个词典中会查阅该标记,直到某个词典识别它。如果它被识别为一个停用词, 或者没有任何词典识别,该token将被丢弃,即不被索引或检索到。通常情况下,第一个返回非空结果的词典决定了最终结果,后继词典将不会继
量。 资源优化 成本中心可以通过监控云服务器的历史消费情况和CPU使用率,为客户提供云服务器资源的空闲识别和优化建议,寻找节约成本的机会。您还可以根据成本分析阶段的分析结果识别成本偏高的资源,通过云监控服务监控资源的使用情况,确定成本偏高的原因,然后采取针对性的优化措施。 监控资
如何处理? 原因分析 存储在OBS中的源文件含有非UTF-8的数据。 处理方法 排查报错的源文件,检查是否含有非UTF-8的数据,例如中文字符。如果源文件中含有非UTF-8的数据,请先将源文件转换成UTF-8的格式,并重新上传到OBS,然后再执行导入数据的操作。 父主题: 数据导入/导出
工具。 注意事项 执行脚本前需设置环境变量,可参考《开发指南》中“导入数据>通过外表并行导入>安装配置和启动GDS”章节。 脚本需要在python 3环境下运行。 必须在root用户下执行脚本gds_uninstall。 必须包含--host、-U参数。 目前不支持跨平台的卸载操作。
效率。 注意事项 执行脚本前需设置环境变量,可参考《开发指南》中“导入数据>通过外表并行导入>安装配置和启动GDS”章节。 脚本需要在python 3环境下运行。 必须在root用户下执行脚本gds_install。 用户需要检查上层目录权限,保证GDS用户对安装操作目录、安装目录及安装包有读写执行的权限。
据库中。暂时不支持将存储在HDFS文件系统上的数据导入GaussDB(DWS)。 并行导入功能通过外表设置的导入策略、导入数据格式等信息来识别数据源文件,利用多DN并行的方式,将数据从数据源文件导入到数据库中,从而提高整体导入性能。如图1所示: CN只负责任务的规划及下发,把数据
XX000 错误原因:不可识别的模式。 解决办法:请使用normal,shared,private模式,再次执行操作。 GAUSS-03989: "LOAD format '%s' not recognized" SQLSTATE: 22023 错误原因:不可识别的模式。 解决办法:请