检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
(DWS)提供了OBS(Object Storage Service)及外表接口,通过OBS外表设置的导入URL路径、导入数据格式等信息来识别数据源文件,利用多DN(Datanode)并行的方式,实现了数据的快速并行导入。 优势: CN只负责任务的规划及下发,把数据导入的工作交给
功能说明 用户需要查看集群的监控指标信息时,可以通过云监控(Cloud Eye)确认集群各项指标情况。通过监控集群运行时的各项指标,用户可以识别出数据库集群状态异常的时间段,然后在数据库日志中,分析可能存在问题的活动,从而优化数据库性能。本章节定义了数据仓库服务上报云监控服务的监控
description text) returns setof record ts_token_type返回一个表,这个表描述了指定解析器可以识别的每种token类型。对于每个token类型,表中给出了整数类型的tokid--用于解析器标记对应的token类型;alias——命名分词
Oracle中,每个包由两部分组成:包规范和包体。包规范可能包含变量,以及在变量中声明的REF CURSOR。包的REF CURSOR会被识别并迁移至引用位置。包体中的函数和过程将迁移到单独的函数和过程中。包体中的类型和变量会迁移到各个函数和过程中。 如果包规范和包体的模式名称不
description text) returns setof record ts_token_type返回一个表,这个表描述了指定解析器可以识别的每种token类型。对于每个token类型,表中给出了整数类型的tokid--用于解析器标记对应的token类型;alias——命名分词
词典实际上是Synonym词典的一个扩展,增加了短语支持。 注意事项 由于TZ词典需要识别短语,所以在处理过程中必须保存当前状态并与解析器进行交互,以决定是否处理下一个token或是结束当前识别。此外,TZ词典配置时需谨慎,如果设置TZ词典仅处理asciiword类型的token,则类似one
header:指定导出数据文件是否包含标题行,header只能用于CSV格式的文件中。 delimiter:指定数据文件行数据的字段分隔符,不指定则使用默认分隔符。 外表可以识别的更多参数,详细使用请参见数据格式参数 。 规划并行导入容错性,以控制导入过程中处理错误的方式。 fill_missing_fields:
词典实际上是Synonym词典的一个扩展,增加了短语支持。 注意事项 由于TZ词典需要识别短语,所以在处理过程中必须保存当前状态并与解析器进行交互,以决定是否处理下一个token或是结束当前识别。此外,TZ词典配置时需谨慎,如果设置TZ词典仅处理asciiword类型的token,则类似one
原因分析 使用copy命令或者导入数据时,源数据单行数据的大小超过1GB。 由于源文件中的格式符不成对出现,比如引号,文件格式异常导致系统识别的单行数据过大超过1GB。 处理方法 确保源文件中的引号是成对的。 检查创建外表时命令中参数的取值、格式设置是否合理。 检查源文件单行数据
m_quota_size”和“comm_usable_memory”参数,修改其参数值,单击“保存”,确认无误后再单击“保存”。 数据库在识别此类错误后,会自动进行重试,重试次数使用GUC变量max_query_retry_times来控制。 目前仅支持单条SQL语句的重试,暂不支持事务块中出错SQL重试。
配置中指定不同的词典列表进行处理。当解析器输出一种类型的标记后,在对应列表的每个词典中会查阅该标记,直到某个词典识别它。如果它被识别为一个停用词, 或者没有任何词典识别,该token将被丢弃,即不被索引或检索到。通常情况下,第一个返回非空结果的词典决定了最终结果,后继词典将不会继
于扩容的新节点等功能,在节点管理页面可以清晰的查看各节点的状态、节点规格、所属可用分区以及资源状态等信息。此外,单击指定节点“节点别名”列文字后的图标,可对节点别名进行修改(如果节点没有别名,则可为节点增加别名)。 图1 节点管理 该特性仅8.1.1.200及以上集群版本支持。 存算一体(单机部署)不支持节点管理。
到DMS监控界面。 选择“监控 > 节点监控 > 磁盘”,单击“磁盘使用率”右侧的进行排序,可查看当前集群各个节点的磁盘使用率。 数据磁盘识别方法:一般根据容量进行查看,容量为购买容量的磁盘是数据盘 故障场景 场景一:磁盘使用率过高,当前集群所有磁盘或超过半数以上的磁盘使用率>=70%。
据库应用提供支持。本节介绍的参数主要控制数据库的向后兼容性。 array_nulls 参数说明:控制数组输入解析器是否将未用引用的NULL识别为数组的一个NULL元素。 参数类型:USERSET 取值范围:布尔型 on表示允许向数组中输入空元素。 off表示向下兼容旧式模式。仍然能够创建包含NULL值的数组。
配置中指定不同的词典列表进行处理。当解析器输出一种类型的标记后,在对应列表的每个词典中会查阅该标记,直到某个词典识别它。如果它被识别为一个停用词, 或者没有任何词典识别,该token将被丢弃,即不被索引或检索到。通常情况下,第一个返回非空结果的词典决定了最终结果,后继词典将不会继
据库应用提供支持。本节介绍的参数主要控制数据库的向后兼容性。 array_nulls 参数说明:控制数组输入解析器是否将未用引用的NULL识别为数组的一个NULL元素。 参数类型:USERSET 取值范围:布尔型 on表示允许向数组中输入空元素。 off表示向下兼容旧式模式。仍然能够创建包含NULL值的数组。
面分别进行介绍。 倾斜识别 计算倾斜的识别,即预先识别计算过程中的重分布列是否存在倾斜数据。RLBT方案中给出了三个解决手段,统计信息识别,hint方式指定以及规则识别: 统计信息识别 需要用户先执行ANALYZE收集各表的统计信息,然后优化器能够自动利用统计信息对重分布键上的倾
面分别进行介绍。 倾斜识别 计算倾斜的识别,即预先识别计算过程中的重分布列是否存在倾斜数据。RLBT方案中给出了三个解决手段,统计信息识别,hint方式指定以及规则识别: 统计信息识别 需要用户先执行ANALYZE收集各表的统计信息,然后优化器能够自动利用统计信息对重分布键上的倾
词典进行解决。 实时数仓(单机部署)暂不支持全文检索功能。 文本检索缺乏信息系统所要求的必要属性: 没有语义支持,即使是英语也是如此。 要识别派生词并不是那么容易,即使正则表达式也不能满足要求。例如satisfies和satisfy,当使用正则表达式寻找satisfy时,并不会查
支持。GaussDB(DWS)仅支持Hunspell中基本的复合词操作。通常情况下,Ispell词典能够识别的词是一个有限集合,其后应该配置一个更广义的词典,例如一个可以识别所有词的Snowball词典。 父主题: 词典