检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
步骤三:连接GaussDB(DWS)集群并导入数据进行分析 使用SQL编辑器连接GaussDB(DWS)数据库,并创建OBS外表,通过OBS外表将OBS桶数据导入GaussDB(DWS)集群,并进行简单SQL查询。 准备工作 已注册账号并实名认证,且在使用GaussDB(DWS)
给用户授权GaussDB(DWS)权限流程 创建用户组并授权 使用华为云账号登录IAM控制台,创建用户组,并授予数据仓库服务的只读权限“DWS ReadOnlyAccess”。 创建用户并加入用户组 在IAM控制台创建用户,并将其加入步骤1中创建的用户组。 用户登录并验证权限 使用新创建的用户登录控制台,切换至授权区域,验证权限:
CREATE USER 修改用户属性 ALTER USER 删除用户 DROP USER 定义脱敏策略 数据脱敏策略是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。用户可以在指定表对象创建脱敏策略,并限定策略生效范围,也可以新增、修改、删除脱敏列信息。所涉及的SQL语句,请参考下表。
下载并安装Data Studio客户端 GaussDB(DWS) 提供了基于Windows平台的Data Studio图形界面客户端,该工具依赖JDK,请先在客户端主机上安装JDK。 仅支持Java 1.8版本的JDK。 在Windows操作系统中,您可以访问JDK官网网站,下载
据库应用提供支持。本节介绍的参数主要控制数据库的向后兼容性。 array_nulls 参数说明:控制数组输入解析器是否将未用引用的NULL识别为数组的一个NULL元素。 参数类型:USERSET 取值范围:布尔型 on表示允许向数组中输入空元素。 off表示向下兼容旧式模式。仍然能够创建包含NULL值的数组。
SQL查询执行流程 SQL执行计划 执行计划算子 SQL调优流程 更新统计信息 审视和修改表定义 SQL调优进阶 使用Plan Hint进行调优 例行维护表 例行重建索引 SQL语句出错自动重试 query_band负载识别 父主题: GaussDB(DWS)性能调优
据库应用提供支持。本节介绍的参数主要控制数据库的向后兼容性。 array_nulls 参数说明:控制数组输入解析器是否将未用引用的NULL识别为数组的一个NULL元素。 参数类型:USERSET 取值范围:布尔型 on表示允许向数组中输入空元素。 off表示向下兼容旧式模式。仍然能够创建包含NULL值的数组。
SQL执行计划 执行计划算子 SQL调优流程 更新统计信息 审视和修改表定义 SQL调优进阶 优化器参数调整 使用Plan Hint进行调优 例行维护表 例行重建索引 SQL语句出错自动重试 query_band负载识别 父主题: GaussDB(DWS)性能调优
功能说明 用户需要查看集群的监控指标信息时,可以通过云监控(Cloud Eye)确认集群各项指标情况。通过监控集群运行时的各项指标,用户可以识别出数据库集群状态异常的时间段,然后在数据库日志中,分析可能存在问题的活动,从而优化数据库性能。本章节定义了数据仓库服务上报云监控服务的监控
文本搜索解析器 文本搜索解析器负责将原文档文本分解为多个token,并标识每个token的类型。这里的类型集由解析器本身定义。注意,解析器并不修改文本,它只是确定合理的单词边界。由于这一限制,人们更需要定制词典,而不是为每个应用程序定制解析器。 目前GaussDB(DWS)提供了
解析器 文本搜索解析器负责将原文档文本分解为多个token,并标识每个token的类型。这里的类型集由解析器本身定义。注意,解析器并不修改文本,它只是确定合理的单词边界。由于这一限制,人们更需要定制词典,而不是为每个应用程序定制解析器。 目前GaussDB(DWS)提供了四个内置的解析器,分别为pg_catalog
专属集群”页面重置密码,重置密码后账号即可自动解锁。输错密码的次数上限默认为10次,可以在集群的“参数修改”页面通过参数failed_login_attempts进行设置,设置方法请参见修改GaussDB(DWS)集群GUC参数。 重置密码 登录GaussDB(DWS)管理控制台。 单击“集群
的起止时间,设置enable_wdr_snapshot为on后,该表由后台快照线程创建并维护。需要有系统管理员权限才可以访问此系统表。 此系统表的schema是dbms_om。 禁止从外部修改或删除此表,否则可能引起视图快照相关功能异常。 表1 dbms_om.snapshot字段
面分别进行介绍。 倾斜识别 计算倾斜的识别,即预先识别计算过程中的重分布列是否存在倾斜数据。RLBT方案中给出了三个解决手段,统计信息识别,hint方式指定以及规则识别: 统计信息识别 需要用户先执行ANALYZE收集各表的统计信息,然后优化器能够自动利用统计信息对重分布键上的倾
SNAPSHOT SNAPSHOT系统表记录每次创建性能视图快照的起止时间,设置enable_wdr_snapshot为on后,该表由后台快照线程创建并维护。需要有系统管理员权限才可以访问此系统表。 表1 dbms_om.snapshot字段 名称 类型 描述 snapshot_id name
页面。 单击“参数修改”页签,在“参数列表”中找到“comm_max_stream”修改其参数值,然后单击“保存”。 在“修改预览”窗口,确认修改无误后,单击“保存”。 参数“comm_max_stream”所在行“是否重启集群”列显示为“是”,表示该参数修改后重启生效。 父主题:
正常 测试连接配置。 数据迁移 dataMigrationModifyConnection 正常 修改连接配置。 数据迁移 dataMigrationModifyMapping 正常 修改表映射配置。 数据迁移 dataMigrationStartApplication 正常 开始启动作业任务。
面分别进行介绍。 倾斜识别 计算倾斜的识别,即预先识别计算过程中的重分布列是否存在倾斜数据。RLBT方案中给出了三个解决手段,统计信息识别,hint方式指定以及规则识别: 统计信息识别 需要用户先执行ANALYZE收集各表的统计信息,然后优化器能够自动利用统计信息对重分布键上的倾
原因分析 使用copy命令或者导入数据时,源数据单行数据的大小超过1GB。 由于源文件中的格式符不成对出现,比如引号,文件格式异常导致系统识别的单行数据过大超过1GB。 处理方法 确保源文件中的引号是成对的。 检查创建外表时命令中参数的取值、格式设置是否合理。 检查源文件单行数据
在事件列表上方,可单击搜索框,在下拉列表中根据筛选条件(时间、事件、事件级别、事件源、事件源类型、事件类别)查找相关事件。 图1 事件页面 父主题: 查看并订阅GaussDB(DWS)集群事件