检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
OBS上的数据准备 操作场景 使用SQL on OBS功能查询OBS数据之前: 已将ORC数据存储在OBS上。 例如,在使用Hive或Spark等组件时创建了ORC表,其表数据已经存储在OBS上的场景。
DROP OWNED 功能描述 删除一个数据库角色所拥有的数据库对象。 注意事项 所有该角色在当前数据库里和共享对象(数据库,表空间) 上的所有对象上的权限都将被撤销。
应用程序可以在华为云平台环境的弹性云服务器中,或者互联网环境连接数据库。 用户通过JDBC连接GaussDB(DWS)集群时,可以选择是否采用SSL认证方式。SSL认证用于加密客户端和服务器之间的通讯数据,为敏感数据在Internet上的传输提供了一种安全保障手段。
父主题: GaussDB(DWS)对象设计规范
图1 区域和可用分区 目前,华为云已在全球多个地域开放云服务,您可以根据需求选择适合自己的区域和可用分区。更多信息请参见华为云全球站点。 如何选择区域?
父主题: GaussDB(DWS)对象设计规范
GaussDB(DWS)集群在华为云内部网络产生的流量不计费。
父主题: GaussDB(DWS)对象设计规范
MRS集群上的数据准备 从MRS导入数据到GaussDB(DWS)集群之前,假设您已经完成了以下准备工作: 已创建MRS集群。 在MRS集群上创建了Hive/Spark ORC表,且表数据已经存储到该表对应的HDFS路径上。 如果您已经完成上述准备,则可以跳过本章节。
父主题: 数据库对象函数
回到浏览器上的OBS控制台,左侧导航选择“桶列表”,单击新创建的dws-obs01桶名。 左侧导航选择“对象”,单击“input_data”文件夹。 单击“上传对象”,单击“添加文件”。
返回值类型:void 备注:该函数运行时,会在现有分区boundary的基础上,创建多个时间范围为boundaries_interval的新分区,直到new_part_boundary – now_time >= 29 * boundaries_interval,之后再额外多创建一个分区
方案建议: 在自身私有SCHEMA或自身创建SCHEMA下创建对象,不在其他用户私有SCHEMA下创建对象。 父主题: GaussDB(DWS)对象设计规范
TABLESPACE对象设计规范 规则2.8 禁止自定义TABLESPACE表空间 违反规则的影响: 分布式场景建表使用自定义表空间,导致表数据无法按照各DN分布式存储,出现存储倾斜。 方案建议: 创建表对象使用内置默认表空间。 父主题: GaussDB(DWS)对象设计规范
VIEW对象设计规范 建议2.16 视图的嵌套需避免超过三层 违反规范的影响: 视图嵌套过深导致执行计划不稳定、耗时不稳定。 视图依赖的对象重建风险高,锁冲突发生概率增大。 方案建议: 创建视图直接基于物理表查询,不建议嵌套视图。 父主题: GaussDB(DWS)对象设计规范
父主题: GaussDB(DWS)对象设计规范
---建立不包含分区列的OBS外表,表关联的外部服务器为obs_server,表对应的OBS服务上的文件格式为‘orc’,OBS上的数据存储路径为'/mybucket/data/'。
GS_OBSSCANINFO GS_OBSSCANINFO系统表定义了在云上加速场景中,使用加速集群时扫描OBS数据的运行信息,每条记录对应一个query中单个OBS外表的运行时信息。
异常场景:假如用户使用同一张表的数据并发导出到同一个OBS的外表,在一条SQL语句执行在OBS服务器上没有生成文件时,另一条SQL语句也执行导出,最终执行结果为两条SQL语句均执行成功,产生数据覆盖现象,建议用户在执行OBS外表导出任务时,不要往同一OBS外表并发导出。
PG_OBSSCANINFO PG_OBSSCANINFO系统表定义了在云上加速场景中,使用加速集群时扫描OBS数据的运行时信息,每条记录对应一个query中单个OBS外表的运行时信息。