检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
支持的数据类型 目前大数据领域,主流文件格式为ORC。GaussDB(DWS)主要支持ORC文件格式。用户利用HIVE将数据导出存储为ORC文件格式,使用GaussDB(DWS)通过只读外表对ORC文件内的数据进行查询分析,因此,需要在ORC文件格式支持的数据类型与GaussDB
数据类型迁移 概述 数据类型是数据的一个基本属性,用于区分不同类型的数据。不同的数据类型所占的存储空间不同,能够进行的操作也不相同。数据库中的数据存储在数据表中。数据表中的每一列都定义了数据类型,用户存储数据时,须遵从这些数据类型的属性,否则可能会出错。下表列出了SQL-Serv
String 委托名称。获取方法,请参见查询数据源。 响应参数 表4 响应参数 参数 参数类型 描述 job_id String 更新数据源的任务ID。 请求示例 修改ID为“d303f19c-fbd1-4716-ae04-07d1ff358f22”数据源的委托名称为“DWSAccessOBS”:
数据脱敏函数 数据脱敏函数提供一系列不同脱敏形式的函数接口,可以覆盖常见的脱敏场景。通常结合数据脱敏语法,与脱敏列绑定使用,不推荐直接作用在查询语句上。 mask_none(column_name) 描述:不作任何脱敏处理,仅内部测试用。 返回值类型:与入参column_name数据类型相同
数据库连接管理 执行gsql连接数据库命令提示gsql:command not found 通过gsql客户端无法连接数据库 连接GaussDB(DWS)数据库时,提示客户端连接数太多 无法ping通集群访问地址 业务执行中报错:An I/O error occurred while
参数类型 描述 id String 数据源配置ID。 name String 数据源名称。 type String 数据源类型。 connect_info String 连接的数据库。 user_name String MRS数据源用户名,OBS数据源对应委托名称。 version String
建多个Project。 GaussDB(DWS)的数据库概念 数据库 数据库用于管理各类数据对象,与其他数据库隔离。创建数据库时可以指定对应的表空间,如果不指定相应的表空间,相关的对象会默认保存在PG_DEFAULT空间中。数据库管理的对象可分布在多个表空间上。 联机分析处理 联机分析处理(Online
导出数据到OBS 关于OBS并行导出 导出CSV、TXT数据到OBS 导出ORC数据到OBS 父主题: 导出数据
存算一体(单机部署)暂不支持从MRS导入数据。 使用流程 从MRS导入数据到集群流程如下: 前提条件 创建一个MRS集群,具体操作步骤请参见购买自定义集群。 创建一个HDFS外表,外表通过外部服务器的接口,从MRS集群查询数据。 具体操作步骤请参见《数据仓库服务数据迁移与同步》中从MRS导入数据到集群章节。
管理数据源 管理MRS数据源 管理OBS数据源 管理LakeFormation数据源 父主题: 迁移业务数据至GaussDB(DWS)集群
OBS热数据:1. 明确知道热数据的大小;2. 如果不知道,可以选择OBS总数据量 *30%。 列存索引大小 = 原始未压缩数据size * 索引列宽 * 3(膨胀) / 总列宽 列存数据按照3倍压缩比评估,假设20列的表,2列做主键,索引就是压缩前数据的30%,和压缩后数据相当。
查询历史监控数据 功能介绍 该接口用于查询历史监控数据。 调用方法 请参见如何调用API。 URI GET /v1.0/{project_id}/dms/metric-data 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID。获取方法,请参见获取项目ID。
数据库使用 插入或更新数据时报错,提示分布键不能被更新 VARCHAR(n)存储中文字符,提示value too long for type character varying? SQL语句中字段名大小写敏感问题 删除表时报错:cannot drop table test because
数据库管理 基于角色的权限管理(RBAC) 只读用户配置权限 SQL查询优秀实践 数据倾斜查询优秀实践 用户管理优秀实践 查看表和数据库的信息 数据库SEQUENCE优秀实践
OBS上的数据准备 操作场景 使用SQL on OBS功能查询OBS数据之前: 已将ORC数据存储在OBS上。 例如,在使用Hive或Spark等组件时创建了ORC表,其表数据已经存储在OBS上的场景。 假设有2个ORC数据文件“product_info.0”和“product_info
数据分析 使用GaussDB(DWS)秒级查询交通卡口通行车辆行驶路线 使用GaussDB(DWS)分析某公司供应链需求 使用GaussDB(DWS)分析零售业百货公司经营状况
数据库使用 如何调整DWS分布列? 如何查看和设置DWS数据库的字符集编码格式 如何处理DWS建表时date类型字段自动转换为timestamp类型的问题? DWS是否需要定时对常用的表做VACUUM FULL和ANALYZE操作? 如何导出DWS某张表结构? DWS是否有高效的删除表数据的方法?
数据库性能 为什么DWS使用一段时间后执行SQL很慢? 为什么DWS的性能在极端场景下并未比单机数据库好 DWS业务读写阻塞,如何查看某个时间段的sql执行记录? DWS中“算子下盘”是什么含义? DWS的CPU资源隔离管控介绍 为什么DWS普通用户比dbadmin用户执行的慢?
数据如何存储到DWS? DWS支持多数据源高效入库,典型的入库方式如下所示。详细指导请参见导入数据。 从OBS导入数据。 数据上传到OBS对象存储服务中,再从OBS中导入,支持CSV,TEXT格式数据。 通过INSERT语句直接插入数据。 用户可以通过DWS提供的客户端工具(gs
sDB(DWS) 管理控制台,进入“集群管理”页面,找到所需要的集群,然后单击“更多 > 重置密码”。 数据库普通用户解锁方法 使用管理员用户(默认为dbadmin)连接数据库,然后执行以下命令进行解锁,其中user_name请替换为需要解锁的用户名: 1 2 gsql -d gaussdb