检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
问题样例 场景 问题样例 产品咨询、购买 DWS怎么购买 DWS的功能有什么 查大功能、大场景、规格、大特性的介绍 DWS支持哪些导入方式 怎么导入数据 并发连接数多大 支持的分区表的大小 某个特性是否支持,某个SQL语法的具体使用 DWS支持roundrobin吗 list分区是否支持
打开公有云服务网址http://www.huaweicloud.com/,单击页面右上方的“注册”,进入注册页面。 按照页面要求填写用户信息完成注册,请参见注册华为账号并开通华为云。 注册成功后即可自动登录华为云。 单击右上角用户名,进入基本信息页面,单击“实名认证”,进入实名认证页面。
TPC-H测试过程 TPC-H测试数据 TPC-H数据生成 建表与导入TPC-H数据 TPC-H查询测试 父主题: TPC-H性能测试
测试方法 总体流程 创建弹性云服务器ECS和数据仓库GaussDB(DWS) 构建TPC-H&TPC-DS使用数据 建表与数据导入 执行查询与结果收集
GaussDB(DWS)用户自定义函数 实时数仓(单机部署)暂不支持用户自定义函数。 实时数仓(单机部署)8.2.0.100及以上集群版本支持OBS导入导出。 GaussDB(DWS) PL/Java语言函数 GaussDB(DWS) PL/pgSQL语言函数
0x20"等报错信息提示用户修改可能引起混淆的参数以避免导入错误。 ORC格式下,导入非法字符容错规则如下: checkencoding为low标识,若导入时检查到某个字段中包含非法字符,则自动将当前列当前行的字段整体替换为同样长度的‘?’字符; checkencoding为high标识,若导入时检查到某个字段中包含非法字符,则报错退出。
组合索引,组合索引中distinct值多的列排在前面,索引个数不宜超过3个。 大量数据带索引导入会产生大量I/O,如果该表涉及大量数据导入,需严格控制索引个数,建议导入前先将索引删除,导入完成后再重新建索引。 对频繁做DML操作的表,业务中加入及时ANALYZE,主要场景: 表数据从无到有。
访问。 gs_restore gs_restore是GaussDB(DWS)提供的针对gs_dump导出数据的导入工具。通过此工具可由gs_dump生成的导出文件进行导入。 gds_check gds_check用于对GDS部署环境进行检查,包括操作系统参数、网络环境、磁盘占用情
GaussDB(DWS)数据库GUC参数 查看GUC参数 设置GUC参数 GUC使用说明 连接和认证 资源消耗 并行导入 预写式日志 双机复制 查询规划 错误报告和日志 运行时统计 资源管理 自动清理 客户端连接缺省设置 锁管理 版本和平台兼容性 容错性 连接池参数 集群事务 开发人员选项
"column '%s' needs too many memory" SQLSTATE: 0A000 错误原因:列存导入记录过大。 解决办法:当前列存不支持过大记录,使用行存进行导入。 GAUSS-04389: "Failed to initialize multi-threads for
给调用者。GTM作为全局唯一的节点,势必成为性能的瓶颈,所以对于需要大量频繁产生序列号的操作,如使用Bulkload(批量快速导入数据)功能进行数据导入场景,是非常不推荐产生默认序列值的。比如,在下面所示的场景中, INSERT FROM SELECT语句的性能会非常慢。 1 2
GaussDB(DWS)数据库GUC参数 查看GUC参数 设置GUC参数 GUC使用说明 连接和认证 资源消耗 并行导入 预写式日志 双机复制 查询规划 错误报告和日志 运行时统计 资源管理 自动清理 客户端连接缺省设置 锁管理 版本和平台兼容性 容错性 连接池参数 集群事务 开发人员选项
0x20"等报错信息提示用户修改可能引起混淆的参数以避免导入错误。 ORC格式下,导入非法字符容错规则如下: checkencoding为no标识,导入时不检查非法字符。在用户确认无非法字符的情况下,此选项可以缩短导入时间。 checkencoding为low标识,若导入时检查到某个字段中包含非法字符,
并行数据加载,可将存储在普通文件系统中的数据文件导入到GaussDB(DWS)数据库中。 lib 该文件夹中包括执行gsql所需依赖的lib库。 sample 该文件夹中包含了以下目录或文件: setup.sh:在使用gsql导入样例数据前所需执行的配置AK/SK访问密钥的脚本文件。
给调用者。GTM作为全局唯一的节点,势必成为性能的瓶颈,所以对于需要大量频繁产生序列号的操作,如使用Bulkload(批量快速导入数据)功能进行数据导入场景,是非常不推荐产生默认序列值的。比如,在下面所示的场景中, INSERT FROM SELECT语句的性能会非常慢。 1 2
"delimiter '%s' cannot contain any characters in'%s'" SQLSTATE: 22023 错误原因:导入非CSV格式时,指定的分隔符中包含了不允许的字符(a-z0-9以及.\)。 解决办法:重新指定分隔符,不允许出现a-z0-9以及.\中的任何一个字符。
过32767,short Int最大值。 处理方法: 数据查询:建议将大SQL进行拆分,确保每个SQL变量数小于32767。 数据导入:建议分批导入或使用copymanager,参考CopyManager。 调用存储过程报错 ERROR: cached plan must not
包含分布键。分布键决定了数据在各个分区之间的分布情况,如果分布键很好地分布在各个分区中,则可以使查询性能变得更好。 分布列选择不当,在数据导入后有可能出现数据分布倾斜,进而导致某些磁盘的使用明显高于其他磁盘,极端情况下会导致集群只读。合理的选择分布键,对表查询的性能至关重要。此外
not initialize partition pruning result cache." SQLSTATE: XX000 错误原因:分区表导入过程中用以分区搜索的cache创建失败。 解决办法:检查机器是否有足够的内存来创建分区收索cache。 GAUSS-04750: "Unsupported
并行数据加载,可将存储在普通文件系统中的数据文件导入到GaussDB(DWS)数据库中。 lib 该文件夹中包括执行gsql所需依赖的lib库。 sample 该文件夹中包含了以下目录或文件: setup.sh:在使用gsql导入样例数据前所需执行的配置AK/SK访问密钥的脚本文件。