检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ADB信息 单击“测试”,测试连通后,单击“保存”。 配置CDM的目标端连接。 参见同样方法,选择“作业管理 > 连接管理 > 新建连接”。 选择“数据仓库服务(DWS)”,单击“下一步”。 同理,填写DWS的数据库信息。 图8 DWS信息 单击“测试”,测试连通后,单击“保存”。
CREATE USER u1 WITH INDEPENDENT IDENTIFIED BY 'password'; 切换到u1用户,创建测试表test,并插入数据。 1 2 3 CREATE TABLE test (id INT, name VARCHAR(20)); INSERT
GAUSS-02061 -- GAUSS-02070 GAUSS-02061: "could not send data to WAL stream: %s" SQLSTATE: XX000 错误原因:"主备日志复制过程中,备机发送数据时检测到错误。根据""%s""给出的主备连接返回的错误信息进行处理。"
执行SQL语句时提示“Connection reset by peer” 问题现象 执行SQL语句时,提示“Connection reset by peer”。 ERROR: Failed to read response from Datanodes Detail: Connection
id15”。 因此join-condition实质上是一个不等式,这种不等值的join操作必须走nestloop,对应执行计划如下: 优化后 测试发现由于两表结果集过大,导致nestloop耗时过长,超过一小时未返回结果,因此性能优化的关键是消除nestloop,让join走更高效的
bat,打开Spoon,新建转换任务,单击“新建 >转换”。 添加“表输入”节点,并配置好数据库连接、和需要搬迁的表和表字段。新建数据库连接时,可在对应界面单击“测试”按钮,验证连接参数是否配置OK。配置好需要搬迁的表和表字段对应的SQL后,可以单击“预览”按钮查看需要搬迁的预览数据。 添加“DWS表输
id15”。 因此join-condition实质上是一个不等式,这种不等值的join操作必须走nestloop,对应执行计划如下: 优化后 测试发现由于两表结果集过大,导致nestloop耗时过长,超过一小时未返回结果,因此性能优化的关键是消除nestloop,让join走更高效的
GaussDB(DWS)表设计规则 GaussDB(DWS)是分布式架构。数据分布在各个DN上。总体上讲,良好的表设计需要遵循以下原则: 【关注】将表数据均匀分布在各个DN上。数据均匀分布,可以防止数据在部分DN上集中分布,从而导致因存储倾斜造成集群有效容量下降。通过选择合适的分布列,可以避免数据倾斜。
GaussDB(DWS)表设计规则 GaussDB(DWS)是分布式架构。数据分布在各个DN上。总体上讲,良好的表设计需要遵循以下原则: 【关注】将表数据均匀分布在各个DN上。数据均匀分布,可以防止数据在部分DN上集中分布,从而导致因存储倾斜造成集群有效容量下降。通过选择合适的分布列,可以避免数据倾斜。
使用场景 dwsx2.xlarge.m7 X86 4 32 20GB ~ 2000GB 100 10 800 1 DWS的入门规格,一般用于测试、学习环境或者小型分析系统。 dwsk2.xlarge ARM 4 32 20GB ~ 2000GB 100 10 800 1 dwsx2
不支持此模式。 将客户端所在主机的IP网段加入GaussDB(DWS)的安全组规则,确保客户端主机与GaussDB(DWS)网络互通。 测试数据源配置 单击Test进行测试。 如果显示如下,则表明配置正确,连接成功。 如果显示ERROR信息,则表明配置错误。请检查上述配置是否正确。 常见问题处理
不支持此模式。 将客户端所在主机的IP网段加入GaussDB(DWS)的安全组规则,确保客户端主机与GaussDB(DWS)网络互通。 测试数据源配置 单击Test进行测试。 如果显示如下,则表明配置正确,连接成功。 如果显示ERROR信息,则表明配置错误。请检查上述配置是否正确。 常见问题处理
IP,简称EIP)可以提供独立的公网IP资源,包括公网IP地址和公网出口带宽服务,方便外部访问,但同时增加了受到全网攻击的风险。使用弹性公网IP会受到外部的Dos/DDos攻击。 如果没有公网访问的特殊要求,建议将数据库作为内部组件,通过内部IP进行访问,建议解绑弹性公网IP。 解绑步骤: 登录DWS管理控制台,左侧选择“专属集群
审视和修改表定义 在分布式框架下,数据分布在各个DN上。一个或者几个DN的数据存在一块物理存储设备上,较好的表定义需要满足以下要求: 表数据均匀分布在各个DN上,以防止单个DN对应的存储设备空间不足造成集群有效容量下降。选择合适分布列,避免数据分布倾斜可以实现该点。 表Scan压
如果执行过程中出现数据加载错误,则数据全部导入失败,没有数据导入至目标表中。 编写批处理任务脚本,实现并发批量导入数据。并发量视机器资源使用情况而定。可通过几个表测试,监控资源利用率,根据结果提高或减少并发量。常用资源监控命令有:内存和CPU监控top命令,IO监控命令iostat,网络监控命令sar等。相关案例请参见多线程导入。
url, url_path, sfloat, float; 使用文本检索调测函数ts_debug()对所创建的词典配置ts_conf进行测试。 1 2 3 4 5 SELECT * FROM ts_debug('ts_conf', ' PostgreSQL, the highly
味着占用相对少的内存。 对于I/O读写量大,CPU富足(计算相对小)的场景,选择高压缩比;反之选择低压缩比。建议依据此原则进行不同压缩下的测试和对比,以选择符合自身业务情况的最优压缩比。压缩比通过COMPRESSION参数指定,其支持的取值如下: 列存表为:YES/NO/LOW/
味着占用相对少的内存。 对于I/O读写量大,CPU富足(计算相对小)的场景,选择高压缩比;反之选择低压缩比。建议依据此原则进行不同压缩下的测试和对比,以选择符合自身业务情况的最优压缩比。压缩比通过COMPRESSION参数指定,其支持的取值如下: 列存表为:YES/NO/LOW/
同样,包含上界用“]”表示,排除上界用“)”表示。 函数lower_inc(anyrange)和lower_inc(anyrange)分别测试一个范围值的上下界。 无限(无界)范围 范围的下界可以省略,这意味着所有小于上界的值都包括在范围中,例如(,3]。同样,范围的上界被省略,
审视和修改表定义 在分布式框架下,数据分布在各个DN上。一个或者几个DN的数据存在一块物理存储设备上,较好的表定义需要满足以下要求: 表数据均匀分布在各个DN上,以防止单个DN对应的存储设备空间不足造成集群有效容量下降。选择合适分布列,避免数据分布倾斜可以实现该点。 表Scan压