检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
客户端CPU架构要和集群一致,如果集群是X86规格,则也应该选择X86客户端。 单击“下载”。 将GDS工具包上传至ECS的/opt目录中,本例以上传Euler Kunpeng版本的工具包为例。 在工具包所在目录下,解压工具包。 1 2 cd /opt/ unzip dws_client_8.1.x_euler_kunpeng_x64
概述 本性能测试基于TPC-H和TPC-DS标准测试集进行测试。 TPC-H TPC-H由国际事务处理性能委员会(Transaction Processing Performance Council)制定发布,用于评测数据库的分析查询能力。TPC-H查询包含8张数据表和22条复杂
Remote模式导出 规划数据服务器与集群处于同一内网,数据服务器IP为192.168.0.90,导出数据文件格式为CSV,所以规划的并行导出模式为Remote模式。 Remote模式并行导出数据操作示例如下所示: 以root用户登录GDS数据服务器,创建数据文件存放目录“/ou
验证连接属性,检查连接属性输入是否正确。 检查服务器和客户端版本是否兼容。 检查database\pg_hba.conf文件是否正确配置。 检查Data Studio.ini文件是否正确配置。 当用户通过SSL证书尝试和另一服务器建立连接时,为什么连接成功了? 解答:如果不同服务器使用相同SSL证书,那么第二次连接应成功,因为证书会缓存。
(DWS)最终可以通过外表将数据服务器上的数据引流进数据库实表中。 操作步骤 收集数据源格式信息、GDS服务的访问信息。 需要收集的主要数据源格式信息如下: format:GDS外表导入支持CSV、TEXT和FIXED格式。请确认存放在数据服务器上待入库数据的格式。例如,待入库的数据为CSV格式。
使用GDS从集群导出到数据之前,要提前准备需要导出的数据,并规划导出的路径。 规划导出路径 Remote模式 以root用户登录GDS数据服务器,创建导出的数据文件存放目录“/output_data”。 1 mkdir -p /output_data (可选)创建用户及所属的用户
停止GDS 操作场景 待导入数据成功后,停止GDS。 操作步骤 以gds_user用户登录安装GDS的数据服务器。 请根据启动GDS的方式,选择停止GDS的方式。 若用户使用“gds”命令启动GDS,请使用以下方式停止GDS。 执行如下命令,查询GDS进程号。 ps -ef|grep
示例:创建GDS导出外表foreign_tpcds_reasons,待导出数据格式为CSV,用于接收数据服务器上的数据。 其中设置的导出模式信息如下所示: 规划数据服务器与集群处于同一内网,数据服务器IP为192.168.0.90,待导出的数据文件格式为CSV,选择并行导出模式为Remote模式。
字段值长度超过限制。 在数据源文件中,修改字段值长度。根据此错误信息,字段值长度限制为VARCHAR2(16)。 父主题: 使用GDS从远端服务器导入数据
某一多处理器的服务器上。 每个任务可能是一个进程或一个线程,这由操作系统决定;每个任务与服务器进行单独连接。 该选项的最优值取决于服务器的硬件设置、客户端、以及网络。还包括这些因素,如CPU核数量、硬盘设置。建议是从增加服务器上的CPU核数量入手,更大的值(服务器上CPU核数量)
somaxconn 65535 net.ipv4.tcp_max_syn_backlog 65535 net.core.netdev_max_backlog 65535 net.ipv4.tcp_retries1 5 net.ipv4.tcp_retries2 12 net.ipv4.ip_local_port_range
出所有数据库相关信息工具,它可以导出集群数据库的所有数据,包括默认数据库postgres的数据、自定义数据库的数据、以及集群所有数据库公共的全局对象。 gs_dumpall工具在进行数据导出时,其他用户可以访问集群数据库(读或写)。 gs_dumpall工具支持导出完整一致的数据
服务端工具 gs_dump gs_dumpall gs_restore gds_check gds_install gds_uninstall gds_ctl ESLDoTrust.py DisasterFineGrained.py
编辑input/check_input.xlsx文件: 复制check_input.xlsx文件到windows服务器,使用Excel软件编辑,填写要校验的表信息,保存后,上传到Linux服务器覆盖原始的文件。 执行数据校验工具 : 进入bin目录,执行启动脚本sh datacheck.sh 查看校验结果 o
Data\<用户名>\logs文件夹中创建: Data Studio.ini文件中没有指定路径。 例如:-logfolder=. 提供的路径不存在。 有关服务器日志详情,请参见服务器手册。 可使用任何文本编辑器打开并查看Data Studio.log文件。 控制故障和错误日志 基于程序参数控制错误、异常或者
案例:使排序下推 在做场景性能测试时,发现某场景大部分时间是CN端在做window agg,占到总执行时间95%以上,系统资源不能充分利用。研究发现该场景的特点是:将两列分别求sum作为一个子查询,外层对两列的和再求和后做trunc,然后排序。可以尝试将语句改写为子查询,使排序下推。
--host=HOSTNAME 指定正在运行服务器的主机名或者Unix域套接字的路径。 如果省略主机名,gsql将通过Unix域套接字与本地主机的服务器相连,或者在没有Unix域套接字的机器上,通过TCP/IP与localhost连接。 -p, --port=PORT 指定数据库服务器的端口号。 可以通过port参数修改默认端口号。
Studio到数据库服务器的连接。将光标悬停在连接名称上,可查看数据库信息。 添加连接 在主菜单中选择“文件 > 新建连接”,或单击工具栏上的“新建连接”按钮连接到数据库服务器,弹出“新建/选择数据库连接”对话框。 “新建/选择数据库连接”对话框的左侧列表中显示已有连接信息和服务器信息。 双
Studio的操作环境如下图所示。 Data Studio用户界面 表1 用户界面简介 界面名称 描述 主菜单 提供使用Data Studio的基本操作。 工具栏 提供常用操作入口。 “SQL终端”页签 用于执行SQL语句和函数/过程。 “PL/SQL Viewer”页签 显示函数/过程信息。 “调用堆栈”窗格
集群性能 锁等待检测 执行SQL时出现表死锁,提示LOCK_WAIT_TIMEOUT锁等待超时 执行SQL时报错:abort transaction due to concurrent update 磁盘使用率高&集群只读处理方案 SQL执行很慢,性能低,有时长时间运行未结束 数