检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
编辑input/check_input.xlsx文件: 复制check_input.xlsx文件到windows服务器,使用Excel软件编辑,填写要校验的表信息,保存后,上传到Linux服务器覆盖原始的文件。 执行数据校验工具 : 进入bin目录,执行启动脚本sh datacheck
root 密码 设置密码,该密码用于远程登录ECS机器。 确认密码 再次输入设置的root用户密码 配置委托 在高级配置中配置MRS在IAM服务中预置的委托MRS_ECS_DEFAULT_AGENCY。 通信安全授权 勾选“确认授权”。 准备ORC表 本地PC新建一个product_info
配置的选项。一个配置指定一个特定的文本搜索解析器和一个用于解析器输出类型的字典列表。 解析器在PG_TS_CONFIG记录中显示,但是字典映射的标记是由PG_TS_CONFIG_MAP中的辅助记录定义的。 表1 PG_TS_CONFIG字段 名字 类型 引用 描述 oid oid
配置的选项。一个配置指定一个特定的文本搜索解析器和一个用于解析器输出类型的字典列表。 解析器在PG_TS_CONFIG记录中显示,但是字典映射的标记是由PG_TS_CONFIG_MAP中的辅助记录定义的。 表1 PG_TS_CONFIG字段 名字 类型 引用 描述 oid oid
如果该变量的值为大于0的整数,假设为n,则执行SELECT语句时每次从结果集中取n行到缓存并显示到屏幕。 如果不设置此变量,或设置的值小于等于0,则执行SELECT语句时一次性把结果都取到缓存。 说明: 设置合理的变量值,将减少内存使用量。一般来说,设为100到1000之间的值比较合理。 HISTCONTROL \set
参数项 取值 名称 oracle 数据库服务器 192.168.1.100(示例,请填写Oracle实际的公网IP) 端口 1521 数据库连接类型 Service Name 数据库名称 orcl 用户名 db_user01 密码 - 使用本地API 否 使用Agent 否 ORACLE版本
将导出文件发送至指定目录文件夹。如果这里省略,则使用标准输出。 -f /home//backup/postgres_backup.tar -p 指定服务器所监听的TCP端口或本地Unix域套接字后缀,以确保连接。 -p 8000 -h “集群地址”如果通过公网地址连接,请指定为集群“公网访问地址”或“公
将导出文件发送至指定目录文件夹。如果这里省略,则使用标准输出。 -f /home/dbadmin/backup/MPPDB_backup.sql -p 指定服务器所监听的TCP端口或本地Unix域套接字后缀,以确保连接。 -p 8000 -h “集群地址”如果通过公网地址连接,请指定为集群“公网访问地址”或“公
如遇到乱码,请检查两端数据库的实际编码是否一致。 当本地集群是源集群时,存在极小的概率出现数据成功同步到远端集群,但是本地集群返回执行失败的情况,针对这种情况建议校验同步数据记录数。 当本地集群是源集群时,通过事务块、子事务等控制的数据同步,需要总事务提交后才能查询到数据同步结果。 删除互联互通外表。
源迁移数据到GaussDB(DWS)。 CDM在迁移数据到GaussDB(DWS)时,采用的是COPY方式和GDS并行导入方式。 使用CDM迁移数据到GaussDB(DWS)的典型场景,请参见云数据迁移服务(简称CDM)的如下章节: 入门:该入门场景为使用CDM迁移本地MySQL数据库到GaussDB(DWS)
Migration,简称CDM)都适用于批处理场景,当数据量或表数量较小时,推荐使用kettle,反之使用CDM。 支持从数据库导出数据到文件,也支持将数据导入到数据库。 Kettle可通过建立触发器、时间戳字段、Kafka等方式实现数据实时同步。 本实践预计时长90分钟,演示迁移Redshift的基本流程如下:
使用ODBC连接 GaussDB(DWS)支持使用ODBC应用程序连接数据库。应用程序可以在华为云平台环境的弹性云服务器中,或者互联网环境连接数据库。 ODBC接口的使用方法,请自行查阅官方文档。 前提条件 已下载Linux版本的ODBC驱动包“dws_x.x.x_odbc_driver_for_xxx
外表的字段个数和字段类型,需要与OBS上保存的数据完全一致。 SERVER dfs_server 外表的外部服务器名称,这个server必须存在。外表通过设置外部服务器连接OBS读取数据。 此处应填写为参照创建外部服务器创建的外部服务器名称。 OPTIONS参数 用于指定外表数据的各类参数,关键参数如下所示。
事务ID和快照 以下的函数在输出形式中提供服务器事务信息。这些函数的主要用途是为了确定在两个快照之间有哪个事务提交。 pgxc_is_committed(transaction_id) 描述:如果提交或忽略给定的XID(gxid)。NULL表示的状态是未知的(运行,准备,冻结等)。
事务ID和快照 以下的函数在输出形式中提供服务器事务信息。这些函数的主要用途是为了确定在两个快照之间有哪个事务提交。 pgxc_is_committed(transaction_id) 描述:如果提交或忽略给定的XID(gxid)。NULL表示的状态是未知的(运行,准备,冻结等)。
GDS实践指南 安装GDS前必须确认GDS所在服务器环境的系统参数是否和数据库集群的系统参数一致。 GDS与GaussDB(DWS)通信要求物理网络畅通,尽量使用万兆网。因为千兆网无法承载高速的数据传输压力,极易出现断连,使用千兆网时GaussDB(DWS)无法提供通信保障。满足
disk_cache_remote_read_size bigint 读取磁盘缓存失败,远程直读OBS的总大小,单位MB。该字段仅对存算分离3.0表及外表生效。 disk_cache_remote_read_time bigint 读取磁盘缓存失败,远程直读OBS的次数。该字段仅对存算分离3.0表及外表生效。 vfs_scan_bytes
况下,数据可以恢复到指定时间点。 记录 在关系型数据库中,每一条记录对应表中的每一行数据。 集群 集群是由一组服务器和其它资源组成的一个单独的系统,可以实现高可用性。有的情况下,可以实现负载均衡及并行处理。 K – O LLVM LLVM命名最早源自于底层虚拟机(Low Level
R_NAME = region.R_NAME; 外表可以当做一个本地表来使用,执行复杂的作业。 如果远端集群已经有统计信息,请对该外表执行analyze以获得更优的执行计划。 如果本地集群的DN数量比远端集群的DN数量少,本地集群需要使用SMP来获得更佳的性能。 删除外表。 1 DROP
况下,数据可以恢复到指定时间点。 记录 在关系型数据库中,每一条记录对应表中的每一行数据。 集群 集群是由一组服务器和其它资源组成的一个单独的系统,可以实现高可用性。有的情况下,可以实现负载均衡及并行处理。 K – O LLVM LLVM命名最早源自于底层虚拟机(Low Level