检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如果通过公网地址连接,请指定为集群“公网访问域名”,如果通过内网地址连接,请指定为集群“内网访问域名”。如果通过弹性负载均衡连接,请指定为“弹性负载均衡地址”。 “数据库用户”:输入集群数据库的用户名。
非数据格式错误 对于非数据格式错误,一旦发生将导致整个数据导入失败。您可以根据执行数据导入过程中,界面提示的错误信息,帮助定位问题,处理错误表。 处理数据导入错误 根据获取的错误信息,请对照下表,处理数据导入错误。
OBS与GDS外表支持格式文件区别如下: OBS导入支持ORC、TEXT、JSON、CSV、CARBONDATA、PARQUET文件格式,导出支持ORC、CSV、TEXT文件格式,缺省值为TEXT。 GDS导入导出支持的文件格式:TEXT、CSV和FIXED,缺省值为TEXT。
解决办法:请检查GDS外表对应的导入文件中是否存在非法数据并对文件进行数据清洗后再次导入。 GAUSS-04622: "%s cannot be executed when enable_show_any_tuples is true."
主服务器 enable_data_replicate 参数说明:当数据库在数据导入行存表时,主机与备机的数据同步方式可以进行选择。 参数类型:USERSET 取值范围:布尔型 on表示导入数据行存表时主备数据采用数据页的方式进行同步。
该视图汇总当前集群上各个节点已经执行结束的导入导出类业务的历史执行情况(包括互联互通集群地址、导入导出业务类型、DN上落盘的最大、最小以及总和的行数与字节数等),从而可以获取导入导出类业务执行的历史信息,辅助进行性能问题排查。
PG_BULKLOAD_STATISTICS 在集群任一正常节点上,通过查询PG_BULKLOAD_STATISTICS视图可以获取当前登录节点正在进行的导入导出业务执行情况,其中每一个导入/导出业务对应一条记录。需要有系统管理员权限才可以访问此视图。
-p 8000 -h “集群地址”如果通过公网地址连接,请指定为集群“公网访问地址”或“公网访问域名”,如果通过内网地址连接,请指定为集群“内网访问地址”或“内网访问域名”。
漏斗分析的关键在于定义一个“漏斗”,即用户从进入某个流程(如访问网站、注册账户、选购商品等)到完成最终目标(如完成支付、完成注册等)的整个路径。 留存分析:留存分析关注的是在某一特定时间段后,仍然活跃使用产品的用户比例。
address text 当前导入导出外表的location。 query_start timestamp with time zone 导入/导出开始时间。 total_bytes bigint 待处理数据的总大小。
默认值:16MB -t worker_num 设置导入导出工作并发线程数目。 取值范围:0<worker_num<=200,正整数 默认值:8 推荐值:普通文件导入导出场景取值:CPU核数*2;管道文件导入导出场景取值:64。
注意事项 执行脚本前需设置环境变量,可参考《开发指南》中“导入数据>通过外表并行导入>安装配置和启动GDS”章节。 脚本需要在python 3环境下运行。 必须在root用户下执行脚本gds_uninstall。 必须包含--host、-U参数。 目前不支持跨平台的卸载操作。
用户在注册后,可直接登录管理控制台,选择“数据仓库服务”。 有关集群管理的更多内容,请参见管理集群。 REST API方式 支持使用GaussDB(DWS)提供的REST API接口以编程的方式管理集群。
基本概念 账号 用户注册时的账号,账号对其所拥有的资源及云服务具有完全的访问权限,可以重置用户密码、分配用户权限等。由于账号是付费主体,为了确保账号安全,建议您不要直接使用账号进行日常管理工作,而是创建用户并使用他们进行日常管理工作。
行存不带索引批量导入时,数据页copy导入会产生logical newpage相关的xlog日志,在xlog量大于默认值时同样会触发流控。
与云解析服务的关系 数据仓库服务使用云解析服务(Domain Name Service,DNS)可以提供域名映射到GaussDB(DWS)集群的IP地址。
注意事项 执行脚本前需设置环境变量,可参考《开发指南》中“导入数据>通过外表并行导入>安装配置和启动GDS”章节。 脚本需要在python 3环境下运行。 必须在root用户下执行脚本。 必须指定-t、--host参数。
纯文本格式 自定义归档格式 目录归档格式 tar归档格式 纯文本格式数据文件导入请参见使用gsql元命令\COPY导入数据。 自定义归档格式、目录归档格式和tar归档格式数据文件导入请参见使用gs_restore导入数据。 模式级导出。 导出模式的全量信息。 仅导出模式中数据。
-p 8000 -h “集群地址”如果通过公网地址连接,请指定为集群“公网访问地址”或“公网访问域名”,如果通过内网地址连接,请指定为集群“内网访问地址”或“内网访问域名”。
COPY导入执行完成后,建议继续设置session_timeout=10min,因为如果有客户端长时间连接数据库,但对数据库不进行任何操作,该连接将一直占用一个线程,如果这样的客户端连接很多,就会出现大量的线程都被空闲的连接占用,从而导致数据库连接满或者资源浪费。