华为云用户手册

  • 绑定企业项目 在 GaussDB (DWS)中,用户可以在创建集群时为集群选择所属的企业项目,从而将GaussDB(DWS)集群与企业项目进行关联,详情请参见创建GaussDB(DWS)存算一体2.0集群。在选择“企业项目”的下拉列表中,将显示用户在企业项目服务中已创建的项目。系统还内置了一个缺省的企业项目“default”,如果用户没有为集群选择企业项目,将使用缺省项目“default”。 注意,目前企业项目服务仍处于公测期间,仅允许有公测权限的用户设置企业项目,普通用户无法看到企业项目相关信息。 在集群创建过程中,如果集群与企业项目绑定成功,则集群创建成功,如果绑定失败,系统会发送告警,集群就会创建失败。 在为GaussDB(DWS)集群创建快照时,会同时保存集群与企业项目的关联关系,在恢复集群时,也会恢复企业项目的关联关系。 当删除GaussDB(DWS)集群时,GaussDB(DWS)集群与企业项目的关联关系就会被自动删除。
  • 查看企业项目 在集群创建成功后,您可以在集群列表和集群详情页面查看集群关联的企业项目。用户只能查询到有访问权限的项目下的集群资源。 在集群管理页面的集群列表中,查看集群所属的企业项目。 图1 查看企业项目 在集群列表中,找到所需要的集群,然后单击集群名称,进入“集群详情”页面,可以查看与集群关联的企业项目。单击企业项目的名称,可以跳转到企业管理的控制台页面对该企业项目进行查看或编辑。 图2 查看集群的企业项目 同时,在企业管理的控制台上,查询指定项目中的资源列表时,也可以查询到GaussDB(DWS)服务的资源。
  • 将集群迁入或迁出企业项目 一个GaussDB(DWS)集群只能关联一个企业项目。当集群创建成功后,可以在企业管理的控制台上,执行迁出操作,将GaussDB(DWS)集群从当前所属的企业项目中迁出到另一个企业项目中;或者执行迁入操作,在指定的企业项目中迁入另一个企业项目中的GaussDB(DWS)集群。迁入迁出后,GaussDB(DWS)集群与新的企业项目进行关联,GaussDB(DWS)集群与原企业项目的关联关系将被自动解除。 迁入的详细操作,请参考《企业管理用户指南》的为企业项目迁入资源。 迁出的详细操作,请参考《企业管理用户指南》的迁出企业项目资源。
  • 约束与限制 自定义登录限制: 新增数据源选择不同的集群,然后输入用户名和密码,测试连接后可以打开集群数据连接。 登录时最好勾选记住密码,如果不填数据库默认是gaussdb数据库。 自定义连接根据租户+用户做了用户权限隔离,不同的子用户看到的连接不同,每个用户只能看到自己创建的连接。 IAM 用户登录限制: 需要IAM用户并且已授权DWS Database Access角色权限才能登录,否则编辑面板置灰,无法编辑。此时需联系有“DWS Administrator”权限的用户在当前页面完成对GaussDB(DWS)的委托授权。 IAM用户目前登录DWS集群数据库后没有任何权限,需要在用户管理界面对给IAM用户赋权才能操作。 连接超时限制: 后台设置了连接的超时时间,如果超时30分钟没有任何操作,则需要重新登录。 连接采用“用户登录ID+DATABASE”的方式做唯一缓存,保证每个用户连接每个数据库使用一个连接,保证每次操作在一个连接上进行执行。 针对一个数据源下的同一个数据库,不建议开多个窗口执行SQL命令,因为同一个数据库下建立的是同一个连接,开多个窗口也需等待前面SQL执行完后才会继续执行。
  • 场景介绍 大规模数据库集群通常会同时包含很多业务数据,不同业务有不同的数据表,可以通过资源管理功能创建多个资源池来实现不同业务的资源隔离。GaussDB(DWS)支持将不同业务用户分配给不同资源池,以便减少业务之间资源(CPU资源、内存资源、IO资源和存储资源)竞争。 但随着业务规模不断扩大,集群系统中的业务数目越来越多,通过划分多个资源池来管理越来越难以控制资源竞争。由于GaussDB(DWS)的分布式架构,业务数据被分散存储在多个节点上即每个表都会分布在数据库集群的所有DN节点上,因此每次数据表操作都可能会涉及所有DN节点,导致网络压力增大和系统资源大量消耗,仅通过扩大集群规模也很难解决,GaussDB(DWS)建议用户划分多个逻辑集群来解决业务数量扩大带来的网络压力和资源消耗问题。 通过划分独立的逻辑集群,将新增的业务分配到独立的逻辑集群上,这样新增业务对原有业务的影响会很小。而原有逻辑集群中的业务规模如果扩大,也可以通过对原有逻辑集群扩容来解决。 如图1所示,假设某企业原有业务数据表都在原物理集群dws-demo(绿色部分),切换到逻辑集群lc1(蓝色部分)后,物理集群再通过扩容方式,新增一套新的逻辑集群lc2,原有业务数据表统一切换到逻辑集群lc1,新的业务数据表统一写入到逻辑集群lc2,实现新老业务的数据隔离。而新的逻辑集群lc2关联的用户u2,通过授权可以跨逻辑集群访问逻辑集群lc1的表。 集群规模:从原始的物理集群3节点,扩容到6节点并拆分成2套逻辑集群。 业务隔离:新、老业务数据隔离在不同逻辑集群中。
  • 创建逻辑集群关联用户并实现跨逻辑查询数据 以系统管理员连接数据库,执行以下SQL语句查询原业务表name。 验证转换后,业务数据查询正常。 1 SELECT * FROM name; 执行以下语句创建u1关联逻辑集群lc1,u2关联逻辑集群lc2。 1 2 CREATE USER u1 NODE GROUP "lc1" PASSWORD '{password}'; CREATE USER u2 NODE GROUP "lc2" PASSWORD '{password}'; 以用户u1登录数据库,创建新表u1.t1并插入两条数据,同时授权用户u2可以访问该表。 1 2 3 4 CREATE TABLE u1.t1 (id int, name varchar(20)); INSERT INTO u1.t1 VALUES (1,'joy'),(2,'lily'); GRANT USAGE ON SCHEMA u1 TO u2; GRANT SELECT ON TABLE u1.t1 TO u2; 以用户u2登录数据库,查询原业务表t1数据,提示无权访问逻辑集群lc1。结果表明,即使用户u1已经授权了u2可以访问该表,但是由于这张表在不同的逻辑集群,所以仍然无法访问,证明逻辑集群间数据隔离。 1 SELECT * FROM u1.t1; 切回系统管理员dbadmin窗口,将逻辑集群lc1的访问权限授予用户u2。 1 GRANT USAGE ON NODE GROUP lc1 TO u2; 再次切到用户u2窗口,查询表t1成功。结果验证绑定了逻辑集群lc2的用户可以跨逻辑集群查询到原业务表t1。实现逻辑集群间的数据共享。 1 SELECT * FROM u1.t1;
  • 背景信息 逻辑集群支持手动添加增删计划和自动弹性增删能力。支持在计划时间段内,动态创建、删除计算逻辑集群,实现计算资源动态伸缩。 通过手动添加定时增删计划创建的逻辑集群主要用于提供计算能力,关联用户后该用户的查询都会切换到该逻辑集群上,同时建表语句仍在原始的逻辑集群上。 一个用户仅支持绑定到一个计算逻辑集群上。 若删除逻辑集群时,该逻辑集群关联的用户有业务运行,可能会出现报错。 通过打开自动弹性开关创建的逻辑集群主要用于提供并发扩展能力,关联主逻辑集群后,主逻辑集群的部分查询路由到该逻辑集群上,同时建表语句仍在原始的逻辑集群上。 开启并使用并发扩展功能,当系统面临高并发作业,主集群因为内存等资源不足出现排队时,DWS会自动增加额外的集群容量来处理增多的读取和写入语句,减少语句排队时间。不管语句在主集群上运行还是在并发扩展集群上运行,用户都将看到最新的数据,且性能相当。您可以通过配置资源池来管理将哪些语句发送到并发扩展集群。开启并发扩展后,符合条件的语句将发送到并发扩展集群,而不是排队等待。并发扩展功能限制如下: 仅支持V3表和foreign外表。如果为复制表,仅支持SELECT。 仅支持SELECT、INSERT、UPDATE、DELETE语句。 不支持COPY导入。 不支持UPSERT语句。 不支持事务块。 不支持存储过程。 不支持带RETURNING子句和WITH RECURSIVE递归语句。 不支持轻量级更新。 不支持INSERT单个VALUES或者类似generate_series生成的语句。 手动增删计划支持存算分离(DWS 3.0)集群,历史版本需要联系技术支持人员升级使用。 自动弹性增删仅支持存算分离(DWS 3.0)集群和E CS 规格的集群,且仅9.1.0及以上集群版本支持。 存算分离(DWS 3.0)集群包年/包月集群在定时增加逻辑集群时自动扩容节点,节点按需计费。
  • 磁盘扩容概述 随着客户业务的发展,磁盘空间往往最先出现资源瓶颈,在其他资源尚且充足的情况下,执行传统扩容操作不仅耗时久,还伴随着资源浪费问题。通过磁盘扩容可快速缓解存储资源瓶颈现象,操作过程中无需暂停业务,并且不会造成CPU、内存等资源浪费。用户可在没有其他业务情况下选择磁盘扩容操作,扩容成功后如果磁盘空间仍不足可以继续磁盘扩容,若扩容失败用户可尝试重新进行磁盘扩容操作。 磁盘扩容功能仅8.1.1.203及以上版本支持,并且创建集群规格需要为存算一体SSD云盘类型。 集群状态为“可用”、“待重启”、“只读”、“非均衡”、“节点故障”或者 “不可用”的情况下才能下发磁盘扩容。
  • 场景介绍 如果在不同时段内业务流量差异非常大,3节点集群又无法满足高峰期的吞吐量要求,但扩容至6节点又存在资源浪费或费用较高问题。用户可通过本章教程再结合弹性增删逻辑集群功能,实现类似于“晚上低峰期3节点,白天6节点,高峰期9节点”的弹性扩展功能。 本章演示了一组新扩容逻辑集群(无业务数据)配置为只读,并将部分用户切换到此只读逻辑集群上,实现用户创建的表都仍然在其原始的NodeGroup上,但计算逻辑都切到只读逻辑集群上执行效果。
  • 配置只读逻辑集群,并将用户切换到只读逻辑集群上 以系统管理员dbadmin连接数据库,执行以下SQL语句查看逻辑集群创建成功。 1 SELECT group_name FROM PGXC_GROUP; 设置逻辑集群lc1为只读。 1 2 3 SET xc_maintenance_mode=on; ALTER NODE GROUP lc1 SET READ ONLY; SET xc_maintenance_mode=off; 创建用户。 1 create user testuser password 'testuser12#$%'; 绑定用户到逻辑集群lc1,如下语句中的testuser、lc1等变量需结合实际情况替换。 首先我们需要找到用户的NodeGroup,如果能查到记录,将其设置到该用户的default_storage_nodegroup上,以便该用户创建的表都仍然在其原始的NodeGroup上;若查不到记录,直接进行后面的两条alter语句即可。 1 2 SELECT nodegroup FROM pg_user WHERE usename='testuser'; ALTER USER testuser SET default_storage_nodegroup='nodegroup'; //这里nodegroup需替换为上述SQL查到的NodeGroup名 同时将用户绑定到新的只读逻辑集群上,这样该用户的计算逻辑都会切到只读逻辑集群上执行。 1 2 ALTER USER testuser NODE GROUP lc1; ALTER USER testuser SET enable_cudesc_streaming=ON;
  • 前提条件 有可用的LakeFormation实例。详情请参见《 湖仓构建 使用指南》中的“创建LakeFormation实例”章节。 创建包含LakeFormation权限的委托(需包含最小权限),可参见《湖仓构建使用指南》中的“数据权限授权”章节配置权限,如果不配置在使用时将会报错。 DWS调用LakeFormation管控面API时,账号如果为子账号则需要包含LakeFormation权限(至少包含lakeformation:instance:access、lakeformation:instance:describe)。
  • 添加资源池 登录GaussDB(DWS)管理控制台。 在集群列表中单击需要访问“资源管理”页面的集群名称。 切换至“资源管理”页签。 单击资源池列旁的“添加资源池”按钮添加资源池。 最多可创建63个资源池。 参见表1填写资源池的名称和相关资源配置。 表1 资源池参数 参数项 描述 默认值 名称 资源池的名称。 - CPU资源(%) 共享配额:关联在当前资源池的用户在执行作业时可以使用的CPU时间比例,取值范围为1-99的整数。 专属限额:限定资源池中数据库用户在执行作业时可使用的最大CPU核数占总核数的百分比,取值范围为0-100的整数,0表示不限制。 说明: 所有资源池的总和不能超过99%。当配置CPU共享配额后,如果当前只有一个资源池时,该参数不生效。 共享配额非绝对限制,只有在发生CPU竞争时才生效。例如,资源池A和B被绑定在CPU1运行,当A和B均运行时参数生效,只有A运行则参数不生效。 所有资源池的CPU专属限额总和最大不能超过100%,系统默认的CPU专属限额(%)为0。 CPU专属限额仅8.1.3及以上集群版本支持。 - 内存资源(%) 资源池所占用的内存百分比。 内存和查询并发支持单独管控和联合管控,联合管控时必须同时满足并发和内存要求时作业才能下发。 0(不限制) 存储资源(MB) 可使用的永久表空间大小。 该值是资源池下所有DN的表空间总值,单DN节点可用空间=设置值 / DN节点数。 -1(不限制) 复杂语句并发 资源池中的最大查询并发数。 内存和查询并发支持单独管控和联合管控,联合管控时必须同时满足并发和内存要求时作业才能下发。 10 网络带宽权重 网络调度时权重值。取值范围为1~2147483647的整数,默认配置为-1。 注意: 网络带宽权重仅8.2.1及以上集群版本支持,存算分离(DWS 3.0)集群不支持。 -1(不限制) 核对信息后,单击“确定”,添加资源池完成。 父主题: 资源池
  • GaussDB(DWS)使用流程介绍 图1 GaussDB(DWS)使用流程 表1 GaussDB(DWS)使用流程介绍 主流程 子任务 说明 操作指导 准备工作 - 在使用GaussDB(DWS)服务之前,需要申请华为云账户。 准备工作 创建集群 - 在使用GaussDB(DWS)执行数据分析任务前,您首先要创建一个集群。一个GaussDB(DWS)集群由多个在相同子网中的节点组成,共同提供服务。创建集群时,系统会创建一个默认数据库。 创建GaussDB(DWS)存算一体2.0集群 创建包年/包月集群 连接集群 - GaussDB(DWS)集群创建完成后,您就可以使用SQL客户端工具或者JDBC/ODBC等第三方驱动程序连接集群中的数据库。进入GaussDB(DWS)控制台的“连接客户端”页面,您可以下载SQL客户端工具和JDBC/ODBC驱动程序。 连接GaussDB(DWS)集群 访问数据库 - 连接集群后,您就可以创建和管理数据库,管理用户及权限,导入或导出数据,以及查询和分析数据。 《 数据仓库 服务数据库开发指南》 管理和监控集群 管理集群 您可以查看集群状态,修改集群配置,添加集群标签,对集群进行扩容、重启、删除等管理操作。 GaussDB(DWS)集群管理 管理快照 通过创建集群快照,可以对集群进行备份,使用快照可以恢复集群。 备份与恢复GaussDB(DWS)集群 运维与监控 您可以通过监控集群、审计日志、事件通知和资源负载管理了解集群的运行状况和性能。 在Cloud Eye查看GaussDB(DWS)集群监控 事件通知 GaussDB(DWS)集群日志管理 GaussDB(DWS)资源负载管理 扩容与规格变更 当需要更多的计算资源或存储资源以满足业务需要时,可以在管理控制台对已有集群进行扩容操作。 集群创建后,支持通过管理控制台变更集群规格。 集群扩容 GaussDB(DWS)集群规格变更 升级集群 8.1.1及以上集群版本支持用户自助通过管理控制台下发集群升级操作。 GaussDB(DWS)集群升级 资源负载管理 GaussDB(DWS)提供了资源管理功能,用户可以根据自身业务将资源(CPU、内存、IO和存储空间)按需划分成不同的资源池,不同资源池之间资源互相隔离。 GaussDB(DWS)资源负载管理
  • 约束与限制 对于有数据可靠性要求的用户,尤其是针对业务方无法通过上游重新导入进行数据恢复的场景,集群需要备份操作,避免人为或其他因素造成数据丢失后无法恢复。 Schema粒度快照支持集群版本如下所示(如果当前控制台界面不支持该功能,请联系技术支持人员)。 9.1.0.100及以上集群版本。 8.3.0.110及以上集群版本。 8.2.1.230及以上的8.2.1.2xx集群版本。 OBS快照存储空间与计费说明: GaussDB(DWS)提供的免费存储空间等于集群存储空间,即单节点存储空间大小 * 节点数。 GaussDB(DWS)提供了部分免费存储空间,用于存放集群备份时的快照数据。当快照数据存储空间超过免费空间大小时,超出部分按照OBS的计费规则进行计费,计费详情参见OBS价格详情。 快照服务依赖及部署说明: 快照管理功能依赖于OBS、NFS的备份介质。 备份设备为NFS的备份介质时,使用挂载盘的方式,依赖云上SFS-Tubor服务。具体配置步骤请参见11.1.3.2-自动快照策略配置备份介质。 当前快照恢复到新集群时仅支持OBS介质。 GaussDB(DWS)根据快照创建的新集群与生成快照的原始集群具有相同的配置,即节点的数量和规格、内存、磁盘与原集群一致。 根据快照创建新集群时,如果没有指定其他值,则参数默认与生成快照时的备份信息保持一致。 存算一体(单机部署)暂不支持快照功能。 存算分离(DWS 3.0)集群仅9.0.2及以上集群版本支持快照功能。 存算分离(DWS 3.0)集群混合计费的快照恢复场景目前只支持恢复到全包年/包月或者全按需情况,即如果此集群有三个包年/包月节点和三个按需节点,如果恢复成包年/包月,那么此时六个节点都是包年/包月;如果恢复成按需,那么这六个节点都是按需。 快照生成期间,请避免进行Vacuum Full操作,否则可能会导致集群只读。 创建快照时因备份数据会降低磁盘I/O性能,建议在业务相对空闲的时期进行快照操作。 快照期间会保留一些中间文件,需额外占用磁盘空间,因此请避开业务高峰期并保证磁盘容量在70%以下。
  • 统一身份认证 服务的关系 数据仓库服务使用统一身份认证服务(Identity and Access Management,简称IAM)实现认证和鉴权功能。 需要拥有DWS Administrator权限的用户才能完整使用数据仓库服务。如需开通该权限,请联系拥有Security Administrator权限的用户或者申请新的具有DWS Administrator权限的用户。拥有DWS Database Access权限的用户,可以基于IAM用户生成临时数据库用户凭证以连接GaussDB(DWS)集群数据库。
  • 产品优势 GaussDB(DWS)数据库内核自主研发,兼容PostgreSQL的数据库内核引擎,从单机OLTP数据库改造为企业级MPP(大规模并行处理)架构的OLAP 分布式数据库 ,其主要面向海量数据分析场景。 GaussDB(DWS)与传统数据仓库相比,主要有以下特点与显著优势,可解决多行业超大规模数据处理与通用平台管理问题: 易使用 一站式可视化便捷管理 GaussDB(DWS)让您能够轻松完成从项目概念到生产部署的整个过程。通过使用GaussDB(DWS)管理控制台,您不需要安装数据仓库软件,也不需要部署数据仓库服务器,就可以在几分钟之内获得高性能、高可靠的企业级数据仓库集群。 您只需单击几下鼠标,就可以轻松完成应用程序与数据仓库的连接、数据备份、数据恢复、数据仓库资源和性能监控等运维管理工作。 与大数据无缝集成 您可以使用标准SQL查询HDFS、 对象存储服务 (Object Storage Service,OBS)上的数据,数据无需搬迁。 提供一键式异构数据库迁移工具 GaussDB(DWS)提供配套的迁移工具,可支持MySQL、Oracle和Teradata的SQL脚本迁移到GaussDB(DWS)。 高性能 云化分布式架构 GaussDB(DWS)采用全并行的MPP架构数据库,业务数据被分散存储在多个节点上,数据分析任务被推送到数据所在位置就近执行,并行地完成大规模的数据处理工作,实现对数据处理的快速响应。 查询高性能,万亿数据秒级响应 GaussDB(DWS)通过算子并行执行、向量化执行引擎实现指令在寄存器并行执行,以及LLVM动态编译减少查询时冗余的条件逻辑判断,助力数据查询性能提升。 GaussDB(DWS)支持行列混合存储,可以同时为用户提供更优的数据压缩比(列存)、更好的索引性能(列存)、更好的点更新和点查询(行存)性能。 数据加载快 GaussDB(DWS)提供了GDS极速并行大规模数据加载工具。 列存下的数据压缩 对于非活跃的早期数据可以通过压缩来减少空间占用,降低采购和运维成本。 GaussDB(DWS)列存储压缩支持Delta Value Encoding、Dictionary、RLE 、LZ4、ZLIB等压缩算法,且能够根据数据特征自适应的选择压缩算法,平均压缩比7:1。压缩数据可直接访问,对业务透明,极大缩短历史数据访问的准备时间。 易扩展 按需扩展:Shared-Nothing开放架构,可随时根据业务情况增加节点,扩展系统的数据存储能力和查询分析性能。 扩容后性能线性提升:容量和性能随集群规模线性提升,线性比0.8。 扩容不中断业务:扩容过程中支持数据增、删、改、查,及DDL操作(Drop/Truncate/Alter table),表级别在线扩容技术,扩容期间业务不中断、无感知。 支持在线升级:8.1.1及以上源版本支持大版本在线升级,8.1.3及以上源版本支持补丁在线升级,升级期间用户无需停止业务,业务存在闪级秒断。 高可靠 事务管理 支持事务块,用户可以通过start transaction命令显式启动一个事务块。 支持单语句事务,用户不显式启动事务,则单条语句就是一个事务。 分布式事务管理。支持全局事务信息管理,包括gxid、snapshot、timestamp的管理,分布式事务状态管理,gxid溢出的处理。 分布式事务支持ACID特性(Atomicity,Consistency,Isolation,Durability),数据强一致保证。 支持分布式死锁预防,保证在出现死锁时自动解锁或者预防死锁。 全方位HA设计 GaussDB(DWS)所有的软件进程均有主备保证,集群的协调节点(CN)、数据节点(DN)等逻辑组件全部有主备保证,能够保证在任意单点物理故障的情况下系统依然能够保证数据可靠、一致,同时还能对外提供服务。 安全 GaussDB(DWS)支持数据透明加密,同时可与数据库安全服务(DBSS)对接,基于网络隔离及安全组规则,保护系统和用户隐私及数据安全。GaussDB(DWS)还支持自动数据全量、增量备份,提升数据可靠性。 低成本 按需付费:GaussDB(DWS)按实际使用量和使用时长计费。您需要支付的费率很低,只需为实际消耗的资源付费。 门槛低:您无需前期投入较多固定成本,可以从低规格的数据仓库实例起步,后续随时根据业务情况弹性伸缩所需资源,按需开支。
  • 支持多种数据库工具 GaussDB(DWS)提供了以下几款自研工具,用户可以在GaussDB(DWS)管理控制台下载相关的工具包。有关工具的详细指导请参见《数据仓库服务工具指南》。 gsql工具 它是一款运行在Linux操作系统的命令行SQL客户端工具,用于连接GaussDB(DWS)集群中的数据库,并对数据库进行操作和维护。 Data Studio工具 它是一款运行在Windows操作系统上的图形界面SQL客户端工具,用于连接GaussDB(DWS)集群中的数据库、管理数据库和数据库对象,编辑、运行、调试SQL脚本,查看执行计划等。 GDS工具 它是GaussDB(DWS)提供的数据服务工具,通过和外表机制的配合,实现数据的高速导入导出。 GDS工具包需要安装在数据源文件所在的服务器上,数据源文件所在的服务器称为数据服务器,也称为GDS服务器。 DSC SQL语法迁移工具 DSC(Database Schema Convertor)是一款运行在Linux或Windows操作系统上的命令行工具,致力于向客户提供简单、快速、可靠的应用程序SQL脚本迁移服务,通过内置的语法迁移逻辑解析源数据库应用程序SQL脚本,并迁移为适用于GaussDB(DWS)数据库的应用程序SQL脚本。 DSC支持迁移Teradata、Oracle、Netezza、MySQL和DB2数据库的SQL脚本。 gs_dump和gs_dumpall gs_dump支持导出单个数据库或其内的对象,而gs_dumpall支持导出集群中所有数据库或各库的公共全局对象。 通过导入工具将导出的元数据信息导入至需要的数据库,可以完成数据库信息的迁移。 gs_restore 在数据库迁移场景下,支持使用gs_restore工具将事先使用gs_dump工具导出的文件格式,重新导入GaussDB(DWS)集群,实现表定义、数据库对象定义等元数据的导入。
  • 集群管理 一个GaussDB(DWS)集群由多个在相同子网中的相同规格的节点组成,共同提供服务。GaussDB(DWS)为用户提供了简单易用的Web管理控制台,让用户可以快速申请集群,轻松执行数据仓库管理任务,专注于数据和业务。 集群管理的主要功能如下: 创建集群 如果用户需要在云上环境中使用数据仓库服务,首先应创建一个GaussDB(DWS)集群。用户可根据业务需求选择相应的产品规格和节点规格快速创建集群。您也可以先购买包年/包月,然后再创建集群。 管理快照 快照是GaussDB(DWS)集群在某一时间点的完整备份,记录了这一时刻指定集群的所有配置数据和业务数据,快照可用于还原某一时刻的集群。用户可以为集群手动创建快照,也可以开启定时创建自动快照。自动快照有保留天数限制,用户可以对自动快照进行复制,生成手动快照以便长期保留。 当您从快照恢复集群时,系统支持将快照数据恢复到新集群或者原集群中。 对于不再需要的快照,可以选择在控制台删除快照(自动快照不支持手动删除),以释放存储空间。 管理节点 用户可查看所创集群的节点列表,在节点管理页面可以清晰的查询各节点的状态、节点规格、是否已使用等信息。若用户需要进行大规模扩容操作时,可通过节点管理功能提前分批次添加准备好用于扩容的节点。例如需要新扩容180个节点,可分3批各添加60个,如果其中有一部分添加失败,可再次添加失败数量的节点,等180个节点添加成功后,再使用这些添加好的节点进行扩容,添加节点过程中不影响集群业务。 扩容集群 随着业务的增长,现有集群规模可能无法满足业务需要,此时,用户可以扩容集群,为集群增加计算节点。扩容时业务不中断。进行扩容操作时,用户可根据需求选择是否在线扩容和自动重分布。 管理重分布 默认情况下,在扩容之后将自动调起重分布任务,为了增强扩容重分布整个流程的可靠性,可以选择在扩容时关闭自动重分布功能,在扩容成功之后再手动使用重分布功能执行重分布任务,数据重分布后将大大提升业务响应速率。当前重分布支持离线重分布、在线重分布两种模式,默认情况下,提交重分布任务时将选择离线重分布模式。 磁盘扩容 随着客户业务的发展,磁盘空间往往最先出现资源瓶颈,在其他资源尚且充足的情况下,执行传统扩容操作不仅耗时久,还伴随着资源浪费问题。通过磁盘扩容可快速缓解存储资源瓶颈现象,操作过程中无需暂停业务,并且不会造成CPU、内存等资源浪费。用户可在没有其他业务情况下选择磁盘扩容操作,扩容成功后如果磁盘空间不够可以继续磁盘扩容,若扩容失败用户可尝试重新进行磁盘扩容操作。 资源管理 当您有多个数据库用户同时查询作业时,一些复杂查询可能会长时间占用集群资源,从而影响其他查询的性能。例如一组数据库用户不断提交复杂、耗时的查询,而另一组用户经常提交短查询。在这种情况下,短时查询可能不得不在队列中等待耗时查询完成。为了提高效率,GaussDB(DWS)提供了资源管理功能,GaussDB(DWS)资源管理以资源池为资源承载,对于不同的业务类型可以创建不同的资源池,为这些资源池配置不同的资源占比,并将数据库用户添加至对应的资源池中,以此来限制这些数据库用户的资源使用。 逻辑集群 逻辑集群是基于Node Group机制来划分物理节点的一种集群模式,从节点层次将大集群进行划分,和数据库形成交叉。一个数据库中的表可以按逻辑集群来分配到不同的物理节点,而一个逻辑集群也可以包含多个数据库的表。 重启集群 重启集群将有可能会导致正在运行中的业务数据丢失,如果需要执行重启操作,请确定不存在正在运行的业务,所有数据都已经保存。 删除集群 当用户不再需要集群时,可选择删除集群。此操作为高危操作,删除集群可能导致数据丢失,请谨慎操作。 GaussDB(DWS)为用户提供了以下两种方式管理集群: 管理控制台方式 使用管理控制台方式访问GaussDB(DWS)集群。用户在注册后,可直接登录管理控制台,选择“数据仓库服务”。 有关集群管理的更多内容,请参见管理集群。 REST API方式 支持使用GaussDB(DWS)提供的REST API接口以编程的方式管理集群。如果用户需要将GaussDB(DWS)集成到第三方系统,用于二次开发,请使用API方式访问。 详细内容,请参见《数据仓库服务API参考》。
  • 多样化的数据导入方式 GaussDB(DWS)支持多数据源高效入库,典型的入库方式如下所示。详细指导请参见迁移数据到GaussDB(DWS)章节。 从OBS并行导入数据 使用GDS从远端服务器导入数据 从 MRS 导入数据到集群 从GaussDB(DWS)集群导入数据到新集群 使用gsql元命令\COPY导入数据 使用COPY FROM STDIN导入数据 使用 DLI 将数据导入GaussDB(DWS) 使用DRS将数据导入GaussDB(DWS) 使用 CDM 迁移数据到GaussDB(DWS) 使用DSC工具迁移SQL脚本 使用gs_dump和gs_dumpall命令导出元数据 使用gs_restore导入数据
  • 高可靠性 通过实例冗余、数据冗余,实现整个系统无单点故障。 数据多副本,且所有数据可手动备份至OBS。 自动隔离有故障的节点,利用副本重新恢复数据,并在必要时替换节点。 自动快照结合OBS存储,实现Region内容灾,若用户生产集群所处的地理位置发生自然灾害,或者集群内部出现了故障从而导致生产集群无法正常对外提供读写服务,那么灾备集群可以切换为生产集群,从而保障业务连续性。 当集群状态为“非均衡”时会出现某些节点主实例增多,从而负载压力较大,用户可在业务低峰期进行集群主备恢复操作。 用户使用客户端连接DWS集群时,如果用户仅连接一个CN节点地址,通过该CN节点内网IP或弹性公网IP连接时,只能连接到固定的CN节点上,存在CN单点问题。因此GaussDB(DWS)引入了弹性负载均衡服务,解决集群访问的单点问题。弹性负载均衡(ELB)是将访问流量根据转发策略分发到后端多台弹性云服务器的流量分发控制服务,可以通过流量分发扩展应用系统对外的服务能力,提高应用程序的容错能力。 当用户集群创建后,实际需要的CN数量会随着业务需求而发生变化,因此GaussDB(DWS)提供了增删CN节点功能,实现用户可以根据实际需求动态调整集群CN数量的要求。
  • 监控与审计 监控集群 GaussDB(DWS)与 云监控 (Cloud Eye)集成,使您能够对集群中的计算节点和数据库进行实时监控。详情请参见监控集群。 数据库监控 数据库监控(DMS)是为GaussDB(DWS)数据库提供多维度监控服务的系统,为客户数据库的快速、稳定运行提供保驾护航的能力。该功能对业务数据库使用的磁盘、网络、OS指标数据以及集群运行关键性能指标数据进行收集、监控、分析。通过综合收集到的多种类型指标,对数据库主机、实例、业务SQL进行诊断,及时暴露数据库中关键故障及性能问题,指导客户进行优化解决。详情请参见数据库监控(DMS)。 告警管理 告警管理包含查看告警规则、告警规则配置与告警信息订阅功能。其中,告警规则可以提供过去一周的告警信息统计与告警信息明细,方便用户自行查看租户下的告警。该功能以默认告警规则阈值的方式提供常用的GaussDB(DWS)告警监控,还允许用户根据自己的业务特点,自定义告警阈值。详情请参见告警管理。 事件通知 GaussDB(DWS)与 消息通知 服务对接,使您能够订阅事件并查看触发的各类事件。详情请参见事件通知。 审计日志 GaussDB(DWS)与 云审计 服务集成,使您能够对所有的管理控制台操作及API调用进行审计。详情请参见查看管理控制台关键操作审计日志。 GaussDB(DWS)数据库还会记录所有的SQL操作,包括连接尝试、查询和数据库的变动。详情请参见设置数据库审计日志。
  • 企业级数据仓库和标准SQL的支持 当创建好GaussDB(DWS)集群后,用户就可以使用SQL客户端工具连接集群,然后执行创建数据库、管理数据库、导入/导出数据以及查询数据的操作。 GaussDB(DWS)为用户提供了PB(petabyte)级高性能数据库,主要体现在: MPP大规模并行处理框架,支持行列混存、向量化执行,实现万亿数据关联分析秒级响应。 内存计算,基于Bloom Filter的Hash Join优化,性能提升2~10倍。 支持全对称分布式的Active-Active多节点集群架构,系统无单点故障。 基于电信技术优化的大规模集群通信,提升计算节点间的传输效率。 基于代价的智能优化器,根据集群规模、数据量、生成最优计划,提高执行效率。 GaussDB(DWS)具有完备的SQL能力: 兼容ANSI/ISO标准的SQL92、SQL99和SQL 2003语法标准,支持存储过程,支持GBK和UTF-8字符集,支持SQL标准函数与OLAP分析函数。 兼容PostgreSQL/Oracle/Teradata/MySQL数据库生态,与主流第三方数据库ETL,BI(business intelligence)工具厂商对接认证。 支持位图roaring bitmap数据类型及对应常见函数,在互联网、零售、教育、游戏等行业,提取用户特征、用户画像等场景有广泛应用。 在现有范围分区(Range Partitioning)基础上,新增支持list分区方式:PARTITION BY LIST (partition_key,[...]),满足用户使用习惯。 HDFS/OBS外表READ ONLY外表支持JSON文件格式。 支持系统表赋权给普通用户,VACUUM能够单独赋权,以及支持可扩展的预定义权限角色功能。 新增表级权限ALTER/DROP/VACUUM。 新增Schema级权限ALTER/DROP。 新增预置角色role_signal_backend、role_read_all_stats。 详细的SQL语法和数据库操作指导,请参见《数据仓库服务数据库开发指南》。
  • 步骤3:结束迁移 当完成迁移之后,可以结束迁移,结束迁移之后,会终止DRS迁移任务。数据将不会进行实例之间的同步,并且会释放迁移锁。TaurusDB实例开始计费,并且会进行一次全量备份。 您可以通过如下方法结束迁移。 在TaurusDB实例信息页面,单击“结束迁移”。 图15 结束迁移 在弹框中,确认需要结束的迁移实例信息,单击“是”。 图16 确认迁移结束实例信息 待结束迁移完成之后,TaurusDB实例就会和正常实例一样了。
  • 步骤2:业务流量切换 在TaurusDB实例信息页面,等待迁移状态到达“增量迁移中”,并且复制时延小于60秒时,进行业务流量切换。 图8 观察迁移状态和复制时延 单击“业务流量切换”。 在弹框中,确认迁移实例信息,单击“是”。 在TaurusDB实例信息页面,查看实例状态为“RDS一键迁移|vip切换中”。 业务切换完成,可以看到源实例和目标实例的读写状态发生了改变,读写内网地址也变成了RDS for MySQL的内网地址,数据复制方向也发生了变化。 图9 迁移完成后的读写状态和复制方向 图10 迁移成功后的IP信息 如果不想使用TaurusDB实例,也可以进行迁移恢复。您可以单击“迁移恢复”,在弹框中,确认恢复信息,单击“是”。 图11 迁移恢复 图12 迁移恢复弹框 迁移恢复完成之后,迁移信息又恢复到了迁移之前的状态。 图13 迁移恢复后的读写状态和复制方向 图14 迁移恢复后的IP信息
  • TaurusDB入门实践 您购买并连接到TaurusDB数据库实例后,可以根据自身的业务需求使用TaurusDB提供的一系列常用实践。 表1 TaurusDB常用最佳实践 实践 描述 读写分离 使用TaurusDB数据库代理实现读写分离 介绍通过TaurusDB的读写分离连接地址,写请求自动访问主节点,应用直连实现自动读写分离。 开启TaurusDB代理的事务拆分功能 介绍如何设置事务拆分,数据库代理会将事务内写操作之前的读请求转发到只读节点,降低主节点负载。 修改TaurusDB读写分离权重 介绍读写分离功能成功开启后,如何设置主节点和只读节点的权重值。 数据备份 设置TaurusDB自动备份策略 介绍如何在数据库实例的备份时段中创建数据库实例的自动备份,系统根据您指定的备份保留期保存数据库实例的自动备份。 手动备份TaurusDB 介绍如何为数据库实例手动备份数据,用户可以通过手动备份恢复数据,从而保证数据可靠性。 跨区域备份TaurusDB 介绍如何将备份文件存放到另一个区域存储,某一区域的实例故障后,可以在异地区域使用备份文件在异地恢复到新的TaurusDB实例,用来恢复业务。 数据恢复 全量数据恢复:按备份文件恢复 介绍如何使用已有的自动备份和手动备份,将实例数据恢复到备份被创建时的状态。该操作恢复的为整个实例的数据。 全量数据恢复:恢复到指定时间点 介绍如何使用已有的自动备份,恢复实例数据到指定时间点。 库表数据恢复:恢复到指定时间点 介绍如何使用已有的自动备份,恢复某个库表数据到指定时间点。 数据迁移 将MySQL迁移到TaurusDB 介绍使用DRS将表级、库级或实例级数据迁移到TaurusDB数据库。 使用mysqldump迁移TaurusDB数据 介绍使用mysqldump工具将数据复制到TaurusDB数据库。 自建MySQL迁移到TaurusDB 介绍使用DRS将自建MySQL迁移到TaurusDB数据库。 其他云MySQL迁移到TaurusDB 介绍使用DRS将其他云上MySQL数据库迁移到TaurusDB数据库。
  • 注意事项 公网访问会降低实例的安全性,请谨慎选择。为了获得更快的传输速率和更高的安全级别,建议您将应用迁移到与您的TaurusDB数据库在同一区域的弹性云服务器上。 TaurusDB使用您在VPC控制台购买的公网IP绑定到实例上,一个弹性公网IP只允许绑定一个TaurusDB实例,详细收费标准请参见:带宽和IP产品价格详情。 TaurusDB实例解绑弹性公网IP后,如果弹性公网IP是按需模式,则会继续收取IP保有费,您可以选择释放或者绑定到其他实例。
  • 测试连通性并安装MySQL-Front 打开cmd命令窗,测试是否可以正常连接到GaussDB(for MySQL)实例读写公网地址的端口。 telnet 读写公网地址 端口 如果提示command not found,请根据ECS使用的操作系统不同,自行安装telnet工具。 如果可以通信,说明网络正常。 如果无法通信,请检查安全组规则。 查看ECS的安全组的出方向规则,如果目的地址不为“0.0.0.0/0”且协议端口不为“全部”,需要将GaussDB(for MySQL)实例的读写公网地址和端口添加到出方向规则。 图5 ECS的安全组 查看GaussDB(for MySQL)的安全组的入方向规则,需要将ECS实例的弹性公网IP地址和端口添加到入方向规则,具体操作请参见设置安全组规则。 在本地打开浏览器,下载并安装MySQL-Front工具(以5.4版本为例)。 图6 选择位置 图7 选择开始菜单 图8 选择附加任务 图9 完成
  • 购买ECS 登录管理控制台,查看是否有弹性云服务器。 有Linux弹性云服务器,参考通过公网连接GaussDB(for MySQL)实例(Linux方式)。 有Windows弹性云服务器,执行3。 无弹性云服务器,执行2。 购买弹性云服务器时,选择Windows操作系统。 由于需要在ECS下载MySQL客户端,因此需要为ECS绑定弹性公网IP(EIP)。 购买Windows弹性云服务器请参考《弹性云服务器快速入门》中“购买弹性云服务器”章节。 在ECS实例基本信息页,查看ECS实例的区域和VPC。 图1 查看ECS区域和VPC 在GaussDB(for MySQL)实例基本信息页,查看实例的区域和VPC。 图2 查看GaussDB(for MySQL)区域和VPC
  • 使用MySQL-Front连接实例 启动MySQL-Front客户端。 在连接管理对话框中,单击“新建”。 图10 连接管理 输入需要连接的实例信息,单击“确定”。 图11 添加信息 表1 参数说明 参数 说明 名称 连接数据库的任务名称。若不填写,系统默认与Host一致。 主机 在5中获取的读写公网地址。 端口 在5中获取的数据库端口,默认3306。 用户 实例的账号名称,默认root。 密码 要实例的账号所对应的密码。 在“连接管理”窗口,选中3创建的连接,单击“打开”,如下图所示。若连接信息无误,即会成功连接实例。 图12 打开登录信息
  • 实例连接方式简介 TaurusDB提供使用内网、公网和数据管理服务(Data Admin Service,简称DAS)连接实例的方式。 表1 连接方式 连接方式 连接地址 使用场景 说明 DAS连接 无需使用IP地址 华为云数据管理服务(Data Admin Service,简称DAS)是一款专业的简化数据库管理工具,提供优质的可视化操作界面,大幅提高工作效率,让数据管理变得既安全又简单。您可以通过数据管理服务连接并管理TaurusDB实例。TaurusDB默认为您开通了远程主机登录权限,推荐您使用更安全便捷的数据管理服务连接实例。 易用、安全、高级、智能。 推荐使用DAS连接。 内网连接 读写内网地址 系统默认提供内网IP地址。 当应用部署在弹性云服务器上,且该弹性云服务器与TaurusDB实例处于同一区域,同一VPC时,建议单独使用内网IP连接弹性云服务器与TaurusDB数据库实例。 安全性高,可实现TaurusDB的较好性能。 推荐使用内网连接。 公网连接 弹性公网IP 不能通过内网IP地址访问TaurusDB实例时,使用公网访问,建议单独绑定弹性公网IP连接弹性云服务器(或公网主机)与TaurusDB数据库实例。 降低安全性。 为了获得更快的传输速率和更高的安全性,建议您将应用迁移到与您的TaurusDB实例在同一VPC内 ,使用内网连接。 VPC:虚拟私有云(Virtual Private Cloud,简称VPC)。 ECS:弹性云服务器(Elastic Cloud Server,简称ECS)。 您可以通过数据管理服务(Data Admin Service,简称DAS),或其他数据库客户端登录使用云数据库。 若弹性云服务器和TaurusDB数据库实例处于同一个VPC内,则无需申请外网地址。 首次使用GaussDB(for MySQL),请先了解使用限制。 父主题: 步骤二:连接实例
共100000条