检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
产品介绍 服务概述 数据仓库咨询与规划服务旨在帮助企业或组织构建和优化其数据仓库系统。该服务指华为云数据仓库GaussDB(DWS)专家团队为客户数据仓库上云迁移、系统容量规划、数据仓库架构设计与改造、系统性能调优等进行调研、评估、规划、设计和咨询,以及对数据仓库的性能、安全性和可扩
le占用了大量宝贵的网络资源,减小不必要的数据shuffle,可以减少网络压力,使数据的处理本地化,以提高集群的性能和可支持的并发度。通过对关联条件和分组条件的仔细设计,能够尽可能的减少不必要的数据shuffle。 选择分布方案 表的分布方式的选择如表2 表的分布方式及使用场景所示。
如何设计宽表主键 GeminiDB Cassandra是一款分布式数据引擎,宽表引擎中的数据均按照主键进行分布。在执行查询时,如果表中存在多列主键,系统会从最左边的主键开始匹配。如果主键设置不当,则可能导致主键无法被有效利用,进而产生热点问题,影响查询性能。因此,在数据分区和数据
DB(DWS)不保证非日志表(unlogged table)数据的安全性。 【建议】临时表和非日志表的存储方式建议和基表相同。当基表为行存(列存)表时,临时表和非日志表也推荐创建为行存(列存)表,可以避免行列混合关联带来的高计算代价。 【建议】索引字段的总长度不超过50字节。否则
获取数据仓库的数据列表 功能介绍 获取数据仓库的数据列表 URI POST /v1.0/{project_id}/common/warehouses/{data_warehouse_id}/data 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
获取数据仓库列表信息 功能介绍 获取数据仓库列表 URI GET /v1.0/{project_id}/common/warehouses 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目id,获取方法请参见获取项目ID 表2 Query参数
询性能。对于Hash分布表,在读/写数据时可以利用各个节点的IO资源,提升表的读/写速度。 重写查询和配置工作负载管理 (WLM) 通常可进一步提升查询性能。有关更多信息,请参阅优化查询性能概述。 基于调优表实践的具体步骤,您可以进一步应用“基于表结构设计和调优提升GaussDB
业务指标设计 业务指标设计用户定义和计算数据仓库中的业务指标。支持导入DataArts Studio的业务指标文件。 新建业务指标 架构师进入到对应空间和方案后,选择对应信息架构的业务指标设计,选择DataArts Studio的Region、实例和空间,点击确定后将会自动跳转到
联条件和分组条件的仔细设计,能够尽可能的减少不必要的数据shuffle。 选择存储方案 【建议】表的存储类型是表定义设计的第一步,客户业务类型是决定表的存储类型的主要因素,表存储类型的选择依据请参考表1。 表1 表的存储类型及场景 存储类型 适用场景 行存 点查询(返回记录少,基于索引的简单查询)。
【建议】表的存储类型是表定义设计的第一步,客户业务类型是决定表的存储类型的主要因素,表存储类型的选择依据请参考表1。 表1 表的存储类型及场景 存储类型 适用场景 行存 点查询(返回记录少,基于索引的简单查询)。 增、删、改操作较多的场景。 选择分区方案 当表中的数据量很大时,应当对表进行分区,一般需要遵循以下原则:
用了大量宝贵的网络资源,减少不必要的数据shuffle,可以减少网络压力,使数据的处理本地化,以提高集群的性能和可支持的并发度。通过对关联条件和分组条件的仔细设计,能够尽可能的减少不必要的数据shuffle。 选择分布方案 表的分布方式的选择如表1所示。 表1 表的分布方式及使用场景
Zone总体设计原则 不需要把企业内部的完整组织结构映射到华为云上,只把那些负责管理IT系统的组织单元(如部门、分公司)和使用IT资源的用户映射到华为云上。如行政部门不管理、不查看、不操作任何云上IT资源,就不需要在华为云上创建一个对应行政部门的组织;如财务小张不负责IT系统的成本核算
应提供标准、简单的应用输出,为应用维护人员提供明确的进度显示、错误描述和运行结果;为业务人员提供明确、直观的报表、凭证输出。 程序编写原则 在PL/pgSQL中的SQL语句宜使用绑定变量。 在PL/pgSQL中的SQL语句宜使用RETURNING子句。 存储过程使用原则: 对于单个存储过程中v
态桥梁,引入华为云丰富的工业软件生态,实现价值共享。 建营并重 平台将采用“建设,运营”一体化设计,实现“建设、运营、应用”协同推动,建设方优先作为相应板块的运营主体。在项目建设设计方案阶段,即考虑未来的运营需求。在充分满足项目公共技术需求的基础上,大程度的兼顾“商业运营”需求,
际业务含义的英文词汇或汉语拼音,但规则应该在集群范围内保持一致。 变量名的关键是要具有描述性,即变量名称要有一定的意义,变量名要有前缀标明该变量的类型。 【建议】表对象的命名应该可以表征该表的重要特征。例如,在表对象命名时区分该表是普通表、临时表还是非日志表: 普通表名按照数据集的业务含义命名。
史会话信息导致的对象冲突。 如果在连接中设置了GUC参数,那么在将连接归还连接池之前,必须执行“SET SESSION AUTHORIZATION DEFAULT;RESET ALL;”将连接的状态清空。 如果使用了临时表,那么在将连接归还连接池之前,必须将临时表删除。 CopyManager
指标设计 业务指标 技术指标 父主题: 数据架构
应提供标准、简单的应用输出,为应用维护人员提供明确的进度显示、错误描述和运行结果;为业务人员提供明确、直观的报表、凭证输出。 程序编写原则 在PL/PGSQL中的SQL语句宜使用绑定变量。 在PL/PGSQL中的SQL语句宜使用RETURNING子句。 存储过程使用原则: 对于单个存储过程中Varchar或者V
步骤3:调优表操作具体步骤 选择存储方式 此实践中所使用的样例表为典型的TPC-DS表,是典型的多字段表,统计分析类查询场景多,因此选择列存存储方式。 1 WITH (ORIENTATION = column) 选择压缩级别 在步骤1:创建初始表并加装样例数据中没有指定压缩比,
考成员管理)。 空间内的架构师角色用户均可进行架构设计,仅允许架构设计责任人(即新建方案环节指定的设计责任人)提交设计审核。 创建集成架构时选择的部署环境即为该集成架构的部署底座,支持多选,与该方案的底座有关,且方案设计时可供选择的图元也具备图元属性。 示例1:该方案为华为云底座