检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
一步:规格确认”按钮。 存算分离(DWS 3.0)集群“热数据存储”变更为“热存储(含缓存)”。 确认无误后,单击“提交”按钮提交磁盘扩容任务。 单击返回集群列表,显示磁盘扩容进度信息。 包年/包月集群磁盘扩容支持混合计费 前提条件 在业务高峰期,包年/包月集群在定时增加逻辑集群
集群的ID。获取方法,请参见获取集群ID。 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 num 是 Integer 批量增加CN节点任务完成,集群总CN数量。 集群支持的CN节点数量与集群当前版本和节点数量相关,具体支持范围可根据查询集群CN节点查询,其中“min_num”
location可以指定子目录如“gsfs://192.168.0.90:5000/2019/11/”实现同一张表根据日期导出到不同目录下。 现有版本在执行导出任务的时候会判断“/output_data/2019/11”目录是否存在,不存在则创建。导出时会将文件写入此目录下, 这样用户在创建或修改外表后就不需要再去手动执行“mkdir
collation explicitly. 执行SELECT时,指定字段a的排序规则为case_insensitive或者指定字段b的排序规则为C来保证字段排序规则的统一。 1 2 3 4 5 6 7 8 9 10 11 SELECT instr(a collate case_insensitive
一个已经过时的类型,以前用于所有上面这些用途。 声明用C编写的函数(不管是内置的还是动态装载的)都可以接受或者返回任何这样的伪数据类型。当伪类型作为参数类型使用时,用户需要保证函数的正常运行。 用过程语言编写的函数只能使用实现语言允许的伪类型。目前,过程语言不允许使用伪类型作为参数类型的,只允许使用void和re
是/否 查询计划。 字符串 SQL探针统计 探针任务的查询ID。 字符串 30s 统计SQL探针执行时长,用于监控集群性能是否会突然下降。 NA 集群ID。 字符串 集群项目编号。 字符串 探针SQL的任务类型。 字符串 探针SQL的任务的创建时间。 ≥ 0 SQL执行时间。 ≥ 0
enable_stream_recursive 参数说明:控制是否将with recursive关联查询下推DN分布式执行。 参数类型:USERSET 取值范围:布尔型 on表示支持使用with recursive关联查询下推DN分布式执行。 off表示不支持使用with recursive下推。 默认值:on
BY RANGE (partition_key)(range_partition_definition_list)指定的分区键值时,需要保证分区键值必须为可度量的常量或常量表达式。 GAUSS-00404: "argument name '%s' used more than once"
一个已经过时的类型,以前用于所有上面这些用途。 声明用C编写的函数(不管是内置的还是动态装载的)都可以接受或者返回任何这样的伪数据类型。当伪类型作为参数类型使用时,用户需要保证函数的正常运行。 用过程语言编写的函数只能使用实现语言允许的伪类型。目前,过程语言不允许使用伪类型作为参数类型,只允许使用void和rec
可以手动指定重分布的列,避免数据倾斜。 在选择分布键的时候,通常要根据数据分布特征选取一组distinct值比较高的列作为分布列,这样可以保证重分布后,数据均匀的分布到各个DN。 在编写好hint后,可以通过explain verbose+SQL打印执行计划,查看指定的分布键是否
可以手动指定重分布的列,避免数据倾斜。 在选择分布键的时候,通常要根据数据分布特征选取一组distinct值比较高的列作为分布列,这样可以保证重分布后,数据均匀的分布到各个DN。 在编写好hint后,可以通过explain verbose+SQL打印执行计划,查看指定的分布键是否
hmethod指定的HMAC算法,以keystr为密钥对decryptstr字符串进行解密,返回解密后的字符串。解密使用的keystr必须保证与加密时使用的keystr一致才能正常解密。 gs_encrypt_aes128(encryptstr, keystr) 以keystr为
缩容不支持回滚,支持重入。缩容数据重分布失败,不影响业务,用户可选择合适的时间尽快完成重分布,否则会导致数据长期分布不均匀。 重分布前,需要保证对应数据库下的data_redis为重分布预留schema,不允许用户操作该schema和其内部表。因为在重分布过程中,会使用到data_
hudi同步任务提交日志 ctime Timestamp 采集时间。 virtual_cluster_id Integer 集群虚拟ID。 host_id Integer 采集上报的节点ID。 task_id String 任务ID。 last_log String 最后任务日志。
可以手动指定重分布的列,避免数据倾斜。 在选择分布键的时候,通常要根据数据分布特征选取一组distinct值比较高的列作为分布列,这样可以保证重分布后,数据均匀的分布到各个DN。 在编写好hint后,可以通过explain verbose+SQL打印执行计划,查看指定的分布键是否
单击“确定 ”。 Data Studio在状态栏显示保存状态。 Data Studio将脚本保存为SQL文件,并为该文件设置读/写权限。为了保证文件安全,用户必须获取SQL文件所在文件夹的读写权限。 如果文件有修改或关联的文件不存在,将触发“另存为”操作。 在任何情况下,如果源文件
username IDENTIFIED BY '{Password}'; failed_login_attempts修改为0的方式仅为临时解决方案,为保证数据库安全,不建议failed_login_attempts设置为0。建议后续定位到对应作业后,尽快将作业的连接设置调整为正确密码,继续将
如zqdh=’000001),那么就应当尽量不用zqdh做分布列。 在满足前两条原则的情况,考虑选择查询中的连接条件为分布列,以便Join任务能够下推到DN中执行,且减少DN之间的通信数据量。 完成DWS集群的创建,参见创建集群。 连接DWS数据库,参见使用Data Studio
FATAL(致命):导致系统停止工作的、无法恢复的故障。该级别为最严重级别。 ERROR(错误):重大错误。 WARNING(警告):异常情况。系统在该情况下可能会继续处理任务。 INFO(提示):日志记录过程中的提示性日志。 DEBUG(调试):用于调试的详细信息。 DEBUG2(调试2):最详细的日志信息,通常会过滤不显示。该级别严重程度最轻。
max dn time和min dn time基本维持在相同水平400ms左右,Scan时间从6554ms优化到431ms。 触发因素:分布式场景,表分布列选择不合理会导致存储倾斜,同时导致DN间压力失衡,单DN IO压力大,整体IO效率下降。 解决办法:修改表的分布列使表的存储