检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
dest_datanode_remaining_disk_space_proportion ConfigNode 0.7 Region副本补齐时Region数据量占目标DataNode磁盘剩余空间的百分比,默认值为:70%。 说明: 该参数仅MRS 3.3.0及之后版本支持。
在Hive中用alter table ${Table_Name} drop partition (${PartitionName}<’XXXX’, ${PartitionName}>’XXXX’);删除分区(具体删除条件可灵活处理),减少Temporyary文件数。
” Hive执行insert into语句报错 增加Hive表字段超时 重启Hive服务失败 Hive分区数过多导致删除表失败 Hive执行msck repair table命令时报错 Hive执行insert into命令报用户权限不足 在Hive中drop表后如何完全释放磁盘空间
例如,在聚合场景中,将task个数从200减少到32,有些查询的性能可提升2倍。
如果直接翻译到物理实现,是很不经济的:一是每一个RDD(即使是中间结果)都需要物化到内存或存储中,费时费空间;二是join作为全局的barrier,是很昂贵的,会被最慢的那个节点拖死。
也可以通过增大Yarn客户端连接次数和连接时长的方式减少此事件发生的概率。
检查备集群的HBase服务实例中,是否已存在一个命名空间,与待启用容灾功能的HBase表所属的命名空间名称相同? 是,存在同名的命令空间,执行14。 否,不存在同名的命令空间,需先在备集群的hbase shell中创建同名的命名空间,然后执行14。
如果副本数量值大于3,则考虑减少该Topic的复制因子(减少为3)。
例如,在聚合场景中,将task个数从200减少到32,有些查询的性能可提升2倍。
根据官方建议和实践经验,在维度基数小于1万的时候,对维度字段做LowCardinality编码,导入性能会有略微下降,查询性能提升明显,数据存储空间下降明显。
在“磁盘使用率”列,检查ZooKeeper实例所在的各节点磁盘空间是否不足(使用率超过百分之80)。 是,执行9。 否,执行11。 参考ALM-12017 磁盘容量不足(2.x及以前版本)进行处理,对磁盘进行扩容。 在“告警管理”页签,查看该告警是否恢复。 是,处理完毕。
为了更好的服务客户,MRS提供两种方式来减少定位问题时的信息传递: 日志共享:用户可以在MRS页面发起日志共享,选择日志范围共享给运维人员,以便运维人员在不接触集群的情况下帮助定位问题。
占用的内存空间(MB) 慢查询SQL语句占用的内存大小统计,单位是MB。 操作 当前查询出来的慢SQL语句,可以单击“终止”结束该慢SQL语句查询。 慢查询过滤条件 选择对应的过滤条件,输入查询条件值进行过滤查询。
因为文件系统的存储空间足够,适合于大状态,长窗口,或大键值状态的有状态处理任务,也适合于高可用方案。
原因:确保缩容后剩余空间足够存放现有数据,并预留一部分空间。 说明: 为了保证数据的可靠性,HDFS中每保存一个文件则自动生成1个备份文件,即默认共2个副本。
表4 监控项 所属服务 监控指标项 说明 HDFS HDFS租户空间信息 分配的空间大小 已使用的空间大小 HDFS可选择指定的存储目录进行监控。存储目录与当前租户在“资源”中添加的目录一致。
根据业务需要,规划备份的类型、周期和策略等规格,并检查主备管理节点“数据存放路径/LocalBackup/”是否有充足的空间。 如果数据要备份至NAS中,需要提前部署好NAS服务端。 如果数据要备份至OBS中,需要当前集群已对接OBS,并具有访问OBS的权限。
建议根据机器的总内存,预留一部分空间,防止内存不够导致服务或者机器异常。 0 机器总内存的80% 否 max_memory_usage 单个查询在单台服务器的能使用的最大内存。
因此配置的原则是磁盘尽量多,且磁盘空间尽量大,单个达到百GB以上规模更好。简单的做法是配置和data node相同的磁盘,只在最下一级目录上不同即可。 多个磁盘之间使用逗号隔开。
通过该服务来抓取shuffle数据,减少了Executor的压力,在Executor GC的时候也不会影响其他Executor的任务运行。 操作步骤 在NodeManager中启动External shuffle Service。