检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
根据使用次数,对数据节点进行排序,使用次数少的排在前面,优先选择排在前面的节点。每次选择一个节点后,计数加1,并重新排序,选择后续的节点。
根据使用次数,对数据节点进行排序,使用次数少的排在前面,优先选择排在前面的节点。每次选择一个节点后,计数加1,并重新排序,选择后续的节点。
Hudi Hudi是一种数据湖的存储格式,在Hadoop文件系统之上提供了更新数据和删除数据的能力以及消费变化数据的能力。支持多种计算引擎,提供IUD接口,在HDFS的数据集上提供了插入更新和增量拉取的功能。 如需使用Hudi,请确保MRS集群内已安装Spark/Spark2x服务
在“Sort”列选择“Execution Time”对运行的任务进行排序,查看是否存在运行时间过长的任务(小时级的任务)。 是,执行10。 否,执行12。 联系业务侧根据实际情况结束长时间运行的任务并对业务SQL进行优化。 等待2分钟,查看告警是否消失。 是,处理完毕。
在“Sort”列选择“Execution Time”对运行的任务进行排序,查看是否存在运行时间过长的任务(小时级的任务)。 是,执行10。 否,执行12。 联系业务侧根据实际情况结束长时间运行的任务并对业务SQL进行优化。 等待2分钟,查看告警是否消失。 是,处理完毕。
在“Sort”列选择“Execution Time”对运行的任务进行排序,查看是否存在运行时间过长的任务(小时级的任务)。 是,执行10。 否,执行12。 联系业务侧根据实际情况结束长时间运行的任务并对业务SQL进行优化。 等待2分钟,查看告警是否消失。 是,处理完毕。
创建FlinkServer作业写入数据至Hive表 本章节适用于MRS 3.1.2及之后的版本。 操作场景 目前FlinkServer对接Hive使用对接metaStore的方式,所以需要Hive开启MetaStore功能。Hive可以作为sink和维表。 本示例以安全模式Kafka
而在建表语句中指定的DUPLICATE KEY,只是用来指明底层数据按照哪些列进行排序。 数据模型的选择建议 因为数据模型在建表时就已经确定,且无法修改。所以,选择一个合适的数据模型非常重要。
而在建表语句中指定的DUPLICATE KEY,只是用来指明底层数据按照哪些列进行排序。 数据模型的选择建议 因为数据模型在建表时就已经确定,且无法修改。所以,选择一个合适的数据模型非常重要。
执行大数据量的shuffle过程时Executor注册shuffle service失败 问题 执行超过50T数据的shuffle过程时,出现部分Executor注册shuffle service超时然后丢失从而导致任务失败的问题。错误日志如下所示: 2016-10-19 01:33
Loader开源增强特性 Loader开源增强特性:数据导入导出 Loader是在开源Sqoop组件的基础上进行了一些扩展,除了包含Sqoop开源组件本身已有的功能外,还开发了如下的增强特性: 提供数据转化功能 支持图形化配置转换步骤 支持从SFTP/FTP服务器导入数据到HDFS
使用Geohash创建GeoID时,数据按照GeoID排序,而不是按照经纬度排序,数据按照空间就近性排序存储。 建表 GeoHash编码: create table IF NOT EXISTS carbonTable ( ...
配置HDFS DiskBalancer磁盘均衡 配置场景 DiskBalancer是一个在线磁盘均衡器,旨在根据各种指标重新平衡正在运行的DataNode上的磁盘数据。工作方式与HDFS的Balancer工具类似。不同的是,HDFS Balancer工具用于DataNode节点间的数据均衡
使用CDM服务迁移MRS HDFS数据至OBS 应用场景 MRS支持在大数据存储容量大、计算资源需要弹性扩展的场景下,用户将数据存储在OBS服务中,使用MRS集群仅作数据计算处理的存算分离模式,从而实现按需灵活扩展资源、低成本的海量数据分析方案。 CDM支持文件到文件类数据的迁移,
默认类们按指定的列对计划中的文件组进行排序,同时满足配置的目标文件大小。
在“Sort”列选择“Execution Time”对运行的任务进行排序,查看是否存在运行时间过长的任务(小时级的任务)。 是,执行10。 否,在“Failed”列选择所有的失败任务,收集计算实例中SQL运行的详细报错信息,然后执行12。
ClickHouse应用程序开发思路 通过典型场景,用户可以快速学习和掌握ClickHouse的开发过程,并且对关键的接口函数有所了解。 场景说明 ClickHouse可以使用SQL进行常见的业务操作,代码样例中所涉及的SQL操作主要包括创建数据库、创建表、插入表数据、查询表数据以及删除表操作
在Yarn的原生界面单击“Allocated Memory MB”排序时出现页面异常响应。 其他问题: 登录集群管理界面,点选租户管理,租户信息加载不出来。 MRS扩容场景下的可靠性增强。 优化MRS Manager的部分UI显示。
FlinkSQL HBase数据表开发规则 提前在HBase中创建表 Flink作业在HBase中找不到对应表会报错,所以需要提前在HBase中创建好对应的表。 HBase与Flink不在同一集群时只支持Flink和HBase均为普通模式集群的对接 当HBase与Flink为同一集群或互信的集群
运行SparkSql作业 用户可将自己开发的程序提交到MRS中,执行程序并获取结果,本章节指导您如何在MRS集群中提交一个SparkSql作业。 SparkSql作业用于查询和分析数据,包括SQL语句和Script脚本两种形式,如果SQL语句涉及敏感信息,也可使用脚本文件方式提交。