正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
性能调优建议 建议预先创建Topic,根据业务需求合理规划Partition数目,Partition数目限制了消费者的并发数。 消息key值选取一定是可变的,防止由于消息key值不变导致消息分布不均匀。 消费者尽量使用主动提交offset的方式,避免重复消费。
性能调优建议 建议预先创建Topic,根据业务需求合理规划Partition数目,Partition数目限制了消费者的并发数。 消息key值选取一定是可变的,防止由于消息key值不变导致消息分布不均匀。 消费者尽量使用主动提交offset的方式,避免重复消费。
性能调优建议 建议预先创建Topic,根据业务需求合理规划Partition数目,Partition数目限制了消费者的并发数。 消息key值选取一定是可变的,防止由于消息key值不变导致消息分布不均匀。 消费者尽量使用主动提交offset的方式,避免重复消费。
false 否 taskmanager.numberOfTaskSlots TaskManager占用的slot数,一般配置成物理机的核数,yarn-session模式下只能使用-s参数传递,yarn-cluster模式下只能使用-ys参数传递。
ClickHouse 执行join操作时,右表的行数阈值。
master NodeConstraint object 参数解释: master节点限制,包括节点数,磁盘等限制。 core NodeConstraint object 参数解释: core节点限制,包括节点数,磁盘等限制。
配置文件对象数阈值:修改GC_OPTS参数中Xmx的值(Xmx内存值对应文件数阈值的公式为(y = 0.2007 x - 0.6312),其中x为内存数Xmx(GB),y为文件数(单位KW)。用户根据需要调整内存大小)。
scan.caching(可选):包含一个整数值,表示在扫描数据表时将传递给扫描器的缓存行数。
如果发现瓶颈stage(执行时间长),且分配给当前作业的核数大于当前的并发数,说明并发度不足。通过以下配置优化。
50 spark.thriftserver.proxy.sessionWaitTime 多租户模式下,当JDBCServer的session连接数为0时,停止JDBCServer前的等待时间。
参数 描述 默认值 mapreduce.job.reduce.slowstart.completedmaps 为job安排reduce前应完成的映射数的分数形式。默认100%的Map跑完后开始起Reduce。 1.0 父主题: MapReduce性能调优
参数 描述 默认值 mapreduce.job.reduce.slowstart.completedmaps 为job安排reduce前应完成的映射数的分数形式。默认100%的Map跑完后开始起Reduce。 1.0 父主题: MapReduce性能调优
最小处理的数据量、最大并发数、源文件的大小和当前集群BE节点的个数共同决定了本次任务导入的并发数: 本次导入并发数 = Math.min(源文件大小/最小处理量,最大并发数,当前BE节点个数) 本次导入单个BE的处理量 = 源文件大小/本次导入的并发数 通常一个导入作业支持的最大数据量为
正在执行的SQL数,所有的session和SQL信息。
OVERRIDE Map数 配置数据操作的MapReduce任务中同时启动的Map数量。不可与“Map数据块大小”同时配置。参数值必须小于或等于3000,建议以SFTP服务器的CPU的核数作为其取值。
number_of_loads 加载数的限制。 注意事项 无。
number_of_loads 加载数的限制。 注意事项 无。
/opt/tempfile Map数 配置数据操作的MapReduce任务中同时启动的map数量。参数值必须小于或等于3000,建议以SFTP服务器当前最大连接数作为其取值。 20 Map数据块大小 Hive不支持此参数,请配置“Map数”。
OVERRIDE Map数 配置数据操作的MapReduce任务中同时启动的Map数量。不可与“Map数据块大小”同时配置。参数值必须小于或等于3000,建议以SFTP服务器的CPU的核数作为其取值。
不可与“Map数”同时配置。当使用关系型数据库连接器时,不支持“Map数据块大小”,请配置“Map数”。 - 设置数据转换 单击“下一步”,进入“转换”界面,设置数据传输过程中的转换操作。算子的选择和参数设置具体请参考Loader算子帮助及表3。