检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
KafkaProperties kafkaProc = KafkaProperties.getInstance(); // Broker地址列表,根据集群实际情况配置 props.put(BOOTSTRAP_SERVERS, kafkaProc.getValues(BOOTSTRAP_SERVERS
级数字进行追踪,并周期性地对这些数字进行减小处理。 请参考修改集群服务配置参数,进入HDFS的“全部配置”页面,在搜索框中输入参数名称。 表1 Fair调用队列参数 参数 描述 默认值 ipc.<port>.callqueue.impl 队列的实现类。用户需要通过“org.apache
级数字进行追踪,并周期性地对这些数字进行减小处理。 请参考修改集群服务配置参数,进入HDFS的“全部配置”页面,在搜索框中输入参数名称。 表1 Fair调用队列参数 参数 描述 默认值 ipc.<port>.callqueue.impl 队列的实现类。用户需要通过“org.apache
> 告警”,在告警列表中展开此告警的详细信息,在定位信息中单击产生该告警的主机名称。 在主机的概览界面观察“每个写操作平均所需时间”的实时数据5分钟左右,若磁盘IO利用率多次超过设置的阈值,请联系MRS集群管理员提升磁盘配置。 如果无“每个写操作平均所需时间”图表,可单击右侧下拉三
Manager首页,选择“集群 > 待操作集群的名称 > 服务 > HDFS”。 在“图表”区域“实时”栏中,通过监控项“HDFS磁盘容量比率”查看HDFS磁盘使用率是否超过阈值(默认为80%)。若未查看到该监控项,可单击图表区域右上角的下拉菜单,选择“定制 > 磁盘”,勾选“HDFS磁盘容量比率”。
如果某个DataNode日志中打印“Too many open files”,说明该节点文件句柄不足,导致打开文件句柄失败,然后就会重试往其他DataNode节点写数据,最终表现为写文件很慢或者写文件失败。 解决办法 执行ulimit -a命令查看有问题节点文件句柄数最多设置是多少,如果很小,建议修改成640000。
否,操作结束。 在FusionInsightManager首页,选择“ 集群 > Impala > 实例 > 告警上报的Impalad实例 > 图表 > 进程FGCT ”,查看FGC时间是否大于1中的阈值。 是,执行4。 否,执行5。 通过“运维 > 告警 > 阈值设置 > Impala
告警 > 告警”,在告警列表中展开此告警的详细信息,在定位信息中单击产生该告警的主机名称。 在主机的概览界面观察“磁盘IO利用率”的实时数据5分钟左右,若磁盘IO利用率多次超过设置的阈值,请联系MRS集群管理员提升磁盘配置。 如果无“磁盘IO利用率”图表,可单击右侧下拉三角,选择“定制”并勾选对应项,单击“确定”。
Manager页面,选择“运维 > 告警 > 告警”,在告警列表中展开此告警的详细信息,在定位信息中单击产生该告警的主机名称。 在主机的概览界面观察“主机CPU使用率”实时数据5分钟左右,若CPU使用率多次超过设置的阈值,请联系MRS集群管理员提升CPU。 如果无对应图表,可单击右侧下拉三角,选择“定制”并勾选对应项,单击“确定”。
已安装ClickHouse客户端,例如客户端安装目录为“/opt/client”。 在FusionInsight Manager已创建具有ClickHouse相关表权限和访问HDFS的权限的用户,例如:clickhouseuser。 在对接HDFS组件之前,需要注意首先确保HDFS中有对应的目录,Cli
参考信息 nimbus.task.launch.secs和supervisor.worker.start.timeout.secs这两个参数分别代表nimbus端和supervisor端对于拓扑启动的超时容忍时间,一般nimbus.task.launch.secs的值要大于等于supervisor
multiplier,默认值2),如果大于线程数的指定倍数,可增加RocksDB线程数。 是:在Flink WebUI的作业开发界面,调整如下自定义参数的值并保存后执行8。 表1 调整自定义参数 参数名称 默认值 说明 state.backend.rocksdb.thread.num 2 4:开启SPINNING_
multiplier,默认值2),如果大于线程数的指定倍数,可增加RocksDB线程数。 是:在Flink WebUI的作业开发界面,调整如下自定义参数的值并保存后执行8。 表1 调整自定义参数 参数名称 默认值 说明 state.backend.rocksdb.thread.num 2 4:开启SPINNING_
*max_write_buffer_number)。 是:在Flink WebUI的作业开发界面,调整如下自定义参数的值并保存后执行8。 表1 调整自定义参数 参数名称 默认值 说明 state.backend.rocksdb.writebuffer.count 2 4:开启SP
删除的无用表。 在hbase shell中,执行disable和drop命令,确认删除无用表,以减少Region数: disable '待删除表名' drop '待删除表名' 在hbase shell中,执行命令查看目前负载均衡功能是否打开: balancer_enabled 是,执行13。
态是否都为“良好”状态。 是,执行3。 否,执行2。 将异常的FlinkServer实例选中,单击“启动实例”,等待实例启动成功后在告警列表中查看该告警是否清除。 是,处理完毕。 否,执行3。 重启FlinkServer实例期间,当前实例无法对外提供服务,已提交的作业不受影响。
Storm提供了如表2所示的日志级别。 运行日志和审计日志的级别优先级从高到低分别是ERROR、WARN、INFO、DEBUG,程序会打印高于或等于所设置级别的日志,设置的日志等级越高,打印出来的日志就越少。 表2 日志级别 级别 描述 ERROR ERROR表示系统运行的错误信息。
> 告警”,在告警列表中展开此告警的详细信息,在定位信息中单击产生该告警的主机名称。 在主机的概览界面观察“每个读操作平均所需时间”的实时数据5分钟左右,若磁盘IO利用率多次超过设置的阈值,请联系MRS集群管理员提升磁盘配置。 如果无“每个读操作平均所需时间”图表,可单击右侧下拉三
Manager首页,选择“集群 > 待操作集群的名称 > 服务 > ZooKeeper > 实例”,单击对应IP地址的“角色”列的“quorumpeer”。单击图表区域右上角的下拉菜单,选择“定制 > CPU 和内存”,勾选“ZooKeeper堆内存与直接内存使用率”,单击“确定”,查看堆内存使用情况。
造成服务数据无法写入,业务系统运行不正常。 可能原因 硬盘被拔出。 硬盘离线、硬盘坏道等故障。 处理步骤 登录MRS集群详情页面,选择“告警管理”。 在实时告警列表中,单击此告警所在行。 在“告警详情”区域,从“定位信息”中获取“HostName”、“PartitionName”和“DirName”。