检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
关于Elasticsearch集群的最大堆内存持续超过90%的问题。其中如果节点在90%堆内存上下波动,有增有减,则无异常;持续高内存时,集群存在一定的风险。 原因分析 排查集群的写入和查询队列,查看是否有大量任务堆积。 GET /_cat/thread_pool/write?v GET /_cat/thread_pool/search
[name=admin, roles=[admin], requestedTenant=null]" }, "status": 403 } 原因分析 安全集群,默认有一个“. opendistro_security”索引,不可执行写操作,修改索引读写模式时要忽略掉这个索引。 解决方案
高,logstash在该时刻报错Elasticsearch Unreachable,导致日志无法写入到Elasticsearch里。 原因分析 客户index是单shard,压力承载于单个节点,负载过高,造成队列满后,作业被拒绝。 处理步骤 登录云搜索服务控制台。 选择“集群管理”进入集群管理列表。
indices 问题描述 Elasticsearch集群报错unassigned shards all indices,集群状态为red。 原因分析 当前集群存在未分配的shard。 解决方案 在Kibana的“Dev Tools”页面,执行如下命令: POST /_cluster/reroute
单节点集群打开Cerebro界面显示告警 原因分析 单节点集群索引默认有副本,但是副本无法下发请求,所以显示告警。 解决方案 在Kibana的“Dev Tools”页面,执行以下命令将索引副本数量修改为“0”。 PUT _all/_settings { "index" : {
问题描述 执行集群更改规格操作失败,console界面报错详情如下图所示。 图1 CSS.0073错误 图2 CSS.0011错误 原因分析 当前集群未设置副本数,后台拦截了更改规格的请求。需要设置好副本数,再进行更改规格操作,否则会有分片丢失的风险。 解决方案 设置副本参数:
Kibana中删除index pattern报错Forbidden 问题描述 在Kibana界面删除索引模式,单击删除按钮报错Forbidden。 原因分析 之前创建的索引模式无法删除索引模式是因为kibana索引只读导致的,磁盘使用率超过一定阈值会自动转为只读,所以报错没有权限。 解决方案 在Kibana的“Dev
集群索引插入数据失败 问题现象 向CSS集群索引中插入数据失败,报错如下: 问题分析 当磁盘的使用率超过95%时,Elasticsearch为了防止节点耗尽磁盘空间,自动将索引设置为只读模式。 解决方案 新版本(7.10.2之后)集群磁盘使用率下降后会自动关闭只读模式,只需清理或扩容磁盘。
更改Elasticsearch集群安全模式 集群创建完成后,可以参考本文更改集群的安全模式。 场景描述 CSS服务支持创建多种安全模式的集群,不同集群的差异请参见表1。 表1 集群类型介绍 集群类型 集群描述 适用场景 非安全集群 非安全模式的集群 非安全模式的集群无需安全认证即
身份认证与访问控制 CSS服务的身份认证和访问控制主要包括两个大的方面:一方面是通过统一身份认证服务(Identity and Access Management,简称IAM)实现服务资源层面的身份认证和访问控制;另一方面是由CSS服务提供的安全集群内的身份认证和访问控制实现。两者是相互独立的模块。
无法正常打开Kibana 问题现象 Es-event集群单击进入kibana后,会出现一直卡在加载页面中,不能进入Kibana控制台。 原因分析 浏览器缓存导致,清理缓存。 处理步骤 登录云搜索服务管理控制台。 在左侧导航栏,单击“集群管理”。 在集群对应的“操作”列,单击“Kibana”,打开Kibana界面。
据节点将同时承担集群管理、存储数据、提供接入集群和分析数据的职责。此时,为保证集群中数据的稳定性,建议设置节点数量大于等于3个。 当集群启用了Master节点但未启用Client节点时,数据节点将用于存储数据并提供接入集群和分析数据的功能。 当集群未启用Master节点但启用了C
索引副本个数,此处以修改为2个索引副本为例。 当采用多可用区部署时,如果某个可用区发生故障,相关的业务故障行为分析及应对策略请参见表2。 表2 AZ故障的业务故障行为分析 可用区数量 主节点个数 业务中断行为及应对建议 2 0 如果节点个数为2的倍数: 一半的数据节点故障,需要替
CSS服务如何保证数据和业务运行安全? 云搜索服务主要从以下几个方面保障数据和业务运行安全: 网络隔离 整个网络划分为2个平面,即业务平面和管理平面。两个平面采用物理隔离的方式进行部署,保证业务、管理各自网络的安全性。 业务平面:主要是集群的网络平面,支持为用户提供业务通道,对外提供数据定义、索引、搜索能力。
数据保护技术 云搜索服务主要从以下几个方面保障数据和业务运行安全: 网络隔离 整个网络划分为2个平面,即业务平面和管理平面。两个平面采用物理隔离的方式进行部署,保证业务、管理各自网络的安全性。 业务平面:主要是集群的网络平面,支持为用户提供业务通道,对外提供数据定义、索引、搜索能力。
contacting Elasticsearch at URL 'https://192.168.xx.xx:9200/_xpack'。 原因分析 目前云搜索服务没有集成x-pack插件,自行搭建logstash连接css服务的时候,会检查es是否启用了x-pack。 处理步骤 删除logstash中的x-pack目录。
此处选择的VPC必须包含网段(CIDR),否则集群将无法创建成功。新建的VPC默认包含网段(CIDR)。 子网 集群使用子网实现与其他网络的隔离,并独享所有网络资源,以提高网络安全。 选择当前虚拟私有云下集群需要的子网。支持选择共享VPC下的子网。 安全组 安全组起着虚拟防火墙的作用,为集群提供安全的网络访问控制策略。
search强大的搜索和分析能力。 日志分析与检索:将MySQL中的日志数据同步到Elasticsearch,进行快速检索和分析。 应用性能监控:将应用性能数据存储在MySQL中,通过Logstash同步到Elasticsearch,进行实时监控和性能分析。 数据备份与恢复:通过
集群不可用排查指导 问题现象 云搜索服务的集群列表中,“集群状态”出现“不可用”。 图1 集群不可用 原因分析及处理方法 如果集群列表的任务状态显示“冻结”,可能是集群冻结状态导致集群不可用。 如果集群列表的任务状态显示“配置错误,重启失败”,可能是X-pack参数配置导致集群不可用。
索引副本个数,此处以修改为2个索引副本为例。 当采用多可用区部署时,如果某个可用区发生故障,相关的业务故障行为分析及应对策略请参见表2。 表2 AZ故障的业务故障行为分析 可用区数量 主节点个数 业务中断行为及应对建议 2 0 如果节点个数为2的倍数: 一半的数据节点故障,需要替