检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
日志接入场景介绍 AppStage运维中心提供统一的AIOps平台能力,将业务日志数据从业务服务器接入到AIOps平台。AIOps日志服务平台提供了数据接入配置界面化管理和采集器Agent自动化部署的能力。 日志接入方式 虚拟机日志接入:通过日志配置下发任务部署filebeat,
运维中心监控服务 如何查看EAP详细日志? 删除告警任务失败 告警后触发知识编排任务提示alert_type不存在 创建CES指标采集报错 如何卸载虚拟机上安装的filebeat? 异常检测Judge定时任务失败 保存异常检测告警配置时报错
编辑标签 在“标签管理”的标签列表,单击待编辑标签所在行“操作”列的“编辑”。 编辑标签信息,单击“确定”。 删除标签 在“标签管理”的标签列表,单击待删除标签所在行“操作”列的“删除”。 单击“删除”。 解绑标签 在“流程管理”流程列表,单击流程所在行“操作”列的“更多 > 标签管理”。
进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 流程 > 历史”,进入“历史”页面。 在列表中查看流程的执行历史。 父主题: 使用EAP进行流程管理
快速配置异常检测任务 异常检测基于运维领域的数据的历史特征,对其未来的走向进行预测。一旦当前实际数据和预测值偏差到一定程度,则认为发生异常,会生成告警并上报至告警系统。 异常检测的能力是基于指标仓库、MPPDB数据库及异常检测服务所构建的。指标仓库定义了数据的来源和数据的计算方式。MPPDB数据库
流程是通过使用事件自动化平台(Event & Action Platform,EAP)所提供的运维中心各个子系统的系统动作,组合编排来解决复杂运维场景,如需查看当前已上架的EAP动作,请参见查看已上架的EAP动作,可以了解已上架动作类型、作用、输入和输出参数。本章节介绍如何创建及执行流程。 目前此功能仅支持白名
使小幅度下降的异常不告警,针对阈值线过紧的情况,图1的异常通过敏感度调节不了,因为阈值线相对是合理的 配置count_threshold参数,如果不关注请求量很少的异常,可以配置该参数,建议非必要情况下不要配置该参数,可能会出现遗漏告警的情况。 毛刺告警 两三个显著的毛刺点异常,如图2所示。
选择或输入运维账号后,单击“选择资源”,选择需要使用的主机或集群机器,也可手动添加,在机器上执行作业脚本。 可使用的主机为已纳管至VMS的主机,集群为在部署服务中创建的虚拟机集群,具体操作请参见纳管Linux主机或创建虚拟机集群。 脚本内容 配置脚本内容。 分批执行 选择是否分批执行,根据设置的数据或百分数分多次
在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)” 选择左侧导航栏的“监控 > 报表开发”。 创建报表。 单击左下角的“设置和帮助”,会显示“设置和帮助”菜单栏下的内容,根据以下内容设置,设置完成后单击“设置和帮助”,收起“设置和帮助”菜单栏。 添加指标仓库数
AppStage支持定义服务的监控模板,然后通过为主机绑定监控模板,采集主机监控数据,并通过模板告警功能对虚拟机监控数据配置告警,及时掌握虚拟机状态。 限制条件 绑定监控模板进行虚拟机监控,支持的主机的操作系统版本包括EulerOS 2.X、HCE、CentOS、SUSE11、SUSE12和SUSE15,其余类型的主机无法绑定监控插件。
进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 流程 > 流程列表”。 找到变更使用的EAP流程,进入流程详情页,单击上方。 单击日志下的图标查看执行日志,如图图1所示。 图1 查看执行日志 在详细日志中找到如下日志:
账号列表”中查看创建CES指标采集时使用账号的纳管方式是“AK-SK”还是“授权委托”,并查看对应的“IAM用户名”或者“授权委托名”。 添加权限。 “AK-SK”方式:确认IAM用户所属用户组,并为用户组授权,具体操作请参见用户组授权。 “授权委托”方式:修改委托权限,增加所需的权限,具体操作请参见修改委托。
预留5组键值对,用来存储采集到的多维度的数据 查看监控指标数据 以采集弹性云服务器的监控指标为例,查看弹性云服务器对应的命名空间、指标ID、维度的Key和Value。 在支持监控的服务列表页面查看对应的监控指标参考文档。 在参考文档中查看命名空间,弹性云服务器对应的命名空间为“SYS.ECS”。
维度数超过2000个,即如果用户有超过2000个接口的维度需要检测,建议在异常检测任务基础配置的“字段配置”中,在“获取动态值”页面将维度的“纬度值”按照过滤条件拆分成多个异常检测任务,并且保证单个任务维度数不超过2000个。 父主题: 运维中心监控服务
删除告警任务失败 问题描述 删除告警任务失败,提示某个mppdb表不存在。 处理办法 将该mppdb表手动重建后,再尝试删除告警任务。 父主题: 运维中心监控服务
华为账号与华为云账号的区别是什么? 华为云账号只能登录华为云,无法登录其他华为服务。 华为账号是用户访问华为各网站的统一“身份标识”,您只需注册一个华为账号,即可访问所有华为服务,如:华为云、终端云、华为手机等终端、华为开发者联盟等。 华为账号与华为云账号的相同点 均可以购买AppStage。
并采取相应的措施进行修复,最大限度地减少停机时间和业务中断,减轻可能出现的业务损失和客户流失。 提供实时监控和报告:AppStage运维中心集成了丰富的监控和报表功能,可以实时监控系统的性能指标、资源利用率和安全状态等。通过可视化的报表和图表,SRE可以随时了解系统的运行情况,进
request 问题现象 judge历史的原始详情中出现canceling statement due to user request错误提示,如下图: 可能原因 原始表数据量过大(超过500万),查询本次judge数据的SQL在10秒内没有执行完,后台mpp监控程序取消了本次查询。 解决方法
ERROR - fail to load canceling statement due to user request 父主题: 运维中心监控服务
ppStage的开发中心、运维中心等各个中心。 添加开发中心用户:开发中心的用户数根据购买规格有相应的用户数量限制,组织管理员通过用户的添加或删除来合理管理开发中心的使用人员。 创建团队:在开发中心进行服务开发前,需要组织管理员先创建一个团队,将团队关联需要开发的服务。 配置服务