检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
日志接入场景介绍 AppStage运维中心提供统一的AIOps平台能力,将业务日志数据从业务服务器接入到AIOps平台。AIOps日志服务平台提供了数据接入配置界面化管理和采集器Agent自动化部署的能力。 日志接入方式 虚拟机日志接入:通过日志配置下发任务部署filebeat,
目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建流程 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB
使用。详细操作请参考提交工单。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 已创建流程。 步骤一:创建标签 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB
目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 查看流程执行历史 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB
可以在告警任务“基础”中增加一个空白维度,并手动添加一个空白维度值,保存后,再将空维度删除并保存,此时告警结果表会更新,并带有alert_type字段。 父主题: 运维中心监控服务
request错误提示,如下图: 可能原因 原始表数据量过大(超过500万),查询本次judge数据的SQL在10秒内没有执行完,后台mpp监控程序取消了本次查询。 解决方法 减少原始表数据量。 减少原始数据量,比如ttl可以减半。 如果是多个维度,可以拆成两个告警,原始表拆成多张表。
ERROR - fail to load 问题现象 judge日志中出现ERROR - fail to load错误提示,如下图 可能原因 日志中提示加载模型失败,可能是因为容器在启动时加载模型失败。 解决方法 依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启ju
生的问题。事件可通过监控系统自动生成、客户报障生成或SRE主动巡检生成等。监控系统生成事件首先要采集和分析运行数据,然后根据预定规则判断是否需要生成事件。 HCW HW Cloud Watch,AppStage运维中心提供的监控系统,也称为云眼,可以提供监控、告警功能。 HCW Agent
fail to load model json 问题现象 judge日志中显示trainModel is null或trainModel is {},并且提示fail to load model json,表示训练完成后judge未成功加载训练模型。 解决方法 依次单击“初始化D
judge_data_size(in):0 问题现象 judge历史的原始详情中出现judge_data_size(in):0提示。 可能原因 judge没有获取到数据。 解决方法 检查告警原始表汇聚任务配置的汇聚提前时间和judge任务的汇聚提前时间,保证对应时间点能够获取到数据即可。
judge长时间处于SUBMIT状态直至失败 问题现象 judge记录一直处于提交未执行SUBMIT状态,直至失败FAIL。 可能原因 后端任务内存溢出,可以在训练日志中的ad-agent日志找到报错java.lang.OutOfMemoryError:Java heap space。
judge日志无法查看,提示get request error 问题现象 查看judge日志任务时,出现get request error错误提示。 可能原因 judge日志持续日志打印,单个文件过大时,打开或者下载会提示失败。 解决方法 依次单击“初始化Daemon”、“注册任
PSQLException: ERROR: syntax error at or near 问题现象 judge历史的原始详情中出现PSQLException: ERROR: syntax error at or near报错。 可能原因 在judge日志的ad-agent日志中
PSQLException: ERROR: invalid input syntax for type numeric 问题现象 judge历史的原始详情中出现PSQLException: ERROR: invalid input syntax for type numeric报错。
TypeError("Cannot index by location index with a non-integer key") 问题现象 在judge日志中出现TypeError("Cannot index by location index with a non-integer
主机监控接入 支持定义服务的监控模板,然后通过为主机绑定监控模板,采集主机监控数据。 CES指标接入 支持将云监控服务CES采集的监控指标数据接入至AppStage运维中心,如需将CES生成的告警接入AppStage运维中心,可参考CES告警接入操作。 运维监控 指标开发 对已产生或接入的数据进行指标开发
运维中心使用流程 本章节介绍AppStage运维中心的使用流程。 前提条件 使用运维中心前需要完成使用前准备。 使用流程 参考图1可帮助您快速上手运维中心的主流程和核心功能。 图1 运维中心使用流程 表1 运维中心使用流程介绍 主流程 子任务 说明 操作指导 接入资源 - 将华为云已购买的资源接入至运维中心。
置告警策略,告警信息会进行上报,业务可在监控服务(ServiceInsight)管理台上查看告警信息。 前提条件 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 新增告警配置 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发
置告警策略,告警信息会进行上报,业务可在监控服务(ServiceInsight)管理台上查看告警信息。 前提条件 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 新增告警配置 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发
包年/包月 用户数量*套餐包单价*购买时长 运维中心专业版 支持视界监控服务、纪实日志服务、追踪者调用链服务、先知告警服务、智维AIOps、蓝军故障演练服务。 应用实例数 包年/包月 应用实例数量*套餐包单价*购买时长 运维中心服务扩展包 运维中心规格扩展 日志、span、短信 包年/包月