检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
容器内日志文件所在路径挂载到主机上的位置,如:/var/paas/sys/log/nginx 挂载路径 输入数据逻辑卷挂载到容器上的路径,如:/tmp 须知: 请不要挂载在系统目录下,如“/”、“/var/run”等,会导致容器异常。建议挂载在空目录下,若目录不为空,请确保目录下无影响容器启动的文件,否则文件会被
维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题分析困难主要表现在如何可视化微服务间的依赖关系、如何提高应用性能体
产品优势 表1 产品优势 开箱即用 一键安装部署即可监控Kubernetes以及各类云产品。 一键接入各种应用组件及告警工具。 低成本 多种指标免费用,覆盖Kubernetes标准组件。 提供全托管式服务,无需另购资源,可降低监控成本,且维护成本几乎为零。 与CCE集成并提供监控
使用cron表达式创建定时任务,提示参数错误 问题描述 在使用cron表达式创建定时运维任务时,系统提示参数错误。 可能原因 cron表达式未遵循Spring Cron语法。 定时任务的触发时间间隔小于30分钟。 操作步骤 检查创建定时运维任务时设置的cron表达式的语法,是否遵循了Spring
node_ids Array of NodeInfo objects 节点信息列表。 表12 NodeInfo 参数 参数类型 描述 node_type String 节点类型。 node_id String 节点id。 表13 EventAlarmSpec 参数 参数类型 描述 alarm_source
OS账号 管理不同类型的系统账号,用于执行脚本和文件管理。单用户支持最多创建100个账号。 创建账号 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“设置 > OS账号”,进入账号管理页面。 单击右上角的“创建账号”,弹出创建账号页面。
Array of Dimension objects 时间序列维度。 evaluation_periods Integer 间隔周期。 id_turn_on Boolean 阈值规则是否启用。 insufficient_data_actions Array of strings 数据不足通知列表。
ReadOnlyAccess" ], "status" : true }, "ECS" : { "role_name" : [ "ECS CommonOperations", "ECS ReadOnlyAccess" ], "status" : true }
Array of Dimension objects 时间序列维度。 evaluation_periods Integer 间隔周期。 id_turn_on Boolean 阈值规则是否启用。 insufficient_data_actions Array of strings 数据不足通知列表。
式命令行。 通过CCE模板填充:不确定指标信息或对普罗格式不了解时,可采用系统自动填充方式。在下拉列表中选择“CCEFromProm”,单击“请选择默认模板”,从默认提供的CCE模板中选择合适的模板,系统会根据选择的模板自动填充相关指标的普罗格式命令行。 说明: 单击告警规则详情
meInMillis + durationInMinutes * 60 * 1000)计算结束时间,如果计算出的结束时间大于当前系统时间,则使用当前系统时间。如1650852000000.-1.5,则相当于1650852000000.1650852300000.5 duratio
当前仅Prometheus for CCE 实例支持。 配置指标 支持查看、新增和废弃指标。 当前仅default类型、CCE类型、云服务类型、ECS类型、通用实例类型的Prometheus实例支持。 表3 监控数据处理 功能 功能说明 获取Prometheus实例的服务地址 使用Remote
"resource_provider": "ecs", //${metadata.resource_provider} "resource_type": "vm", //${metadata.resource_type} "resource_id": "ecs123", "key1":
查询指标 功能介绍 该接口用于查询系统当前可监控的指标列表,可以指定指标命名空间、指标名称、维度、所属资源的编号(格式为:resType_resId),分页查询的起始位置和返回的最大记录条数。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ams/metrics
例如,设置连续周期为“2”,则表示连续2个周期不满足告警条件,恢复告警。 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。 默认只监控一个周期,最多可监控5个连续周期指标数据。 系统处理方式包括:超限阈值并发送告警、数据不足并发送事件、保持上一个状态、正常并发送清除告警。
为了方便查看组件列表,可以在组件列表上方设置运行状态、所属应用、集群名称、部署方式、组件名称等过滤条件,实现组件列表过滤显示。 通过开启或关闭“隐藏系统组件”开关,自定义系统组件的展示与隐藏。系统默认隐藏系统组件。 在页面右上角单击,通过选中/取消选中各展示项后的复选框,自定义列表项的展示/隐藏。 在页面右上角单击,
ICAgent属于插件,UniAgent不属于插件,二者不是同一个含义。 UniAgent:UniAgent的全称是统一数据采集Agent,主要是作为云服务运维系统的底座,为AOM提供指令下发,如脚本下发和执行,用于插件集成(ICAgent、CES、telescope等)并维护其状态。UniAgent
nodePort: 30433 port: 9187 targetPort: 9187 访问地址: http://{集群任意节点的公网IP}:30433/metrics,即可通过自定义的queries.yaml查询到Postgres实例启动时间指标。 图1 访问地址
nodePort: 30433 port: 9187 targetPort: 9187 访问地址: http://{集群任意节点的公网IP}:30433/metrics,即可通过自定义的queries.yaml查询到Postgres实例启动时间指标。 图1 访问地址
组件增加一个便于识别的别名。 单击“操作”列下的“增加别名”进行增加。 添加标签 标签是组件的标识,通过标签您可区分系统组件和非系统组件,AOM默认为系统组件(系统组件包括icagent、css-defender、nvidia-driver-installer、nvidia-gp