云服务器内容精选

  • 创建API监控 登录MAS控制台,在“多活管理”页面单击实例(实例所属命名空间类型为同城多活),进入实例控制台。 在页面顶端导航栏选择“监控列表”,单击页面左上角的“新增监控”。 在新增监控页面配置监控基础配置,完成后单击“下一步:数据中心配置”。 图1 新增API监控-基础配置 表2 基础配置信息 参数 配置说明 监控 选择需要新增的监控类型,此处请选择“API监控”。 应用名称 选择应用列表中创建的应用。 监控器名称 自定义监控器名称。 异常通知设置 默认为“关”。 若设置为“开”: 当监控器或被监控的API异常时会及时给用户发送异常通知或告警通知。支持华为 云消息 通知服务,请先配置密钥。 默认将开启 云监控 ,请前往云监控确认是否已创建MAS事件监控告警规则,如已创建请忽略。 通知主题 若异常通知设置选择“开”,则需要在通知主题列表选择主题,如无主题列表,单击新增,新增通知主题之后进行后续操作。 是否监控 默认选“是”,若选择“否”则不会再监控APIG的状态。 填写数据中心配置,完成后单击“下一步:高级配置”。 图2 新增API监控-数据中心配置 表3 数据中心配置信息 参数 配置说明 云选择 选择被监控的APIG部署的环境。 局点 被监控的APIG所在区域。 连接地址 协议选择http或https,地址填写APIG的连接地址。 请求路径 APIG的健康检查路径信息。 请求方法 可选择GET、POST、DELETE、PUT、PATCH方法。 响应码 根据监控的APIG的接口实际需求配置,例如200。 请求头 根据监控的APIG的接口实际需求配置请求头。 请求头若涉及敏感信息,请用户自行加密再填入。 填写高级配置,完成后单击“下一步:确认配置”。 图3 新增API监控-高级配置 表4 高级配置信息 参数 配置说明 重试时间间隔 尝试重连时间间隔,以毫秒为单位,默认值5000ms。 输入值必须在1到300000之间,建议使用默认值。 正常阈值 配置连接API次数的正常阈值,当连续连接次数达到或超过正常阈值,认为API连接正常。 说明: 输入值必须在1到5之间,默认为2,建议使用默认值。 异常阈值 配置连接API次数的异常阈值,当连续连接失败次数达到或超过异常阈值,认为API连接异常。 说明: 输入值必须在3到10之间,默认为3,建议使用默认值。 确认配置无误后单击“立即创建”,完成创建API监控。 API监控器创建完成后,数据中心的正常监控状态标识为绿色。如果是其他异常状态,可能是监控器信息配置错误或者是监控的API本身存在异常,请进行故障排除。
  • 设置告警规则 在监控指标卡片上,单击“+”,跳转到设置告警规则页面。 图2 选择监控指标 在“创建告警规则”页面,填选相关信息。 名称:系统会随机产生一个名称,用户也可以进行修改。 描述:告警规则描述。 告警策略:触发告警规则的告警策略。是否触发告警取决于连续周期的数据是否达到阈值。 发送通知:配置是否发送邮件、短信、HTTP和HTTPS通知用户。 关于告警通知的配置,请参见《云监控用户指南》。 单击“立即创建”,告警规则创建完成。
  • 查看监控指标 在实例列表,选择目标实例,单击实例名称。 选择“监控”,查看实例的监控指标。 图1 监控指标 表1 支持的监控指标 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标) 非活跃逻辑复制槽数量 该指标用于统计当前数据库中存在的非活跃逻辑复制槽数量。 ≥ 0 FlexusRDS for PostgreSQ L实例 1分钟 CPU使用率 该指标用于统计测量对象的CPU使用率,以比率为单位。 0-100% FlexusRDS for PostgreSQL实例 1分钟 每分钟临时文件生成数量 该指标为获取临时文件在1分钟内生成的数量。 ≥ 0 Count/min FlexusRDS for PostgreSQL实例 1分钟 内存使用率 该指标用于统计测量对象的内存使用率,以比率为单位。 0-100% FlexusRDS for PostgreSQL实例 1分钟 每分钟临时文件生成大小 该指标为获取临时文件在1分钟内生成的大小。 ≥ 0 Byte/min FlexusRDS for PostgreSQL实例 1分钟 IOPS 该指标用于统计当前实例,单位时间内系统处理的I/O请求数量(平均值)。 ≥ 0 counts/s FlexusRDS for PostgreSQL实例 1分钟 同步复制阻塞时间 该指标为获取同步复制主备机间复制阻塞的时长。 ≥ 0 s FlexusRDS for PostgreSQL实例 1分钟 网络输入吞吐量 该指标用于统计平均每秒从测量对象的所有网络适配器输入的流量,以字节/秒为单位。 ≥ 0 bytes/s FlexusRDS for PostgreSQL实例 1分钟 备机(只读)流复制状态 该指标为获取备机(只读)流复制状态,0:备机(只读)异常,1:备机(只读)正常,2:该实例为主机。 Count FlexusRDS for PostgreSQL实例 1分钟 网络输出吞吐量 该指标用于统计平均每秒从测量对象的所有网络适配器输出的流量,以字节/秒为单位。 ≥ 0 bytes/s FlexusRDS for PostgreSQL实例 1分钟 inode数 数据盘已使用的inode数。 ≥ 0 Counts FlexusRDS for PostgreSQL实例 5分钟 磁盘利用率 该指标用于统计测量对象的磁盘利用率,以比率为单位。 0-100% FlexusRDS for PostgreSQL实例 1分钟 事务日志使用量 事务日志所占用的磁盘容量。 ≥ 0 MB FlexusRDS for PostgreSQL实例 1分钟 复制插槽使用量 复制插槽文件所占磁盘容量。 ≥ 0 MB FlexusRDS for PostgreSQL实例 1分钟 数据库连接数 当前连接到数据库的后端量。 ≥ 0 counts FlexusRDS for PostgreSQL实例 1分钟 事务最大已使用ID数 事务最大已使用ID。 ≥ 0 counts FlexusRDS for PostgreSQL实例 1分钟 事务日志生成速率 平均每秒生成的事务日志大小。 ≥ 0 MB/s FlexusRDS for PostgreSQL实例 1分钟 最滞后副本滞后量 多个副本中最滞后副本(依据接收到的WAL数据)滞后量。 ≥ 0 MB FlexusRDS for PostgreSQL实例 1分钟 复制时延 副本滞后时延。 ≥ 0 ms FlexusRDS for PostgreSQL实例 1分钟 用户使用连接数 该指标为统计用户实际使用的连接数(不包括监控运维使用的内置连接)。 ≥ 0 Counts FlexusRDS for PostgreSQL实例 1分钟 用户活跃连接数 该指标为统计用户实际使用的活跃连接数(不包括监控运维使用的内置活跃连接)。 ≥ 0 Counts FlexusRDS for PostgreSQL实例 1分钟 TPS 该指标用于统计每秒事务执行次数,含提交和回退的次数。 ≥ 0 次/秒 FlexusRDS for PostgreSQL实例 1分钟 连接数使用率 该指标用于统计当前已用的PgSQL连接数占总连接数的百分比。 0-100% FlexusRDS for PostgreSQL实例 1分钟 活跃连接数 该指标为统计数据库当前活跃连接数。 ≥ 0 FlexusRDS for PostgreSQL实例 1分钟 事务空闲连接数 该指标为统计数据库当前空闲连接数。 ≥ 0 FlexusRDS for PostgreSQL实例 1分钟 操作行数 实例每秒增删改查操作的行数。 ≥ 0 FlexusRDS for PostgreSQL实例 1分钟 最长事务存活时长 该指标为统计当前数据库中存在的最长事务存活时长。 ≥ 0 ms FlexusRDS for PostgreSQL实例 1分钟 最长未决事务存活时长 该指标为统计当前数据库存在的最长未决事务存活时长。 ≥ 0 ms FlexusRDS for PostgreSQL实例 1分钟 磁盘IO使用率 该指标为统计磁盘IO使用率。磁盘IO使用率是指磁盘正在处理IO请求的时间与总时间的百分比。 说明: 当磁盘IO使用率达到100%,只能说明在统计时间段内,磁盘一直有数据写入,磁盘性能还需要结合IOPS、磁盘的吞吐量、读写时延等多个指标共同决定。 0-100% FlexusRDS for PostgreSQL实例 1分钟 等待锁的会话数 该指标为统计当前处于阻塞状态的会话个数。 ≥ 0 FlexusRDS for PostgreSQL实例 1分钟 swap in速率 该指标为统计每秒从交换区写到内存的大小。 ≥ 0 KB/s FlexusRDS for PostgreSQL实例 1分钟 swap out速率 该指标为统计每秒写入交换区的内存的大小。 ≥ 0 KB/s FlexusRDS for PostgreSQL实例 1分钟 交换区总容量大小 该指标为统计交换区总量。 ≥ 0 MB FlexusRDS for PostgreSQL实例 1分钟 交换区容量使用率 该指标为统计交换区使用率。 0-100% FlexusRDS for PostgreSQL实例 1分钟 最大数据库年龄 该指标为统计当前数据库的最大数据库年龄(获取表pg_database中max(age(datfrozenxid))值)。 ≥ 0 FlexusRDS for PostgreSQL实例 1分钟 用户态CPU时间占比 该指标为统计用户态CPU时间占比。 0-100% FlexusRDS for PostgreSQL实例 1分钟 内核态CPU时间占比 该指标为统计内核态CPU时间占比。 0-100% FlexusRDS for PostgreSQL实例 1分钟 硬盘IO等待时间占比 该指标为统计硬盘IO等待时间占比。 0-100% FlexusRDS for PostgreSQL实例 1分钟 IO读响应延迟 该指标为统计磁盘读响应平均延迟(以毫秒为单位)。 ≥ 0 ms FlexusRDS for PostgreSQL实例 1分钟 IO写响应延迟 该指标为统计磁盘写响应平均延迟(以毫秒为单位)。 ≥ 0 ms FlexusRDS for PostgreSQL实例 1分钟 读IOPS 该指标用于统计当前实例,单位时间内系统处理的读I/O请求数量(平均值)。 ≥ 0 counts/s FlexusRDS for PostgreSQL实例 1分钟 写IOPS 该指标用于统计当前实例,单位时间内系统处理的写I/O请求数量(平均值)。 ≥ 0 counts/s FlexusRDS for PostgreSQL实例 1分钟 已执行1s的SQL数 该指标为统计数据库执行时长1秒以上的慢SQL个数。 ≥ 0 FlexusRDS for PostgreSQL实例 1分钟 已执行3s的SQL数 该指标为统计数据库执行时长3秒以上的慢SQL个数。 ≥ 0 FlexusRDS for PostgreSQL实例 1分钟 已执行5s的SQL数 该指标为统计数据库执行时长5秒以上的慢SQL个数。 ≥ 0 FlexusRDS for PostgreSQL实例 1分钟 已执行log_min_duration_statement时长的SQL数 该指标为统计数据库执行时长比参数log_min_duration_statement大的慢SQL个数,该参数大小可根据业务需要进行更改。 ≥ 0 FlexusRDS for PostgreSQL实例 1分钟 WAL日志占用空间大小 该指标为获取当前WAL日志所占空间大小。 ≥ 0 GB FlexusRDS for PostgreSQL实例 5分钟 审计日志大小 该指标为获取当前审计日志的大小。 ≥ 0 GB FlexusRDS for PostgreSQL实例 5分钟 内存命中率 内存命中率 ≥ 0 % FlexusRDS for PostgreSQL实例 1分钟 已开启1s的事务数 该指标为统计数据库开启时长1秒以上的长事务个数。 ≥ 0 FlexusRDS for PostgreSQL实例 1分钟 已开启3s的事务数 该指标为统计数据库开启时长3秒以上的长事务个数。 ≥ 0 FlexusRDS for PostgreSQL实例 1分钟 已开启5s的事务数 该指标为统计数据库开启时长5秒以上的长事务个数。 ≥ 0 FlexusRDS for PostgreSQL实例 1分钟 已空闲1s的事务数 该指标为统计数据库空闲时长1秒以上的长事务个数。 ≥ 0 FlexusRDS for PostgreSQL实例 1分钟 已空闲3s的事务数 该指标为统计数据库空闲时长3秒以上的长事务个数。 ≥ 0 FlexusRDS for PostgreSQL实例 1分钟 已空闲5s的事务数 该指标为统计数据库空闲时长5秒以上的长事务个数。 ≥ 0 FlexusRDS for PostgreSQL实例 1分钟 已执行1s的两阶段事务 该指标为统计数据库两阶段执行时长1秒以上的长事务个数。 ≥ 0 FlexusRDS for PostgreSQL实例 1分钟 已执行3s的两阶段事务 该指标为统计数据库两阶段执行时长3秒以上的长事务个数。 ≥ 0 FlexusRDS for PostgreSQL实例 1分钟 已执行5s的两阶段事务 该指标为统计数据库两阶段执行时长5秒以上的长事务个数。 ≥ 0 FlexusRDS for PostgreSQL实例 1分钟
  • 数据库读写状态配置 目前应用需要接入Java 1.2.6-RELEASE及以上版本的DB-SDK才能支持数据库禁写(不可写)配置。 登录MAS控制台,在“多活管理”页面单击实例,进入实例控制台。 在页面顶端导航栏选择“监控列表”。 单击待修改状态旁的。 图5 数据库读写状态配置 在“修改状态”弹窗单击选择所需状态,单击“确定”,完成数据库读写状态设置。 表7 数据库读写状态配置 参数 配置说明 是否可读 数据库是否可读。 “可读”,数据库状态正常,可以正常读取。 “不可读”,数据库状态异常,不可读;数据库状态从不可读恢复为可读状态,需要手动配置。 是否可写 数据库是否可写。 “可写”,此时可对数据库进行“写”操作。 “不可写”,此时不可对数据库进行“写”操作。 当活跃为数据中心1,并数据中心1异常时,数据中心1自动切换数据中心2,“可读”自动切为“不可读”;当数据中心1恢复后,单击“回切”按钮,需手动将“不可读”配置为“可读”。
  • 创建监控 登录MAS控制台,在“多活管理”页面单击实例(实例所属命名空间类型为同城多活),进入实例控制台。 在页面顶端导航栏选择“监控列表”,单击页面左上角的“新增监控”。 在新增监控页面配置监控基础配置,完成后单击“下一步:数据中心配置”。 图1 新增监控-基础配置 表2 基础配置信息 参数 配置说明 监控 选择需要新增的监控类型,此处请选择如下类型: MySQL监控 Oracle监控 PostgreSQL监控 说明: 只有在功能模块已开通MySQL、Oracle和PostgreSQL功能点,且多活实例关联的命名空间下的功能点已勾选MySQL、Oracle和PostgreSQL时,才能同时支持这三种数据库监控,如果命名空间只选择其中一个功能点,则下拉框只显示对应所选的数据库监控。 应用名称 选择应用列表中创建的应用。 监控器名称 自定义监控器名称。 异常通知设置 默认为“关”。 若设置为“开”: 当监控器或被监控的数据库异常时会及时给用户发送异常通知或告警通知。支持华为云 消息通知 服务,请先配置密钥。 默认将开启云监控,请前往云监控确认是否已创建MAS事件监控告警规则,如已创建请忽略。 通知主题 若异常通知设置选择“开”,则需要在通知主题列表选择主题,如无主题列表,单击新增,新增通知主题之后进行后续操作。 是否监控 默认“是”,选“否”则不会探测数据库异常情况。 是否自动切换 默认“是”,选“否”则不会自动切换数据库。 监控用户名 被监控数据库的用户名。 监控用户密码 被监控数据库的用户密码。 确认密码 再次填写监控用户密码。 DRS联动 默认为“关”。 若设置为“开”,目前仅支持关联DRS实时灾备任务。请先配置密钥,再开启DRS联动。 多活分区 选择主备多活分区。多活分区为多活实例所归属的命名空间所创建的分区名称。 说明: 此选项需要打开“DRS联动”才会显示。 DRS任务 若DRS联动设置为“开”,需要设置DRS任务,任务列表选其一,如无任务列表,单击“新增”,新增DRS实时灾备任务之后进行后续操作。 填写数据中心配置,完成后单击“下一步:数据库配置”。 图2 新增监控-数据中心配置 表3 数据中心配置信息 参数 配置说明 云选择 被监控的数据库部署的环境。 局点 被监控数据库所在区域。 IPv4地址 数据库的访问地址和端口。 添加读库地址 单击添加读库数据库地址。 填写数据库配置,完成后单击“下一步:高级配置”。 图3 新增监控-数据库配置 表4 数据库配置信息 参数 配置说明 监控数据库 填写监控数据库名称。 连接数据库 填写连接数据库名称。 填写高级配置,完成后单击“下一步:确认配置”。 图4 新增监控-高级配置 表5 高级配置信息 参数 配置说明 重试时间间隔 尝试重连时间间隔,以毫秒为单位,默认值3000ms。 输入值必须在1到300000之间,建议使用默认值。 监控超时时间 一个周期内监控器对数据库探测监控的超时时间,超过这个时间,则认为探测数据库失败,监控状态变为监控异常。 以毫秒为单位,默认值40000ms,输入值必须在1到600000之间,建议使用默认值。 说明: 如果您需要修改监控超时时间,监控超时时间建议大于故障时数据中心1的数据同步到数据中心2所需时间,否则切换数据中心后,数据中心2的数据可能存在不完整的情况。 数据库访问超时时间 访问数据库超时时间,超过这个时间认为一次访问数据库失效,以毫秒为单位,默认值3000ms。 输入值必须在3000到100000之间,建议使用默认值。 确认配置无误后单击“立即创建”,完成创建监控。 监控器创建完成后,数据中心的正常监控状态标识为绿色。如果是其他异常状态,可能是监控器信息配置错误或者是监控的数据库本身存在异常,请进行故障排除。
  • 连接池配置 登录MAS控制台,在“多活管理”页面单击实例,进入实例控制台。 在页面顶端导航栏选择“监控列表”,单击监控所在行的“更多>连接池配置”。 在连接池配置页面,填写配置信息,完成后单击“确定”。 表6 连接池配置 参数 配置说明 数据库名 创建监控配置的连接数据库名。 路由算法 选择路由算法,单边读写/单边写本地读。 数据源名称 自定义数据源名称。 数据库地址 数据库的连接地址。 Schema 需要连接的Schema名称。 负载均衡算法 选择负载均衡算法,随机/轮询。 添加Data Source 添加备数据源的配置信息。
  • 概述 MySQL监控器、Oracle监控器、PostgreSQL监控器可对用户业务使用的对应数据库进行探测,并且在数据库异常时自动触发流量切换。 MySQL监控器、Oracle监控器、PostgreSQL监控器相关操作流程一致,故统一放在此章节介绍。 表1 监控状态说明 监控状态 状态说明 绿色 监控正常。 说明: MySQL监控器暂不支持MySQL数据库连接池占满、磁盘占满等亚健康状态探活能力。 只要MySQL实例处于活跃状态,连接正常保持,查询命令正常执行,即认为当前MySQL状态正常,监控状态正常。 红色 监控异常。从正常到异常,在允许自动切换的情况下,自动触发流量切换。 黄色 初始化监控失败。此状态表示MAS进程无法检测业务数据库,确保配置信息无误的情况下,需要联系运维处理。 浅灰 监控未生成或监控配置错误。 深灰 调用异常。监控连接ETCD状态异常。
  • 响应示例 状态码: 200 OK { "total" : 99999, "size" : 99999, "entities" : [ { "id" : "id123456789", "start_time" : 1603243428000, "dispatch_time" : 1603243428000, "end_time" : 1603243428000, "execute_status" : "RUNNING", "position" : "READER", "position_status" : "NORMAL", "status" : 504, "dirty_data_count" : 0, "data_count" : 100, "data_size" : 1000, "data_size_unit" : "B", "spend_time" : 5000, "read_spend_time" : 5000, "write_spend_time" : 5000, "remarks" : "Task execute success", "detail_logs" : [ { "id" : "id123456789", "status" : 500, "position" : "READER", "position_status" : "NORMAL", "stage" : "adapter", "dirty_data_count" : 0, "data_count" : 100, "data_size" : 1000, "data_size_unit" : "B", "spend_time" : 5000, "remarks" : "task start successfully.", "step_begin_time" : 1603243428000, "step_end_time" : 1603243428000 } ] } ] }
  • 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 total Integer 总数。 最小值:1 最大值:99999 size Integer 当前页日志数量。 最小值:1 最大值:99999 entities Array of TaskMonitorLog objects 任务监控日志当前页元素。 数组长度:1 - 9999 表5 TaskMonitorLog 参数 参数类型 描述 id String 单次任务执行的跟踪ID。 最小长度:10 最大长度:40 start_time Integer 本次执行启动时间,格式timestamp(ms),使用UTC时区。 最小值:1 最大值:9999999999999 dispatch_time Integer 计划执行时间,格式timestamp(ms),使用UTC时区。 最小值:1 最大值:9999999999999 end_time Integer 写入结束时间,格式timestamp(ms),使用UTC时区。 最小值:1 最大值:9999999999999 execute_status String 任务本次执行状态: UNSTARTED(未启动) WAITING(等待调度中) RUNNING(执行中) SUC CES S(执行成功) CANCELLED(任务取消) ERROR(执行异常) 最小长度:3 最大长度:10 position String 标识本次任务执行到哪一个阶段: ADAPTER(任务处于初始化阶段) READER(任务正在执行Reader读操作) WRITER(任务正在执行Writer写操作) 最小长度:3 最大长度:10 position_status String 任务本次执行当前阶段的状态: NORMAL(正在运行) NODE_END(本节点正常结束) RUNTIME_CANCEL(任务被取消) TASK_END(本任务正常结束) RUNTIME_ERR(运行时异常) INTERNAL_ERR(内部程序异常) 最小长度:3 最大长度:20 status Integer 本次任务执行详细状态,状态码划分规则:reader端 100 ~ 499,writer端 500 ~ 899,其他900 ~ : 16(被强制取消) 99(任务开始) 100(Reader 任务开始) 101(Reader 任务结束) 102(正在读取数据) 103(读端数据源端异常) 104(读取数据结束) 105(读取数据为0) 106(读任务强制取消) 107(在reader plugin中,任务发生了中断) 108(读任务恢复运行) 500(Writer 任务开始) 501(Writer 任务结束) 502(正在数据写入) 503(目标端异常) 504(数据写入结束) 505(写任务强制取消) 506(在writer plugin中,任务发生了中断) 507(写任务恢复运行) 900(接收到调度请求) 901(任务运行结束) 902(任务已运行结束,正在进行数据完整性校验) 903(输出数据完整性校验结果) 904(经过数据完整性校验,发现有数据缺失,正在进行数据补偿) 905(输出数据补偿结果) 906(读取任务正在排队中(平台资源)) 907(读取任务被拒绝执行,因为上一次调度还没有结束) 908(写入任务正在排队中(平台资源)) 909(写入任务被拒绝执行,因为上一次调度还没有结束) 911(读取任务没有被正常开启,请检查网络是否通畅,参数是否正确) 912(写入任务没有被正常开启,请检查网络是否通畅,参数是否正确) 913(任务调度请求失败) 914(任务被拒绝执行,因为上一次调度还没有结束) 915(任务不正常运行) 916(任务日志上报异常) 最小值:1 最大值:1000 dirty_data_count Integer 异常数据条数。 最小值:0 最大值:9999999999999 data_count Integer 成功数据条数。 最小值:0 最大值:9999999999999 data_size Number 成功数据大小,浮点数类型。 最小值:0 最大值:9999999999999 data_size_unit String 成功数据大小的计量单位。 最小长度:1 最大长度:2 spend_time Integer 执行时长,单位:ms。 最小值:0 最大值:9999999999999 read_spend_time Integer 读取执行时长,单位:ms,只有在定时任务时存在该属性。 最小值:0 最大值:9999999999999 write_spend_time Integer 写入执行时长,单位:ms。 最小值:0 最大值:9999999999999 remarks String 本次执行结果简要信息。 最小长度:0 最大长度:1000 detail_logs Array of TaskMonitorDetailLog objects 本次执行详细轨迹信息。 数组长度:1 - 9999 表6 TaskMonitorDetailLog 参数 参数类型 描述 id String 任务每次执行步骤产生的唯一ID。 最小长度:10 最大长度:40 status Integer 本次任务执行详细状态,状态码划分规则:reader端 100 ~ 499,writer端 500 ~ 899,其他900 ~ : 16(被强制取消) 99(任务开始) 100(Reader 任务开始) 101(Reader 任务结束) 102(正在读取数据) 103(读端数据源端异常) 104(读取数据结束) 105(读取数据为0) 106(读任务强制取消) 107(在reader plugin中,任务发生了中断) 108(读任务恢复运行) 500(Writer 任务开始) 501(Writer 任务结束) 502(正在数据写入) 503(目标端异常) 504(数据写入结束) 505(写任务强制取消) 506(在writer plugin中,任务发生了中断) 507(写任务恢复运行) 900(接收到调度请求) 901(任务运行结束) 902(任务已运行结束,正在进行数据完整性校验) 903(输出数据完整性校验结果) 904(经过数据完整性校验,发现有数据缺失,正在进行数据补偿) 905(输出数据补偿结果) 906(读取任务正在排队中(平台资源)) 907(读取任务被拒绝执行,因为上一次调度还没有结束) 908(写入任务正在排队中(平台资源)) 909(写入任务被拒绝执行,因为上一次调度还没有结束) 911(读取任务没有被正常开启,请检查网络是否通畅,参数是否正确) 912(写入任务没有被正常开启,请检查网络是否通畅,参数是否正确) 913(任务调度请求失败) 914(任务被拒绝执行,因为上一次调度还没有结束) 915(任务不正常运行) 916(任务日志上报异常) 最小值:1 最大值:1000 position String 标识当前步骤属于哪一个阶段: ADAPTER(任务处于初始化阶段) READER(任务正在执行Reader读操作) WRITER(任务正在执行Writer写操作) 最小长度:3 最大长度:10 position_status String 任务当前步骤的状态: NORMAL(正在运行) NODE_END(本节点正常结束) RUNTIME_CANCEL(任务被取消) TASK_END(本任务正常结束) RUNTIME_ERR(运行时异常) INTERNAL_ERR(内部程序异常) 最小长度:3 最大长度:20 stage String 标识当前步骤属于哪一个FDI插件,如adapter、apireader、rdbwriter等。 最小长度:3 最大长度:20 dirty_data_count Integer 异常数据条数。 最小值:0 最大值:9999999999999 data_count Integer 成功数据条数。 最小值:0 最大值:9999999999999 data_size Number 成功数据大小,浮点数类型。 最小值:0 最大值:9999999999999 data_size_unit String 成功数据大小的计量单位。 最小长度:1 最大长度:2 spend_time Integer 执行时长,单位:ms。 最小值:0 最大值:9999999999999 remarks String 执行详细信息。 最小长度:1 最大长度:256 step_begin_time Integer 本次步骤启动时间,格式timestamp(ms),使用UTC时区。 最小值:1 最大值:9999999999999 step_end_time Integer 本次步骤结束时间,格式timestamp(ms),使用UTC时区。 最小值:1 最大值:9999999999999 状态码: 400 表7 响应Body参数 参数 参数类型 描述 error_code String 错误码。 最小长度:8 最大长度:36 error_msg String 错误描述。 最小长度:2 最大长度:512 状态码: 404 表8 响应Body参数 参数 参数类型 描述 error_code String 错误码。 最小长度:8 最大长度:36 error_msg String 错误描述。 最小长度:2 最大长度:512 状态码: 500 表9 响应Body参数 参数 参数类型 描述 error_code String 错误码。 最小长度:8 最大长度:36 error_msg String 错误描述。 最小长度:2 最大长度:512
  • URI GET /v2/{project_id}/streams/{stream_name}/metrics 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID。 stream_name 是 String 通道名称。 最大长度:60 表2 Query参数 参数 是否必选 参数类型 描述 label 否 String 通道监控指标。(label与label_list必须二选一,label_list与label同时存在时,以label_list为准) total_put_bytes_per_stream:总输入流量(Byte) total_get_bytes_per_stream:总输出流量(Byte) total_put_records_per_stream:总输入记录数(个) total_get_records_per_stream:总输出记录数(个) total_put_req_latency:上传请求平均处理时间(毫秒) total_get_req_latency:下载请求平均处理时间(毫秒) total_put_req_suc_per_stream:上传请求成功次数(个) total_get_req_suc_per_stream:下载请求成功次数(个) traffic_control_put:因流控拒绝的上传请求次数 (个) traffic_control_get:因流控拒绝的下载请求次数 (个) 枚举值: total_put_bytes_per_stream total_get_bytes_per_stream total_put_records_per_stream total_get_records_per_stream total_put_req_latency total_get_req_latency total_put_req_suc_per_stream total_get_req_suc_per_stream traffic_control_put traffic_control_get label_list 否 String 使用label用逗号拼接组成,用于批量查询多个label的指标。(label与label_list必须二选一,label_list与label同时存在时,以label_list为准) start_time 是 Long 监控开始时间点,10位时间戳。 end_time 是 Long 监控结束时间点,10位时间戳。
  • 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 metrics Metrics object 数据对象。 metrics_list Array of Metrics objects 监控数据对象列表。 表5 Metrics 参数 参数类型 描述 dataPoints Array of DataPoint objects 监控数据。 label String 监控指标。 表6 DataPoint 参数 参数类型 描述 timestamp Long 时间戳。 value Long 时间戳对应的监控值。
  • 响应示例 状态码: 200 OK { "total" : 99999, "size" : 99999, "entities" : [ { "task_id" : "id123456789", "task_name" : "fdi_task_name", "task_type" : "TIMING", "status" : 0, "last_execute_time" : 1603243428000, "use_quartz_cron" : false, "cron" : "0 */15 * * * ?", "period" : "DAY", "dispatch_interval" : 1, "position" : "READER", "execute_status" : "RUNNING", "source_app_id" : "28f61af50fc9452aa0ed5ea25c3cc3d3", "source_app_name" : "source-app", "source_instance_id" : "source-instance", "target_app_id" : "28f61af50fc9452aa0ed5ea25c3cc3d3", "target_app_name" : "target-app", "target_instance_id" : "target-instance", "ext_type" : "CDC", "enterprise_project_id" : "string", "task_tag" : "string" } ] }
  • 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 total Integer 总数。 最小值:1 最大值:99999 size Integer 当前页监控信息数量。 最小值:1 最大值:99999 entities Array of TaskMonitorInfo objects 任务监控信息当前页元素。 数组长度:1 - 9999 表5 TaskMonitorInfo 参数 参数类型 描述 task_id String 任务ID。 最小长度:10 最大长度:40 task_name String 任务名称。 最小长度:3 最大长度:100 task_type String 任务类型: TIMING(定时任务) REALTIME(实时任务) 最小长度:3 最大长度:10 status Integer 任务状态: 0(停止) 1(运行中) 最小长度:3 最大长度:10 last_execute_time Integer 任务最近一次执行时间,格式timestamp(ms),使用UTC时区。 最小值:1 最大值:999999999999999999 use_quartz_cron Boolean 任务是否使用Quartz表达式,只有定时任务才有该属性。 cron String CRON表达式,只有定时任务且use_quartz_cron为true时才有该属性。 最小长度:3 最大长度:20 period String 调度周期的单位,如天,小时等,只有定时任务且use_quartz_cron为false时才有该属性: MIN(分钟) HOUR(小时) DAY(天) WEEK(周) MON(月) 最小长度:3 最大长度:5 dispatch_interval Integer 调度周期,和period字段一起可以确定每隔多长时间调度一次,只有定时任务且use_quartz_cron为false时才有该属性。 最小值:1 最大值:60 position String 标识最近一次任务执行到哪一个阶段: ADAPTER(任务处于初始化阶段) READER(任务正在执行Reader读操作) WRITER(任务正在执行Writer写操作) 最小长度:3 最大长度:10 execute_status String 任务最近一次执行状态: UNSTARTED(未启动) WAITING(等待调度中) RUNNING(执行中) SUCCESS(执行成功) CANCELLED(任务取消) ERROR(执行异常) 最小长度:3 最大长度:10 source_app_id String 任务源端数据源所属应用ID。 最小长度:1 最大长度:36 source_app_name String 任务源端数据源所属应用名称。 最小长度:1 最大长度:256 source_instance_id String 任务源端数据源所属实例ID。 最小长度:1 最大长度:60 target_app_id String 任务目标端数据源所属应用ID。 最小长度:1 最大长度:36 target_app_name String 任务目标端数据源所属应用名称。 最小长度:1 最大长度:256 target_instance_id String 任务目标端数据源所属实例ID。 最小长度:1 最大长度:60 ext_type String 任务扩展类型,当前如果是CDC组合任务,该字段为CDC,否则为null。 最小长度:1 最大长度:10 enterprise_project_id String 任务所属企业项目ID,默认为0。 最小长度:1 最大长度:60 task_tag String 任务标签。 最小长度:1 最大长度:256 状态码: 400 表6 响应Body参数 参数 参数类型 描述 error_code String 错误码。 最小长度:8 最大长度:36 error_msg String 错误描述。 最小长度:2 最大长度:512 状态码: 500 表7 响应Body参数 参数 参数类型 描述 error_code String 错误码。 最小长度:8 最大长度:36 error_msg String 错误描述。 最小长度:2 最大长度:512
  • 响应示例 状态码: 200 OK { "totalRecord" : 2, "slowLogList" : [ { "users" : "testddm", "database" : "test1", "querySample" : "select id, sleep(3) from test", "logTime" : "2021-04-26T02:40:21", "time" : "12002", "shards" : "test1_0000", "rowsExamined" : "4", "host" : "192.168.16.18" } ] } 状态码: 400 bad request { "externalMessage" : "Parameter error.", "errCode" : "DBS.280001" } 状态码: 500 server error { "externalMessage" : "Server failure.", "errCode" : "DBS.200412" }
  • URI GET /v2/{project_id}/instances/{instance_id}/slowlog?curPage={curPage}&perPage={perPage}&startDate={startDate}&endDate={endDate} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID。 获取方法请参见获取项目ID。 instance_id 是 String DDM实例ID。 表2 Query参数 参数 是否必选 参数类型 描述 curPage 是 String 分页参数:起始值 [大于等于1] 。 perPage 是 String 分页参数:每页多少条。 startDate 是 String 开始时间,UNIX时间戳格式,单位是毫秒。 endDate 是 String 结束时间,UNIX时间戳格式,单位是毫秒。 结束时间与开始时间,间隔不能超过7天。