华为云用户手册

  • 创建Elasticsearch监控 登录MAS控制台,在“多活管理”页面单击实例(实例所属命名空间类型为同城多活),进入实例控制台。 在页面顶端导航栏选择“监控列表”,单击页面左上角的“新增监控”。 在新增监控页面配置监控基础配置,完成后单击“下一步:数据中心配置”。 图1 新增Elasticsearch监控-基础配置 表2 基础配置信息 参数 配置说明 监控 选择需要新增的监控类型,此处请选择“Elasticsearch监控”。 应用名称 选择应用列表中创建的应用。 监控器名称 自定义监控器名称。 异常通知设置 默认为“关”。 若设置为“开”: 当监控器或被监控的数据库异常时会及时给用户发送异常通知或告警通知。支持华为 云消息 通知服务,请先配置密钥。 默认将开启 云监控 ,请前往云监控确认是否已创建MAS事件监控告警规则,如已创建请忽略。 通知主题 若异常通知设置选择“开”,则需要在通知主题列表选择主题,如无主题列表,单击新增,新增通知主题之后进行后续操作。 是否监控 默认“是”,选“否”则不会探测数据库异常情况。 是否自动切换 默认“是”,选“否”则不会自动切换数据库。 路由算法 选择路由算法,支持单边读写。 填写数据中心配置,完成后单击“下一步:高级配置”。 图2 新增Elasticsearch监控-数据中心配置 表3 数据中心配置信息 参数 配置说明 云选择 被监控的Elasticsearch部署的环境。 局点 被监控Elasticsearch部署的区域。 azs 被监控Elasticsearch部署的可用区。 连接地址 Elasticsearch的访问地址和端口。 添加连接地址 添加Elasticsearch的连接地址。 用户名 被监控的Elasticsearch的用户名。 注意: 建议监控用户名与业务用户名分开使用,不推荐与业务使用相同用户名,避免产生安全风险。 连接类型 Elasticsearch的连接类型,支持HTTPS和HTTP。 连接密码 被监控的Elasticsearch的连接密码。 确认密码 再次填写Elasticsearch的连接密码。 请确认密码正确,7.10.2及以上版本的elasticsearch,密码错误将导致数据源锁定15分钟,15分钟后监控状态才会显示正常。 填写高级配置,完成后单击“下一步:确认配置”。 图3 新增Elasticsearch监控-高级配置 表4 高级配置信息 参数 配置说明 重试时间间隔 尝试重连时间间隔,以毫秒为单位,默认值3000ms。 输入值必须在1到300000之间,建议使用默认值。 监控超时时间 一个周期内监控器对数据库探测监控的超时时间,超过这个时间,则认为探测数据库失败,监控状态变为监控异常。 以毫秒为单位,默认值40000ms,输入值必须在1到600000之间,建议使用默认值。 说明: 如果您需要修改监控超时时间,监控超时时间建议大于故障时数据中心1的数据同步到数据中心2所需时间,否则切换数据中心后,数据中心2的数据可能存在不完整的情况。 确认配置无误后单击“立即创建”,完成创建Elasticsearch监控。 Elasticsearch监控器创建完成后,数据中心的正常监控状态标识为绿色。如果是其他异常状态,可能是监控器信息配置错误或者是监控的数据库本身存在异常,请进行故障排除。
  • 创建同步链路 登录MAS控制台,在“数据同步”页面,单击右上角的“创建同步链路”。 在“创建同步链路”页面,填写配置信息,然后单击“确定”。 图1 创建同步链路 表1 同步链路配置参数 参数 配置说明 命名空间 选择已创建好的命名空间。 任务异常通知设置 默认为“关”。若设置为“开”,当监控器或被监控的数据库异常时会及时给用户发送异常通知或告警通知。 任务异常自动结束时间 配置任务异常自动结束时间,任务处于异常状态一段时间后,将会自动结束。默认值14,单位为天。 SMN 主题 “任务异常通知设置”项开启后可见。需要在SMN主题列表选择主题。 时延阈值(s) “任务异常通知设置”项开启后可见。时延阈值默认为“关”。 在增量同步阶段,源数据库和目标数据库之间的同步有时会存在一个时间差,称为时延,单位为秒。 时延阈值设置是指时延超过一定的值后(时延阈值范围为0—3600s),DRS可以发送告警通知。 RTO时延阈值(s) “任务异常通知设置”项开启后可见。配置RTO时延阈值,默认为“关”。 RTO(Recovery Time Objective)指当前DRS实例上事务,传输至灾备实例且执行成功的时间差(该事务通常也是DRS收到的最新的一个事务)。RTO是处在传输中数据量的一种度量方式,RTO=0时,意味着DRS实例上的事务已经全部在灾备数据库上执行完毕。 RPO时延阈值(s) “任务异常通知设置”项开启后可见。配置RPO时延阈值,默认为“关”。 RPO(Recovery Point Objective)指当前业务数据库一个事务的提交时间,与该事务送达DRS的时间差(该事务通常也是DRS收到的最新的一个事务)。是主实例与DRS实例数据差的一种度量方式,RPO=0时,意味着业务数据库的最新数据已经全部到达DRS实例。 添加链路 新增一条同步链路。 名称 同步链路名称,默认自动生成,或者根据规划自定义填写。 源数据源 选择源数据源。 目标数据源 选择目标数据源。 同步方案 选择数据同步方案。 同步方向 选择同步方向,“单向”或“双向”选择其一,默认“单向”。 限速配置 选择限速配置,“限速”或“不限速”选择其一,默认“限速”。 限速时段 选择限速时段,“全天限流”或“时段限流”选择其一,默认“全天限流”。 流速大小 配置流速大小值,单位为MB/S,最大值为9999。 时间范围 若限速时段选择“时段限流”,则需要配置限流时间范围。
  • 概述 Elasticsearch监控器可对用户业务使用的Elasticsearch引擎进行探测,并且在Elasticsearch异常时自动触发流量切换。 表1 监控状态说明 监控状态 状态说明 绿色 监控正常。 红色 监控异常。从正常到异常,在允许自动切换的情况下,自动触发流量切换。 黄色 初始化监控失败。此状态表示Monitor启动时初次监控探测失败,确保配置信息无误的情况下,需要联系运维处理。 浅灰 监控未生成或监控配置错误。 深灰 调用异常。监控连接ETCD状态异常。
  • 准备依赖资源 在创建多活实例前您需要提前准备相关依赖资源,包括VPC、子网和安全组。每个多活实例都部署在某个虚拟私有云(VPC)中,并绑定具体的子网和安全组,通过这样的方式为MAS提供一个隔离的、用户自主配置和管理的虚拟网络环境以及安全保护策略。 创建VPC和子网的操作指导请参考创建虚拟私有云和子网,若需要在已有VPC上创建和使用新的子网,请参考为虚拟私有云创建新的子网。 创建安全组的操作指导请参考创建安全组,为安全组添加规则的操作指导请参考添加安全组规则。
  • 创建API监控 登录MAS控制台,在“多活管理”页面单击实例(实例所属命名空间类型为同城多活),进入实例控制台。 在页面顶端导航栏选择“监控列表”,单击页面左上角的“新增监控”。 在新增监控页面配置监控基础配置,完成后单击“下一步:数据中心配置”。 图1 新增API监控-基础配置 表2 基础配置信息 参数 配置说明 监控 选择需要新增的监控类型,此处请选择“API监控”。 应用名称 选择应用列表中创建的应用。 监控器名称 自定义监控器名称。 异常通知设置 默认为“关”。 若设置为“开”: 当监控器或被监控的API异常时会及时给用户发送异常通知或告警通知。支持华为云 消息通知 服务,请先配置密钥。 默认将开启云监控,请前往云监控确认是否已创建MAS事件监控告警规则,如已创建请忽略。 通知主题 若异常通知设置选择“开”,则需要在通知主题列表选择主题,如无主题列表,单击新增,新增通知主题之后进行后续操作。 是否监控 默认选“是”,若选择“否”则不会再监控APIG的状态。 填写数据中心配置,完成后单击“下一步:高级配置”。 图2 新增API监控-数据中心配置 表3 数据中心配置信息 参数 配置说明 云选择 选择被监控的APIG部署的环境。 局点 被监控的APIG所在区域。 连接地址 协议选择http或https,地址填写APIG的连接地址。 请求路径 APIG的健康检查路径信息。 请求方法 可选择GET、POST、DELETE、PUT、PATCH方法。 响应码 根据监控的APIG的接口实际需求配置,例如200。 请求头 根据监控的APIG的接口实际需求配置请求头。 请求头若涉及敏感信息,请用户自行加密再填入。 填写高级配置,完成后单击“下一步:确认配置”。 图3 新增API监控-高级配置 表4 高级配置信息 参数 配置说明 重试时间间隔 尝试重连时间间隔,以毫秒为单位,默认值5000ms。 输入值必须在1到300000之间,建议使用默认值。 正常阈值 配置连接API次数的正常阈值,当连续连接次数达到或超过正常阈值,认为API连接正常。 说明: 输入值必须在1到5之间,默认为2,建议使用默认值。 异常阈值 配置连接API次数的异常阈值,当连续连接失败次数达到或超过异常阈值,认为API连接异常。 说明: 输入值必须在3到10之间,默认为3,建议使用默认值。 确认配置无误后单击“立即创建”,完成创建API监控。 API监控器创建完成后,数据中心的正常监控状态标识为绿色。如果是其他异常状态,可能是监控器信息配置错误或者是监控的API本身存在异常,请进行故障排除。
  • 跨账号执行Smart Connect任务 当前账号通过“Smart Connect任务操作”插件执行其他账号下的Smart Connect任务时,需要提前创建委托和创建凭证,其步骤如下: 委托方账号创建委托并授权,授予被委托账号所需 IAM 和DMS的权限。 IAM所需最小权限策略如下: {"Version": "1.1","Statement": [{"Action": ["iam:projects:listProjects"],"Effect": "Allow"}]} Smart Connect所需最小权限策略如下: { "Version": "1.1", "Statement": [ { "Effect": "Allow", "Action": [ "dms:instance:list", "dms:instance:get", "dms:instance:getConnectorSinkTask" "dms:instance:createConnectorSinkTask" ] } ]} 被委托账号创建凭证,“委托账号”和“委托名”根据1配置。
  • 配置介绍 表1 选择输入-配置说明 参数 配置说明 任务所在region 选择任务所在区域。 凭证 选择凭证,默认显示当前命名空间多活分区下已配置的默认凭证。 项目 选择项目,默认显示当前命名空间多活分区下已配置的默认项目。 任务 选择DRS任务。 对象级对比 选择“关闭”或“开启”。 说明: 数据对比和对象对比必须要有一个开启。 对比类型 选择对象。 数据级对比 选择“关闭”或“开启”。 说明: 数据对比和对象对比必须要有一个开启。 对比类型 选择行数对比或内容对比。 说明: 对象级对比开启或者任务类型规模非大规格、任务引擎为DDM,不能选择内容对比。 对象选择 请选择对比对象。 任务名称 请自定义输入任务名称。 表2 手动输入-配置说明 参数 配置说明 任务所在region 配置任务所在区域。 项目ID 配置项目ID。 凭证ID (可选)配置委托凭证ID。 说明: 不填写凭证ID:默认使用当前凭证。 使用委托时:凭证ID/委托项目ID需要同时填写。 委托项目ID (可选)配置委托项目ID。 任务ID 输入DRS任务ID。 对象级对比 输入“true”(开启)或“false”(关闭)。 说明: 数据对比和对象对比必须要有一个开启。 对比类型 输入对象。 数据级对比 输入“true”(开启)或“false”(关闭)。 说明: 数据对比和对象对比必须要有一个开启。 对比类型 选择行数对比或内容对比。 说明: 对象级对比开启或者任务类型规模非大规格、任务引擎为DDM,不能选择内容对比。 对象选择 请选择对比对象。 任务名称 请自定义输入任务名称。
  • 跨账号执行DRS任务 当前账号通过“DRS数据级/对象级对比”插件执行其他账号下的DRS任务时,需要提前创建委托和创建凭证,其步骤如下: 委托方账号创建委托并授权,授予被委托账号所需IAM和DRS的权限。 IAM所需最小权限策略如下: {"Version": "1.1","Statement": [{"Action": ["iam:projects:listProjects"],"Effect": "Allow"}]} DRS所需最小权限策略如下: { "Version": "1.1", "Statement": [ { "Effect": "Allow", "Action": [ "drs:disasterRecoveryJob:get", "drs:migrationCompareJob:start", "drs:migrationCompareJob:create", "drs:migrationCompareJob:delete", "drs:migrationJob:get3", "drs:compareJob:list", "drs:compareJob:getResult" ] } ]} 被委托账号创建凭证,“委托账号”和“委托名”根据1配置。
  • 工作负载类 表1 工作负载类参数配置 故障类型 故障模式 设置参数 CPU 工作负载CPU过载 cluster_name ;namespace ;workload_name ;usage 内存 工作负载内存过载 cluster_name ;namespace ;workload_name ;usage 进程 工作负载杀进程 cluster_name ;namespace ;workload_name ;process 进程持续异常,即使重新拉起也会被再次杀掉 cluster_name ;namespace ;workload_name ;process 进程停止 cluster_name ;namespace ;workload_name ;process 磁盘 工作负载磁盘满 cluster_name ;namespace ;workload_name ;disk ;usage 工作负载磁盘IO高 cluster_name ;namespace ;workload_name ;disk ;operate POD 停止工作负载实例 cluster_name ;namespace ;workload_name 网络-数据链路层 工作负载链路层网络时延 cluster_name ;namespace ;workload_name ;dev ;delay 工作负载链路层网络丢包 cluster_name ;namespace ;workload_name ;dev ;loss_rate 工作负载链路层网络错包 cluster_name ;namespace ;workload_name ;dev ;corrupt_rate 工作负载链路层网络重复 cluster_name ;namespace ;workload_name ;dev ;duplicate_rate 工作负载链路层网络乱序 cluster_name ;namespace ;workload_name ;dev ;reorder_rate 工作负载网卡down cluster_name ;namespace ;workload_name ;dev 工作负载Dns篡改 cluster_name ;namespace ;workload_name ;domain;ip 网络-传输层 工作负载网络中断 cluster_name ;namespace ;workload_name ;中断方向 :入方向/出方向;协议(默认tcp) ;客户端IP地址 /服务端IP地址;端口 文件 工作负载文件新增 cluster_name ;namespace ;workload_name ;文件路径 ;文件内容 ;是否是文件夹 :是/否 工作负载文件追加内容 cluster_name ;namespace ;workload_name ;文件路径 ;追加内容;追加次数;间隔时间 工作负载文件修改权限 cluster_name ;namespace ;workload_name ;文件路径 ;权限mod 工作负载文件删除 cluster_name ;namespace ;workload_name ;文件路径 ;是否彻底删除:是/否 工作负载文件移动 cluster_name ;namespace ;workload_name ;文件路径 ;目标路径;是否强制移动:是/否
  • 节点类 表4 节点类参数配置 故障类型 故障模式 设置参数 CPU 节点CPU过载 cluster_name ;节点名称;usage 内存 节点内存过载 cluster_name ;节点名称;usage 进程 节点杀进程 cluster_name ;节点名称;process 进程持续异常,即使重新拉起也会被再次杀掉 cluster_name ;节点名称;process 进程停止 cluster_name ;节点名称 ;process 网络-数据链路层 节点链路层网络时延 cluster_name ;节点名称;dev ;delay 节点链路层网络丢包 cluster_name ;节点名称;dev ;loss_rate 节点链路层网络错包 cluster_name ;节点名称;dev ;corrupt_rate 节点链路层网络重复 cluster_name ;节点名称;dev ;duplicate_rate 节点链路层网络乱序 cluster_name ;节点名称;dev ;reorder_rate 节点网卡down cluster_name ;节点名称;dev 节点Dns篡改 cluster_name ;节点名称;domain;ip 网络-传输层 节点网络中断 cluster_name ;节点名称;中断方向 :入方向/出方向;协议(默认tcp) ;客户端IP地址 /服务端IP地址;端口
  • POD类 表2 POD类参数配置 故障类型 故障模式 设置参数 CPU pod CPU过载 cluster_name ;namespace ;pod_name ;usage 内存 pod内存过载 cluster_name ;namespace ;pod_name ;usage 进程 pod杀进程 cluster_name ;namespace ;pod_name ;process 进程持续异常,即使重新拉起也会被再次杀掉 cluster_name ;namespace ;pod_name ;process 进程停止 cluster_name ;namespace ;pod_name ;process 磁盘 pod磁盘满 cluster_name ;namespace ;pod_name ;disk ;usage pod磁盘IO高 cluster_name ;namespace ;pod_name ;disk ;operate POD 停止pod实例 cluster_name ;namespace ;pod_name 网络-数据链路层 pod链路层网络时延 cluster_name ;namespace ;pod_name ;dev ;delay pod链路层网络丢包 cluster_name ;namespace ;pod_name ;dev ;loss_rate pod链路层网络错包 cluster_name ;namespace ;pod_name ;dev ;corrupt_rate pod链路层网络重复 cluster_name ;namespace ;pod_name ;dev ;duplicate_rate pod链路层网络乱序 cluster_name ;namespace ;pod_name ;dev ;reorder_rate pod网卡down cluster_name ;namespace ;pod_name ;dev podDns篡改 cluster_name ;namespace ;pod_name ;domain;ip 网络-传输层 pod网络中断 cluster_name ;namespace ;pod_name ;中断方向 :入方向/出方向;协议(默认tcp) ;客户端IP地址 /服务端IP地址;端口 文件 pod文件新增 cluster_name ;namespace ;pod_name ;文件路径 ;文件内容 ;是否是文件夹 :是/否 pod文件追加内容 cluster_name ;namespace ;pod_name ;文件路径 ;追加内容;追加次数;间隔时间 pod文件修改权限 cluster_name ;namespace ;pod_name ;文件路径 ;权限mod pod文件删除 cluster_name ;namespace ;pod_name ;文件路径 ;是否彻底删除:是/否 pod文件移动 cluster_name ;namespace ;pod_name ;文件路径 ;目标路径;是否强制移动:是/否
  • 容器类 表3 容器类参数配置 故障类型 故障模式 设置参数 容器实例 容器实例移除 cluster_name ;namespace ;pod_name ;容器名称 ;force CPU 容器CPU过载 cluster_name ;namespace ;pod_name ;容器名称 ;usage 内存 容器内存过载 cluster_name ;namespace ;pod_name ;容器名称 ;usage 进程 容器杀进程 cluster_name ;namespace ;pod_name ;容器名称 ;process 进程持续异常,即使重新拉起也会被再次杀掉 cluster_name ;namespace ;pod_name ;容器名称 ;process 进程停止 cluster_name ;namespace ;pod_name ;容器名称 ;process 磁盘 容器磁盘满 cluster_name ;namespace ;pod_name ;容器名称 ;disk ;usage 容器磁盘IO高 cluster_name ;namespace ;pod_name ;容器名称 ;disk ;operate 网络-数据链路层 容器链路层网络时延 cluster_name ;namespace ;pod_name ;容器名称;dev ;delay 容器链路层网络丢包 cluster_name ;namespace ;pod_name ;容器名称;dev ;loss_rate 容器链路层网络错包 cluster_name ;namespace ;pod_name ;容器名称;dev ;corrupt_rate 容器链路层网络重复 cluster_name ;namespace ;pod_name ;容器名称;dev ;duplicate_rate 容器链路层网络乱序 cluster_name ;namespace ;pod_name ;容器名称;dev ;reorder_rate 容器网卡down cluster_name ;namespace ;pod_name ;容器名称;dev 容器Dns篡改 cluster_name ;namespace ;pod_name ;domain;ip 网络-传输层 容器网络中断 cluster_name ;namespace ;pod_name ;容器名称;中断方向 :入方向/出方向;协议(默认tcp) ;客户端IP地址 /服务端IP地址;端口 文件 容器文件新增 cluster_name ;namespace ;pod_name ;文件路径 ;文件内容 ;是否是文件夹 :是/否 容器文件追加内容 cluster_name ;namespace ;pod_name;容器名称 ;文件路径 ;追加内容;追加次数;间隔时间 容器文件修改权限 cluster_name ;namespace ;pod_name;容器名称 ;文件路径 ;权限mod 容器文件删除 cluster_name ;namespace ;pod_name ;容器名称;文件路径 ;是否彻底删除:是/否 容器文件移动 cluster_name ;namespace ;pod_name ;容器名称;文件路径 ;目标路径;是否强制移动:是/否
  • 跨账号执行RDS任务 当前账号通过“RDS检查容灾复制状态”插件执行其他账号下的RDS任务时,需要提前创建委托和创建凭证,其步骤如下: 委托方账号创建委托并授权,授予被委托账号所需IAM和RDS的权限。 IAM所需最小权限策略如下: {"Version": "1.1","Statement": [{"Action": ["iam:projects:listProjects"],"Effect": "Allow"}]} RDS所需最小权限策略如下: { "Version": "1.1", "Statement": [ { "Effect": "Allow", "Action": [ "rds:instance:list" ] } ]} 被委托账号创建凭证,“委托账号”和“委托名”根据1配置。
  • 配置介绍 表1 选择输入-配置说明 参数 配置说明 任务所在region 选择任务所在区域。 凭证 选择凭证,默认显示当前命名空间多活分区下已配置的默认凭证。 项目 选择项目,默认显示当前命名空间多活分区下已配置的默认项目。 实例 选择任务。 预期同步状态 请选择正常或异常。 发送延迟阈值(单位:MB) 输入发送延迟阈值。 说明: 应为0到2147483647之间的整数。 端到端延迟阈值(单位:MB) 输入端到端延迟阈值。 说明: 应为0到2147483647之间的整数。 回放延迟时间阈值(单位:ms) 输入回放延迟时间阈值。 说明: 应为0到2147483647之间的整数。 检查时间间隔(单位:s) 输入检查时间间隔。 说明: 应为0到2147483647之间的整数。 检查次数 输入检查次数。 说明: 应为-1或1到2147483647之间的整数,-1表示不限次数。 任务名称 请自定义输入任务名称。 表2 手动输入-配置说明 参数 配置说明 任务所在region 配置任务所在区域。 项目ID 配置项目ID。 凭证ID (可选)配置委托凭证ID。 说明: 不填写凭证ID:默认使用当前凭证。 使用委托时:凭证ID/委托项目ID需要同时填写。 委托项目ID (可选)配置委托项目ID。 实例ID 输入RDS实例ID。 预期同步状态 请选择正常或异常。 发送延迟阈值(单位:MB) 输入发送延迟阈值。 说明: 应为0到2147483647之间的整数。 端到端延迟阈值(单位:MB) 输入端到端延迟阈值。 说明: 应为0到2147483647之间的整数。 回放延迟时间阈值(单位:ms) 输入回放延迟时间阈值。 说明: 应为0到2147483647之间的整数。 检查时间间隔(单位:s) 输入检查时间间隔。 说明: 应为0到2147483647之间的整数。 检查次数 输入检查次数。 说明: 应为-1或1到2147483647之间的整数,-1表示不限次数。 任务名称 请自定义输入任务名称。
  • 配置介绍 表1 选择输入-配置说明 参数 配置说明 任务所在region 选择任务所在区域。 凭证 选择凭证,默认显示当前命名空间多活分区下已配置的默认凭证。 项目 选择项目,默认显示当前命名空间多活分区下已配置的默认项目。 任务 选择DRS灾备任务名称。 检查RPO 配置是否检查RPO。 开启 关闭 RPO阈值(单位:秒) 配置RPO阈值。 检查RTO 配置是否检查RTO。 开启 关闭 说明: 检查RPO和检查RTO必须要有一个开启。 RTO阈值(单位:秒) 配置RTO阈值。 检查时间间隔(单位:秒) 配置检查时间间隔。 检查次数 配置检查次数。 任务名称 请自定义输入任务名称。 表2 手动输入-配置说明 参数 配置说明 任务所在region 配置任务所在区域。 项目ID 配置项目ID。 凭证ID (可选)配置委托凭证ID。 说明: 不填写凭证ID:默认使用当前凭证。 使用委托时:凭证ID/委托项目ID需要同时填写。 委托项目ID (可选)配置委托项目ID。 任务ID 配置DRS灾备任务ID。 检查RPO 配置是否检查RPO。 开启 关闭 RPO阈值(单位:秒) 配置RPO阈值。 检查RTO 配置是否检查RTO。 开启 关闭 说明: 检查RPO和检查RTO必须要有一个开启。 RTO阈值(单位:秒) 配置RTO阈值。 检查时间间隔(单位:秒) 配置检查时间间隔。 检查次数 配置检查次数。 任务名称 请自定义输入任务名称。
  • 操作步骤 登录MAS控制台,在“多活管理”页面单击实例,进入实例控制台。 在页面顶端导航栏选择“监控列表”,单击页面左上角的“监控配置”。 配置全局监控配置(建议使用默认值),完成后单击“确定”。 表1 监控配置 参数 配置说明 监控类型 选择需要配置的监控类型,可选的监控类型依赖实例已经创建的监控器类型。 监控超时时间(ms) 一个周期内监控器对数据库探测监控的超时时间,超过这个时间,则认为探测数据库失败,监控状态变为监控异常。 以毫秒为单位,输入值必须在4000到400000之间。 重试时间间隔(ms) 尝试重连时间间隔。 输入值必须在2000到30000之间。 数据库访问超时时间(ms) 当“监控类型”配置为“MySQL/Oracle/PostgreSQL监控”和“MongoDB监控”时可见; 访问数据库超时时间,超过这个时间认为一次访问数据库失效。 输入值必须在3000到100000之间。 健康精度 探测的健康精度。配置为1,表示多活实例的监控集群中只要有一个worker探测到数据库,则认为探测成功;当探测失败时,由Leader做故障处理。 输入值必须为1或2。
  • 应用场景举例 当您使用A账号登录MAS控制台,默认可以添加A账号下的RDS资源作为数据源,如需要添加B账号下的RDS资源作为数据源,可通过B账号先创建委托将RDS资源共享给A账号,A账号在MAS控制台创建凭证(基于B账号创建的委托),并通过凭证来查询和调用B账号的RDS资源。 参考步骤如下: 委托方B账号创建委托并授权,建议授予被委托账号所需IAM和RDS的最小权限。 IAM所需最小权限策略如下: {"Version": "1.1","Statement": [{"Action": ["iam:projects:listProjects"],"Effect": "Allow"}]} RDS所需最小权限策略如下: {"Version": "1.1","Statement": [{"Action": ["rds:instance:list"],"Effect": "Allow"}]} 被委托的A账号创建凭证,凭证类型选择“IAM委托”,“委托账号”和“委托名”根据1配置。 A账号创建命名空间,主多活分区“默认凭证”配置为“当前账号凭证”,备多活分区“默认凭证”配置为2中创建的凭证。 A账号添加数据源,命名空间选择3中命名空间的“备多活分区”,“链接模式”选择“RDS”,“凭证”默认为2中创建的凭证,此时在“实例列表”下所获取的RDS实例资源,均为B账号所属资源。 若A账号下的IAM用户需要通过凭证操作B账号资源,可参考权限管理为IAM用户授权,其权限需要包括如下自定义策略所含权限: {"Version": "1.1","Statement": [{"Effect": "Allow","Action": ["iam:tokens:assume"]}]}
  • 创建凭证 登录MAS控制台,在“凭证管理”页面单击“创建凭证”。 在“创建凭证”弹窗,填写配置信息。 图1 创建凭证 表1 凭证参数配置 参数 配置说明 凭证名称 填写自定义凭证名称。 Cloud 选择所属云,仅支持选择“华为云”。 凭证类型 选择凭证类型。 IAM委托 AOM AK/SK 委托账号 凭证类型为“IAM委托”时可见,填写委托账号。 委托名称 凭证类型为“IAM委托”时可见,填写委托名称。如无委托,请先创建委托(委托方操作)。 AK 凭证类型为“AOM AK/SK”时可见,填写访问密钥ID(AK)。 SK 凭证类型为“AOM AK/SK”时可见,填写秘密访问密钥(SK)。 企业项目 选择企业项目。 描述 填写描述信息。 单击“校验凭证”,如校验不通过,请确认“IAM委托”和“AOM AK/SK”相关参数是否配置正确。 单击“确定”,完成创建凭证。
  • 跨账号执行OpenGauss任务 当前账号通过“OpenGauss容灾操作”插件执行其他账号下的OpenGauss任务时,需要提前创建委托和创建凭证,其步骤如下: 委托方账号创建委托并授权,授予被委托账号所需IAM和DDM的权限。 IAM所需最小权限策略如下: {"Version": "1.1","Statement": [{"Action": ["iam:projects:listProjects"],"Effect": "Allow"}]} OpenGauss所需最小权限策略如下: { "Version": "1.1", "Statement": [ { "Effect": "Allow", "Action": [ "rds:instance:list", "rds:instance:modify", "gaussdb:instance:list", "gaussdb:instance:modify", "gaussdb:disasterRecovery:failover" ] } ]} 被委托账号创建凭证,“委托账号”和“委托名”根据1配置。
  • 配置介绍 表1 配置说明 参数 配置说明 任务所在region 选择任务所在区域。 内网 域名 选择内网域名。 记录集类型 选择记录集类型。 A – 将域名指向IPv4地址 CNAME – 将域名指向另外一个域名 MX – 将域名指向邮件服务器地址 TXT – 设置文本记录 SRV – 记录提供特定服务的服务器 记录集的值 填写记录集的值。 主机记录 填写主机记录。 主机记录指域名前缀,如不填写,默认添加时使用内网域名。当“记录集类型”选择“CNAME”时,主机记录为必填项。 TTL(单位:秒) 填写TTL值。 TTL(Time-To-Live)指解析记录在本地DNS服务器中的缓存时间。如果您的服务地址经常更换,建议TTL值设置相对小些,反之,建议设置相对大些。 TTL应为300~2147483647之间的整数,如不填写,则默认300秒。 任务名称 请自定义输入任务名称。
  • 配置介绍 表1 选择输入-配置说明 参数 配置说明 任务所在region 选择任务所在区域。 凭证 选择凭证,默认显示当前命名空间多活分区下已配置的默认凭证。 说明: 凭证只支持选择IAM委托。 项目 选择项目,默认显示当前命名空间多活分区下已配置的默认项目。 容灾 选择任务。 另一区域凭证 选择凭证。 说明: 凭证只支持选择IAM委托。 容灾操作 选择主备切换或容灾升主。 任务名称 请自定义输入任务名称。 表2 手动输入-配置说明 参数 配置说明 任务所在region 配置任务所在区域。 项目ID 配置项目ID。 凭证ID (可选)配置委托凭证ID。 说明: 不填写凭证ID:默认使用当前凭证。 使用委托时:凭证ID/委托项目ID需要同时填写。 委托项目ID (可选)配置委托项目ID。 说明: 不填写凭证ID:默认使用当前凭证。 使用委托时:凭证ID/委托项目ID需要同时填写。 容灾ID 请输入容灾ID。 另一区域凭证ID 请输入凭证ID。 容灾操作 选填主备切换或容灾升主。 任务名称 请自定义输入任务名称。
  • MAS自定义策略样例 示例1:授权用户创建、修改和查看实例的权限。 { "Version": "1.1", "Statement": [ { "Effect": "Allow", "Action": [ "mas:instance:create", "mas:instance:modify", "mas:instance:list", "mas:instance:get" ] } ]}
  • 操作步骤 登录MAS控制台,在“多活管理”页面,单击右上角的“创建边缘版站点”。 在“创建站点”弹窗输入边缘版站点名称,单击“确定”。 在“初始化站点”页面单击站点规格模板,单击“确定”。 在“IEF配置”页面,进行IEF配置。 等待边缘节点创建成功。 单击“下载边缘节点配置文件”,下载包含以上边缘节点密钥等信息的配置文件。 将边缘节点连接上云。完成所有边缘节点的纳管,即可部署MAS实例。 不同可用区的华为云边缘节点要求纳管节点的时候纳管到华为云上不同的可用区。 单击“下载核心软件安装工具”,下载安装程序:a. edge-installer_1.0.14_x86_64.tar.gz 是指边缘核心软件安装程; b. nodeName.tar.gz 是指创建边缘节点时系统返回的配置文件。 解压installer。 sudo tar -zxvf edge-installer_1.0.14_x86_64.tar.gz -C /opt 解压证书到/opt/IEF/Cert。 sudo mkdir -p /opt/IEF/Cert; sudo tar -zxvf nodeName.tar.gz -C /opt/IEF/Cert 执行安装命令。 cd /opt/edge-installer; sudo ./installer -op=install
  • 概述 MongoDB监控器可对用户业务使用的MongoDB数据库进行探测,并且在数据库异常时自动触发流量切换。 表1 监控状态说明 监控状态 状态说明 绿色 监控正常。 红色 监控异常。从正常到异常,在允许自动切换的情况下,自动触发流量切换。 黄色 初始化监控失败。此状态表示Monitor启动时初次监控探测失败,确保配置信息无误的情况下,需要联系运维处理。 浅灰 监控未生成或监控配置错误。 深灰 调用异常。监控连接ETCD状态异常。
  • 创建MongoDB监控 登录MAS控制台,在“多活管理”页面单击实例(实例所属命名空间类型为同城多活),进入实例控制台。 在页面顶端导航栏选择“监控列表”,单击页面左上角的“新增监控”。 在新增监控页面配置监控基础配置,完成后单击“下一步:数据中心配置”。 图1 新增MongoDB监控-基础配置 表2 基础配置信息 参数 配置说明 监控 选择需要新增的监控类型,此处请选择“MongoDB监控”。 应用名称 选择应用列表中创建的应用。 监控器名称 自定义监控器名称。 异常通知设置 默认为“关”。 若设置为“开”: 当监控器或被监控的数据库异常时会及时给用户发送异常通知或告警通知。支持华为云消息通知服务,请先配置密钥。 默认将开启云监控,请前往云监控确认是否已创建MAS事件监控告警规则,如已创建请忽略。 通知主题 若异常通知设置选择“开”,则需要在通知主题列表选择主题,如无主题列表,单击新增,新增通知主题之后进行后续操作。 是否监控 默认“是”,选“否”则不会探测数据库异常情况。 是否自动切换 默认“是”,选“否”则不会自动切换数据库。 监控用户名 被监控的数据库的用户名。 监控用户密码 被监控的数据库的用户密码。 确认密码 再次填写监控用户密码。 填写数据中心配置,完成后单击“下一步:数据库配置”。 图2 新增MongoDB监控-数据中心 表3 数据中心配置信息 参数 配置说明 云选择 被监控的MongoDB数据库部署的环境。 局点 被监控数据库所在区域。 连接地址 MongoDB数据库的访问地址和端口。 填写数据库配置,完成后单击“下一步:高级配置”。 图3 新增MongoDB监控-数据库配置 表4 数据库配置信息 参数 配置说明 监控数据库 填写监控数据库名称。监控数据库用来探活连接的数据库实例,确认数据库实例连接是否正常。 请使用独立的监控数据库,不要与业务数据库共用,监控数据库只授权读取类权限,避免产生安全风险。 连接数据库 填写连接数据库名称。连接数据库是应用实际连接的数据库,可在连接池配置中选择使用不同的路由算法。 填写高级配置,完成后单击“下一步:确认配置”。 图4 新增MongoDB监控-高级配置 表5 高级配置信息 参数 配置说明 重试时间间隔 尝试重连时间间隔,以毫秒为单位,默认值3000ms。 输入值必须在1到300000之间,建议使用默认值。 监控超时时间 一个周期内监控器对数据库探测监控的超时时间,超过这个时间,则认为探测数据库失败,监控状态变为监控异常。 以毫秒为单位,默认值40000ms,输入值必须在1到600000之间,建议使用默认值。 说明: 如果您需要修改监控超时时间,监控超时时间建议大于故障时数据中心1的数据同步到数据中心2所需时间,否则切换数据中心后,数据中心2的数据可能存在不完整的情况。 数据库访问超时时间 访问数据库超时时间,超过这个时间认为一次访问数据库失效,以毫秒为单位,默认值3000ms。 输入值必须在3000到100000之间,建议使用默认值。 确认配置无误后单击“立即创建”,完成创建MongoDB监控。 MongoDB监控器创建完成后,数据中心的正常监控状态标识为绿色。如果是其他异常状态,可能是监控器信息配置错误或者是监控的数据库本身存在异常,请进行故障排除。
  • 连接池配置 登录MAS控制台,在“多活管理”页面单击实例,进入实例控制台。 在页面顶端导航栏选择“监控列表”,单击MongoDB监控所在行的“连接池配置”。 在连接池配置页面,填写配置信息,完成后单击“确定”。 图5 连接池配置信息 表6 连接池配置 参数 配置说明 数据库名 创建MongoDB监控配置的连接数据库名。 路由算法 选择路由算法,单边读写/单边写本地读。 AZs 被监控MongoDB部署的可用区。 数据源名称 自定义数据源名称。 数据库地址 MongoDB数据库的连接地址。 Schema 需要连接的Schema名称。
  • 操作步骤 进入购买MAS实例页面。 在购买多活管理中心页面,填写实例配置信息,系统会根据您选择的“商品类型”自动计算费用,然后单击“立即创建”。 图1 购买多活管理中心 表1 多活实例配置参数 参数 配置说明 命名空间 选择命名空间。 说明: 多活实例支持如下条件的命名空间: 同城多活:主备多活分区均为当前控制台所选区域。如需创建用于同城多活的多活实例,请选择满足此条件的命名空间。 异地容灾:备多活分区为当前控制台所选区域。如需创建用于执行工作流的多活实例,请选择满足此条件的命名空间。 分区设置 选择多活分区的可用区,可用区由命名空间配置决定。 仲裁节点 命名空间选择“同城多活”类型时可见,选择ETCD仲裁节点所属可用区,可用区选择请与业务部署架构保持一致。 计费模式 选择计费模式。 按需计费:按需计费是后付费模式,按多活实例的实际使用时长计费,可以随时开通/删除多活实例。 包年包月:包年包月是预付费模式,按订单的购买周期计费,价格比按需计费模式更优惠。 商品类型 多活实例类型,目前支持铂金版。 开启双向认证 命名空间选择“同城多活”类型时可见,ETCD双向认证,默认开启。 注意: 关闭双向认证有风险,请谨慎操作。 多活管理中心名称 填写多活管理中心名称,根据规划自定义。 描述 填写多活管理中心的描述信息。 企业项目 请选择企业项目。 网络 选择实例所关联的VPC和子网,VPC和子网须提前创建。 IPv4网段 该VPC网段为实例机器网段,请保证与您的VPC网段及其他对等连接网段不冲突。建议使用网段:10.0.0.0/24;172.16.0.0/24;192.168.0.0/24。 安全组 选择实例所关联的安全组,安全组须提前创建。 注意: 需要在安全组中开放被监控资源的端口。 etcd密码 命名空间选择“同城多活”类型时可见,创建etcd密码。 说明: ETCD是MAS多活管理中心的组件之一,用户通过SDK连接该组件实现对接MAS监控器。 确认密码 命名空间选择“同城多活”类型时可见,再次确认etcd密码,两次密码输入保持一致。 购买时长 “计费模式”选择“包年包月”时可见,选择购买多活管理中心的时长。 自动续费 “计费模式”选择“包年包月”时可见,勾选后开通自动续费。 如需续费,请在管理控制台续费管理页面进行续费操作。续费相关操作请参考续费管理。 若“计费模式”选择“按需计费”,当单击“立即创建”之后,会直接开始创建实例; 若“计费模式”选择“包年包月”,需要先支付订单费用,才会开始创建实例。 实例创建时间需要5-15分钟,请耐心等待。实例创建成功后,在控制台的“多活管理”页面可看到该实例的状态为“运行中”。 如果创建实例失败,可删除创建失败的实例,然后重新创建实例。如果重新创建仍然失败,请联系技术支持。
  • CTS 支持的MAS操作 表1 CTS支持的MAS操作 操作名称 资源类型 事件名称 创建命名空间 namespace createNamespace 编辑命名空间 namespace updateNameSpace 删除命名空间 namespace deleteNameSpace 添加数据源 dataSource createDataSource 编辑数据源 dataSource updateDataSource 删除数据源 dataSource deleteDataSource 创建同步链路 dataSync createDataSyncTask 删除同步链路 dataSync deleteDataSyncTask 创建实例 instance createInstance 部署实例 instance deployInstance 删除实例 instance deleteInstance 升级实例 instance internalUpgradeInstance 创建应用 application createApplication 更新应用 application updateApplication 删除应用 application deleteApplication 批量切换应用监控 application batchSwitchMonitor 创建监控器 monitor createMonitor 更新监控器 monitor updateMonitor 删除监控器 monitor deleteMonitor 设置监控全局配置 monitor setMonitorGlobalConfig 切换监控器 monitor switchMonitor 创建数据库连接池 monitor createDBConnectionPool 更新数据库连接池 monitor updateDBConnectionPool 重置机房监控 dcmonitor resetDcMonitor 添加通知配置 globalConf setNotify 添加密钥 secret setSecret
  • 概述 Redis监控器可对用户业务使用的Redis数据库进行探测,并且在数据库异常时自动触发流量切换。 表1 监控状态说明 监控状态 状态说明 绿色 监控正常。 红色 监控异常。从正常到异常,在允许自动切换的情况下,自动触发流量切换。 黄色 初始化监控失败。此状态表示MAS进程无法检测业务数据库,确保配置信息无误的情况下,需要联系运维处理。 浅灰 监控未生成或监控配置错误。 深灰 调用异常。监控连接ETCD状态异常。
  • 创建Redis监控 登录MAS控制台,在“多活管理”页面单击实例(实例所属命名空间类型为同城多活),进入实例控制台。 在页面顶端导航栏选择“监控列表”,单击页面左上角的“新增监控”。 在新增监控页面配置监控基础配置,完成后单击“下一步:数据中心配置”。 图1 新增Redis监控-基础配置 表2 基础配置信息 参数 配置说明 监控 选择需要新增的监控类型,此处请选择“Redis监控”。 应用名称 选择应用列表中创建的应用。 监控器名称 自定义监控器名称。 异常通知设置 默认为“关”。 若设置为“开”: 当监控器或被监控的数据库异常时会及时给用户发送异常通知或告警通知。支持华为云消息通知服务,请先配置密钥。 通知主题 若异常通知设置选择“开”,则需要在通知主题列表选择主题,如无主题列表,单击新增,新增通知主题之后进行后续操作。 是否监控 默认“是”,选“否”则不会探测数据库异常情况。 是否自动切换 默认“是”,选“否”则不会自动切换数据库。 路由算法 根据实际需求选择路由算法,单边读写/本地读异步双写/单边读异步双写。 模式 默认“正常”模式,还可选择“哨兵”或“集群”模式。具体根据Redis数据库的部署方式选择。 正常:包括单机、主备、读写分离、Proxy集群等模式,使用Redis PING命令进行探测。 哨兵:使用Redis PING命令进行探测。 集群:Cluster集群模式,使用Redis集群协议进行探测,当所有slot均正常时探测结果为成功,否则为失败。 填写数据中心配置,完成后单击“下一步:高级配置”。 图2 新增Redis监控-数据中心配置 表3 数据中心配置信息 参数 配置说明 云选择 被监控Redis集群所属云。可选择第三方云厂商,实现跨云监控。 局点 被监控Redis集群所属区域。 azs 被监控Redis集群所部署的可用区,选填项。 连接地址 被监控Redis的连接地址和端口。 连接密码 被监控Redis的连接密码。 确认密码 请再次输入密码。 填写高级配置,完成后单击“下一步:确认配置”。 图3 新增Redis监控-高级配置 表4 高级配置信息 参数 配置说明 重试时间间隔 尝试重连时间间隔,以毫秒为单位,默认值3000ms。 输入值必须在1到300000之间,建议使用默认值。 监控超时时间 一个周期内监控器对数据库探测监控的超时时间,超过这个时间,则认为探测数据库失败,监控状态变为监控异常。 以毫秒为单位,默认值40000ms,输入值必须在1到600000之间,建议使用默认值。 说明: 如果您需要修改监控超时时间,监控超时时间建议大于故障时数据中心1的数据同步到数据中心2所需时间,否则切换数据中心后,数据中心2的数据可能存在不完整的情况。 确认配置无误后单击“立即创建”,完成创建Redis监控。 Redis监控器创建完成后,数据中心的正常监控状态标识为绿色。如果是其他异常状态,可能是监控器信息配置错误或者是监控的数据库本身存在异常,请进行故障排除。
共99315条