数据治理中心 DATAARTS STUDIO-嵌入数据水印:创建数据水印嵌入任务

时间:2024-07-11 10:40:07

创建数据水印嵌入任务

  1. DataArts Studio 控制台首页,选择实例,单击“进入控制台”,选择对应工作空间的“数据安全”模块,进入数据安全页面。

    图2 选择数据安全

  2. 单击左侧导航树中的数据水印嵌入,进入数据水印嵌入页面,在页面上方单击“新建”

    图3 创建数据水印嵌入任务

  3. 在弹出的创建任务页面输入基本信息,参数配置请参考表1

    表1 基本信息参数配置

    参数名

    参数描述

    *任务名称

    嵌入水印任务的名称,只能包含英文字母、数字、中文字符、下划线或中划线,且长度为1~64个字符。

    为便于水印嵌入任务管理,建议名称中标明要嵌入水印的对象和水印标识。

    描述

    为更好地识别嵌入水印任务,此处加以描述信息。

    *水印标识

    系统会将水印标识嵌入到数据表中,标识长度不超过16个字符即可。

    *纠错等级

    等级越高,水印信息编码位数越长,溯源时误码率越低。需注意高纠错等级需要更大的数据量来保证信息的嵌入完整性。默认为1。

    *水印版本

    V1版本:嵌入水印时依赖主键列,嵌入速度快。若主键遭受强攻击,溯源一定概率失败。

    V2版本:嵌入水印时不依赖主键,只与嵌入列相关,嵌入速度慢,鲁棒性增强。

    图4 基本信息配置

  4. 单击“下一步”进行源、目标端配置,参数配置请参考表2

    表2 源、目标端参数配置

    参数名

    参数描述

    源端配置

    *数据源类型

    目前只支持 MapReduce服务 MRS Hive)。

    *数据连接

    选择已创建的数据连接。若未创建请参考新建数据连接新建连接。

    *数据库

    选择待嵌入水印的数据库和数据表。

    • 单击数据库后的“设置”,设置待嵌入水印的数据库和数据表。
    • 单击“清除”,可对已选择的数据库和数据表进行修改。

    *源表名

    *水印嵌入列

    下拉选择常见的字段类型作为嵌入列。如数值型、字符型。

    注意:当选择水印版本为V1时,不支持选取主键列作为嵌入列。

    *数据集范围

    只有使用时间字段timestamp、Date来确定增量范围时,才可以选择增量模式

    一般而言,全量模式下数据水印嵌入任务使用单次调度,增量模式下使用周期调度。

    *指定时间字段

    增量模式下,选择时间字段timestamp、Date来确定增量范围。

    目标端配置

    *数据源类型

    目前只支持MapReduce服务(MRS Hive)。

    *数据连接

    选择已创建的数据连接。若未创建请参考新建数据连接新建连接。

    *数据库

    下拉选择存放水印表的数据库。

    *目标表名

    用户手动输入,不能与目标端数据库表名重复。当输入的表名不存在时会创建该表。

    输入请单击“测试”,否则将无法进行下一步操作。

    图5 源、目标端配置

  5. 单击“下一步”,进行调度信息配置。

    • 数据集范围为全量模式时,仅支持单次调度。
    • 数据集范围为增量模式时,支持单次调度和周期调度。

    当选择为周期调度时,参数配置参考表3

    表3 配置周期调度参数

    参数名

    说明

    *调度日期

    调度任务的生效时间段。

    *调度周期

    选择调度任务的执行周期,并配置相关参数。

    • 分:选择调度开始时间和结束时间,配置间隔的分钟时长。
    • 小时:选择调度开始时间和结束时间,配置间隔的小时时长。
    • 天:配置每日调度时间。
    • 周:选择星期几启动调度,配置调度具体时间。
    • 月:选择几号启动调度,配置调度具体时间。

    例如:选择调度周期是周,选择具体时间为15:52,时间选择为星期二。则在调度日期范围内,每周二的15点52分会执行任务。

    立即启动

    勾选复选框,则表示立即启动此调度任务。

    图6 调度信息配置

  6. 单击“确定”,完成数据水印嵌入任务创建。
support.huaweicloud.com/usermanual-dataartsstudio/dataartsstudio_01_1021.html