数据治理中心 DATAARTS STUDIO-嵌入数据水印:创建数据水印嵌入任务
创建数据水印嵌入任务
- 在 DataArts Studio 控制台首页,选择实例,点击“进入控制台”,选择对应工作空间的“数据安全”模块,进入数据安全页面。
图2 选择数据安全
- 单击左侧导航树中的“新建”。
,进入数据水印嵌入页面,在页面上方单击图3 创建数据水印嵌入任务
- 在弹出的创建任务页面输入基本信息,参数配置请参考表1。
表1 基本信息参数配置 参数名
参数描述
*任务名称
嵌入水印任务的名称,只能包含英文字母、数字、中文字符、下划线或中划线,且长度为1~64个字符。
为便于水印嵌入任务管理,建议名称中标明要嵌入水印的对象和水印标识。
描述
为更好地识别嵌入水印任务,此处加以描述信息。
*水印标识
系统会将水印标识嵌入到数据表中,标识长度不超过16个字符即可。
*纠错等级
等级越高,水印信息编码位数越长,溯源时误码率越低。需注意高纠错等级需要更大的数据量来保证信息的嵌入完整性。默认为1。
*水印版本
V1版本:嵌入水印时依赖主键列,嵌入速度快。若主键遭受强攻击,溯源一定概率失败。
V2版本:嵌入水印时不依赖主键,只与嵌入列相关,嵌入速度慢,鲁棒性增强。
图4 基本信息配置
- 单击“下一步”进行源、目标端配置,参数配置请参考表2。
表2 源、目标端参数配置 参数名
参数描述
源端配置
*数据源类型
目前只支持 MapReduce服务 ( MRS Hive)。
*数据连接
选择已创建的数据连接。若未创建请参考新建数据连接新建连接。
*数据库
选择待嵌入水印的数据库和数据表。
- 单击数据库后的“设置”,设置待嵌入水印的数据库和数据表。
- 单击“清除”,可对已选择的数据库和和数据表进行修改。
*源表名
*水印嵌入列
下拉选择常见的字段类型作为嵌入列。如数值型、字符型。
注意:当选择水印版本为V1时,不支持选取主键列作为嵌入列。
*数据集范围
只有使用时间字段timestamp、Date 来确定增量范围时,才可以选择增量模式
一般而言,全量模式下数据水印嵌入任务使用单次调度,增量模式下使用周期调度。
*指定时间字段
增量模式下,选择时间字段timestamp、Date来确定增量范围。
目标端配置
*数据源类型
目前只支持MapReduce服务(MRS Hive)。
*数据连接
选择已创建的数据连接。若未创建请参考新建数据连接新建连接。
*数据库
下拉选择存放水印表的数据库。
*目标表名
用户手动输入,不能与目标端数据库表名重复。当输入的表名不存在时会创建该表。
输入请单击“测试”,否则将无法进行下一步操作。
图5 源、目标端配置
- 单击“下一步”,进行调度信息配置。
- 数据集范围为全量模式时,仅支持单次调度。
- 数据集范围为增量模式时,支持单次调度和周期调度。
当选择为周期调度时,参数配置参考表3。
表3 配置周期调度参数 参数名
说明
*调度日期
调度任务的生效时间段。
*调度周期
选择调度任务的执行周期,并配置相关参数。
- 分:选择调度开始时间和结束时间,配置间隔的分钟时长。
- 小时:选择调度开始时间和结束时间,配置间隔的小时时长。
- 天:配置每日调度时间。
- 周:选择星期几启动调度,配置调度具体时间。
- 月:选择几号启动调度,配置调度具体时间。
例如:选择调度周期是周,选择具体时间为15:52,时间选择为星期二。则在调度日期范围内,每周二的15点52分会执行任务。
立即启动
勾选复选框,则表示立即启动此调度任务。
图6 调度信息配置
- 单击“确定”,完成数据水印嵌入任务创建。