-
新建脚本 - 数据治理中心 DataArts Studio
建目录”。 在弹出的“新建目录”页面,配置如表1所示的参数。 表1 脚本目录参数 参数 说明 目录名称 脚本目录的名称,只能包含英文字母、数字、中文字符、“_”、“-”,且长度为1~64个字符。 选择目录 选择该脚本目录的父级目录,父级目录默认为根目录。 单击“确定”,新建目录。
-
开发实时处理单任务DLI Spark作业 - 数据治理中心 DataArts Studio
Spark作业。 配置DLI Spark作业 表1 配置属性参数 参数 是否必选 说明 作业名称 是 输入DLI Spark作业名称。 作业名称只能包含英文字母、数字、下划线和中划线,且长度为1~64个字符。 DLI队列 是 选择DLI队列。 Spark版本 否 2.3.2 2.4.5 3.1.1
-
管理资源 - 数据治理中心 DataArts Studio
在资源目录中,单击,弹出“新建目录”页面,配置如表1所示的参数。 表1 资源目录参数 参数 说明 目录名称 资源目录的名称,只能包含英文字母、数字、中文字符、“_”、“-”,且长度为1~32个字符。 选择目录 选择该资源目录的父级目录,父级目录默认为根目录。 单击“确定”,新建目录。
-
新建作业 - 数据治理中心 DataArts Studio
建目录”。 在弹出的“新建目录”页面,配置如表1所示的参数。 表1 作业目录参数 参数 说明 目录名称 作业目录的名称,只能包含英文字母、数字、中文字符、“_”、“-”,且长度为1~64个字符。 选择目录 选择该作业目录的父级目录,父级目录默认为根目录。 单击“确定”,新建目录。
-
配置DIS数据连接 - 数据治理中心 DataArts Studio
数据连接的名称,只能包含字母、数字、下划线和中划线,且长度不超过100个字符。 标签 否 标识数据连接的属性。设置标签后,便于统一管理。 说明: 标签的名称,只能包含中文、英文字母、数字和下划线,不能以下划线开头,且长度不能超过100个字符。 适用组件 是 选择此连接适用的组件。勾选组件后,才能在相应组件内使用本连接。
-
步骤5:数据架构 - 数据治理中心 DataArts Studio
在码表管理页面,在码表目录树中选择一个目录,然后在右侧单击“新建”按钮。 图13 码表管理 在新建码表页面中,请参考表2配置参数,然后单击“保存”。 图14 新建码表 参考步骤3.a~3.b,在供应商目录下创建供应商码表,在费率目录下创建费率码表。 图15 供应商码表 图16 费率码表 分别为付款方式、供应商、费率3个码表填写数值。
-
新建MRS Hive连接 - 数据治理中心 DataArts Studio
在管理中心页面,单击“数据连接”,进入数据连接页面并单击“创建数据连接”。 图1 创建数据连接 单击“创建数据连接”,在弹出的页面中,选择“数据连接类型”为“MapReduce服务(MRS Hive)”,并参见表1配置相关参数。 图2 MRS Hive连接配置参数 表1 MRS Hive数据连接
-
配置环境变量 - 数据治理中心 DataArts Studio
出导入后需要重新进行配置。 常量是指在不同的空间下都是一样的,导入的时候,不需要重新配置值。 图2 环境变量配置 表1 环境变量参数配置 参数 是否必选 说明 参数名称 是 只支持英文字母、数字、“-”、“_”,最大长度为64字符,且参数名称不允许重名。 参数名称需根据脚本变量定
-
管理动态脱敏策略 - 数据治理中心 DataArts Studio
对含有中文字符的数据进行脱敏则可能会出现乱码。 创建动态脱敏策略 在DataArts Studio控制台首页,选择实例,单击“进入控制台”,选择对应工作空间的“数据安全”模块,进入数据安全页面。 图1 选择数据安全 单击左侧导航树中的“动态脱敏”,进入动态脱敏页面。 图2 进入动态脱敏页面
-
查询连接详情(待下线) - 数据治理中心 DataArts Studio
响应参数 表3 Connection参数说明 参数名 是否必选 参数类型 说明 name 是 String 连接名称,只能包含四种字符:英文字母、数字、中划线和下划线,且长度小于等于100个字符。连接名称不能重复。 type 是 String 连接类型,包含: DWS DLI SparkSQL
-
Import GES - 数据治理中心 DataArts Studio
GES节点分别导入,以确保导入图数据时,元数据与每对点表和边表能够一一对应。 图1 新建元数据 边数据集 否 可以直接选择对应的OBS桶中的边数据集csv文件,也支持选择对应的边数据集的OBS路径。 点数据集和边数据集应符合GES图数据格式要求。图数据格式要求简要介绍如下,详情可参见一般图数据格式。
-
修改连接(待下线) - 数据治理中心 DataArts Studio
消息头。 表3 Connection参数说明 参数名 是否必选 参数类型 说明 name 是 String 连接名称,只能包含五种字符:英文字母、数字、中划线和下划线,且长度小于等于100个字符。连接名称不能重复。 type 是 String 连接类型,包含: DWS DLI SparkSQL
-
MRS Spark - 数据治理中心 DataArts Studio
队列为最高优先级。 Spark作业名称 是 MRS作业名称,只能由英文字母、数字、中划线和下划线组成,长度不能超过64个字符。 系统支持作业名称按照作业名称_节点名称格式自动填入。 说明: 作业名称不得包含中文字符、超出长度限制等。如果作业名称不符合规则,将导致提交MRS作业失败。
-
MRS Flink Job - 数据治理中心 DataArts Studio
0-LTS.1及以上版本。 Flink作业名称 是 MRS作业名称,只能由英文字母、数字、中划线和下划线组成,长度不能超过64个字符。 系统支持作业名称按照作业名称_节点名称格式自动填入。 说明: 作业名称不得包含中文字符、超出长度限制等。如果作业名称不符合规则,将导致提交MRS作业失败。
-
字段转换器配置指导 - 数据治理中心 DataArts Studio
后还会进行运算,将'-'识别为减号,导致结果为1991,须使用'${dateformat(yyyy-MM-dd)}',即'2017-10-16'。 图2 使用''包围表达式 方式二:源字段中新增自定义字段,在样值中填写时间宏变量,重新进行字段映射处理。 图3 源字段新增自定义字段
-
配置资源权限 - 数据治理中心 DataArts Studio
ger服务端口是否正确。 图2 资源权限配置页面 单击待创建权限策略HDFS组件下“hacluster”的“配置” ,进入配置界面单击“创建”,新建权限策略。 图3 新建权限策略 在弹出的策略配置页配置相关参数,配置完成单击“确定”,策略配置完成。 图4 配置权限策略 表2 配置HDFS权限策略参数说明
-
开发实时处理单任务Flink SQL作业 - 数据治理中心 DataArts Studio
输入Flink作业名称。 系统支持Flink作业名称按照工作空间-作业名称格式自动填入。 说明: 只能包含英文字母、数字、中划线和下划线。最大只能输入64个字符,不能包含中文字符。 MRS集群名 选择MRS集群名称。 说明: 单任务Flink SQL目前支持的MRS集群版本是MRS
-
查询资源详情 - 数据治理中心 DataArts Studio
头。 响应参数 表3 Resource参数说明 参数名 是否必选 参数类型 说明 name 是 String 资源名称,只能包含英文字母、数字、中文字符、下划线或中划线,且长度为1-32个字符。 type 是 String 资源类型,包含: archive file jar location
-
发现敏感数据 - 数据治理中心 DataArts Studio
敏感数据识别过程中,当某个字段同时匹配到识别规则组中的多个识别规则时,此字段密级取多个识别规则的最高密级,字段分类允许有多个。 敏感数据识别任务运行后,会为识别到的敏感字段生成相应密级和分类,默认不会生成数据表密级。在手动勾选任务中的“根据数据识别结果更新数据目录/数据地图中数据表密级”选项后,才
-
查询连接列表(待下线) - 数据治理中心 DataArts Studio
连接列表 表3 connections参数说明 参数名 是否必选 参数类型 说明 name 是 String 连接名称,只能包含四种字符:英文字母、数字、中划线和下划线,且长度小于等于100个字符。连接名称不能重复。 type 是 String 连接类型,包含: DWS DLI SparkSQL