-
配置数据血缘 - 数据治理中心 DataArts Studio
单击作业画布中的MRS Spark节点,并切换到“血缘关系”页签。 图2 进入血缘关系页签 在MRS Spark节点的“血缘关系”页签,手动配置血缘的输入表。假如MRS Spark作业中的输入表为“hive”,则血缘输入配置如图3所示。 图3 配置血缘输入 完成血缘的输入表配置后,单击确定,继续配置血缘的输出表。假如MRS
-
表关联作业算子列表(邀测) - 数据治理中心 DataArts Studio
Unauthorized。 403 Forbidden。 404 Not Found。 500 InternalServerError。 父主题: 数据地图接口
-
数据血缘方案概述 - 数据治理中心 DataArts Studio
了新的数据,不同程度的描述信息形成了数据的层次。 DataArts Studio生成的血缘关系图如图1所示,为数据表对象,为作业节点对象,通过对象和箭头的编排表示血缘信息。从血缘关系图中可以看到,wk_02表数据是由wk_01表数据经过hive_1作业节点加工而生成的,wk_02
-
配置Elasticsearch/云搜索服务源端参数 - 数据治理中心 DataArts Studio
配置Elasticsearch/云搜索服务源端参数 作业中源连接为配置Elasticsearch连接或配置云搜索服务(CSS)连接时,源端作业参数如表1所示。 表1 Elasticsearch/云搜索服务作为源端时的作业参数 参数类型 参数名 说明 取值样例 基本参数 索引 El
-
新建对账作业 - 数据治理中心 DataArts Studio
完成同步后,若有同步失败的主题,系统会自动弹出同步结果明细,可查看同步失败的主题名称。 图3 同步主题为目录 在“对账作业”页面,单击“新建”,在弹出的对话框中,参见表1配置相关参数。 表1 配置作业参数 参数名 说明 作业名称 对账作业的名称。 描述 为更好的识别数据对账作业 ,此处加以描述信息。描述信息长度不能超过1024个字符。
-
管理集群标签 - 数据治理中心 DataArts Studio
理”,进入集群管理界面。 图1 集群列表 “创建来源”列仅通过DataArts Studio服务进入数据集成界面可以看到。 单击集群名称后,选择“标签”页签。 图2 修改集群配置 单击“添加/编辑标签”,通过添加、修改标签为CDM集群设置资源标识。 图3 添加标签 一个集群最多可添加10个标签。
-
创建并管理工作空间 - 数据治理中心 DataArts Studio
标签策略详情。 当拥有多个工作空间时,您可以按使用者、维护者或用途等各类维度为各工作空间添加标签,然后在工作空间列表页面,可以通过标签搜索、识别不同类型的工作空间。 标签由标签键和标签值组成。在添加标签时,标签键和标签值可以选择在标签管理服务(简称TMS)中创建的预定义标签,也可
-
Elasticsearch/云搜索服务(CSS)连接 - 数据治理中心 DataArts Studio
Elasticsearch/云搜索服务(CSS)连接 介绍 通过Elasticsearch连接,可以对Elasticsearch服务器或云搜索服务抽取、加载数据。 连接样例 { "links": [ { "link-config-values": {
-
源端为Elasticsearch/云搜索服务 - 数据治理中心 DataArts Studio
源端为Elasticsearch/云搜索服务 JSON样例 "from-config-values": { "configs": [ { "inputs": [
-
查看数据血缘 - 数据治理中心 DataArts Studio
点的血缘信息。 单击血缘图中节点左右两端“+”、“-”图标,可以进一步展开查看血缘的上下链路。 单击血缘图中的某一个节点,可以查看该节点的详情。 进入“作业”页签,单击“编辑”可跳转到数据开发的作业编辑页面。 图5 查看节点血缘 在数据资产搜索结果中,图标为表格的数据资产为表,单
-
支持的数据类型 - 数据治理中心 DataArts Studio
与text类型作用相同,为长度可变的非Unicode数据。 不支持(String) 不支持(String) 不支持 image 长度可变的二进制数据,用于存储照片、目录图片或者图画。 不支持(String) 不支持(String) 不支持 binary 长度为n个字节的固定长度二进制数据,其中n是从1~8000的值。
-
字段转换器配置指导 - 数据治理中心 DataArts Studio
后还会进行运算,将'-'识别为减号,导致结果为1991,须使用'${dateformat(yyyy-MM-dd)}',即'2017-10-16'。 图2 使用''包围表达式 方式二:源字段中新增自定义字段,在样值中填写时间宏变量,重新进行字段映射处理。 图3 源字段新增自定义字段
-
CSS - 数据治理中心 DataArts Studio
CSS 功能 通过CSS节点执行云搜索请求,实现在线分布式搜索功能。 参数 用户可参考表1和表2配置CSS节点的参数。 表1 属性参数 参数 是否必选 说明 节点名称 是 节点名称,可以包含中文、英文字母、数字、“_”、“-”、“/”、“<”、“>”等各类特殊字符,长度为1~128个字符。
-
字段转换器配置指导 - 数据治理中心 DataArts Studio
后还会进行运算,将'-'识别为减号,导致结果为1991,须使用'${dateformat(yyyy-MM-dd)}',即'2017-10-16'。 图2 使用''包围表达式 方式二:源字段中新增自定义字段,在样值中填写时间宏变量,重新进行字段映射处理。 图3 源字段新增自定义字段
-
配置Elasticsearch/云搜索服务(CSS)目的端参数 - 数据治理中心 DataArts Studio
配置Elasticsearch/云搜索服务(CSS)目的端参数 作业中目的连接为配置Elasticsearch连接或配置云搜索服务(CSS)连接时,即将数据导入到Elasticsearch/云搜索服务(CSS)时,目的端作业参数如表1所示。 表/文件迁移和整库迁移时需配置的参数不
-
脱敏策略 - 数据治理中心 DataArts Studio
Studio控制台首页,选择实例,单击“进入控制台”,选择对应工作空间的“数据目录”模块,进入数据目录页面。 选择“数据地图 > 数据目录”。 在资产搜索结果列表,搜索脱敏后的数据表,进入数据表详情页面。 单击“数据预览”,查看数据脱敏后的效果。 父主题: 数据安全(待下线)
-
目的端为Elasticsearch/云搜索服务 - 数据治理中心 DataArts Studio
目的端为Elasticsearch/云搜索服务 JSON样例 "to-config-values": { "configs": [ { "inputs": [
-
数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio
支持钻取、溯源等。通过数据地图,实现数据目录的数据血缘和数据全景可视,提供数据智能搜索和运营监控。 已发布区域:全部 数据目录 数据地图 数据地图围绕数据搜索,服务于数据分析、数据开发、数据挖掘、数据运营等数据表的使用者和拥有者,提供方便快捷的数据搜索服务,拥有功能强大的血缘信息及影响分析。
-
步骤6:数据开发 - 数据治理中心 DataArts Studio
右键单击作业目录,在弹出菜单中单击“新建作业”。 图5 作业 在弹出弹框中输入“作业名称”如demo_taxi_trip_data,“作业类型”选择“批处理”,其他参数保留默认值,单击“确定”完成批作业创建。 图6 新建批处理作业 如下图所示,编排批作业。 图7 编排作业 每个节点配置如下: source_sdi节点:为CDM
-
作业配置了周期调度,但是实例监控没有作业运行调度记录? - 数据治理中心 DataArts Studio
作业监控”界面确认作业的调度状态是否是调度中,只有调度中的作业到了调度周期后才会调度。 图1 查看作业调度状态 如果作业有依赖于其他作业,在“运维调度 > 实例监控”界面,查看依赖作业的运行状态。如果作业有自依赖,扩大搜索时间窗口,查看是否当前作业历史实例失败,导致作业在等待运行,而没有生成新作业实例。