搜索_华为云

ETL Job - 数据治理中心 DataArts Studio

挂起当前作业执行计划：当前作业实例的状态为运行异常，该节点的后续节点以及依赖于当前作业的后续作业实例都会处于等待运行状态。是否空跑否如果勾选了空跑，该节点不会实际执行，将直接返回成功。任务组否选择任务组。任务组配置好后，可以更细粒度的进行当前任务组中的作业节点的并发数控制，比如作业中包含多个节点、补数据、重跑等场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
新建离线处理集成作业 - 数据治理中心 DataArts Studio

新建集成作业（方式二）在弹出的“新建集成作业”页面，配置如表1所示的参数。图3 配置集成作业参数表1 作业参数参数说明作业名称自定义作业的名称，只能包含英文字母、数字、中文、“-”、“_”、“.”，且长度为1～128个字符。作业类型选择作业的类型，须选择离线处理。离

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
复制作业 - 数据治理中心 DataArts Studio

Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。在数据开发主界面的左侧导航栏，选择“数据开发 > 作业开发”。在作业目录中选择需要复制的作业，右键单击作业名称，选择“拷贝另存为”。图1 复制作业在弹出的“另存为”页面，配置如表1所示的参数。表1 作业目录参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
创建资源 - 数据治理中心 DataArts Studio

如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。表3 Resource参数说明参数名是否必选参数类型说明 name 是 String 资源名称，只能包含英文字母、数字、中文字符、下划线或中划线，且长度为1-32个字符。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 资源管理API
查询资源列表 - 数据治理中心 DataArts Studio

工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。响应参数表3 参数说明参数名是否必选参数类型说明 total 是 Integer 总的资源个数。 resources 是 List<Resource>

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 资源管理API
新建维度 - 数据治理中心 DataArts Studio

REPLICATION：在每一个DN节点上存储一份全量表数据。这种存储方式的优点是每个DN上都有此表的全量数据，在join操作中可以避免数据重分布操作，从而减小网络开销；缺点是每个DN都保留了表的完整数据，造成数据的冗余。一般情况下只有较小的维度表才会定义为Replication表。 HASH：采

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
复制脚本 - 数据治理中心 DataArts Studio

Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。在数据开发主界面的左侧导航栏，选择“数据开发 > 脚本开发”。在脚本目录中选择需要复制的脚本，右键单击脚本名称，选择“拷贝另存为”。图1 复制脚本在弹出的“另存为”页面，配置如表1所示的参数。表1 脚本目录参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > （可选）管理脚本
配置默认项 - 数据治理中心 DataArts Studio

系统默认脚本变量格式为${}。 ${}格式：识别脚本中${}格式的定义，解析其中的字段为变量名，如${xxx}，识别为变量名：xxx。 ${dlf.}格式：识别脚本中${dlf.}格式的定义，解析其中的dlf.字段为变量名，其他${}格式定义不再识别为变量，如${dlf.xxx}，识别为变量名：dlf.xxx。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
修改资源 - 数据治理中心 DataArts Studio

资源ID，获取方法请参见查询资源列表。返回的id即为resource_id。请求参数表2 请求Header参数参数名是否必选参数类型说明 workspace 否 String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 资源管理API
复制名称和重命名作业 - 数据治理中心 DataArts Studio

Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。在数据开发主界面的左侧导航栏，选择“数据开发 > 作业开发”。在作业目录中选择需要重命名的作业，右键单击作业名称，选择“重命名”。图2 重命名作业在弹出的“重命名作业名称”页面，配置新作业名。图3

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
配置角色 - 数据治理中心 DataArts Studio

以在展开的导航树中，单击对应数据操作列中的“授权”，进行单一授权。数据视图授权时，系统也提供了“快速模式”和“显示无权限的资源”功能。开启快速模式的情况下，库表列的元数据会从数据目录获取，否则会从数据源获取元数据。已完成元数据采集的场景下推荐开启快速模式。值得注意的是，库、表

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > 数据权限访问控制
获取申请详情 - 数据治理中心 DataArts Studio

USIVE专享版。 Content-Type 是 String 消息体的类型（格式），有Body体的情况下必选，没有Body体无需填写。如果请求消息体中含有中文字符，则需要通过charset=utf8指定中文字符集，例如取值为：application/json;charset=utf8。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > 申请管理接口
DataArts Studio使用流程 - 数据治理中心 DataArts Studio

结合DataArts Studio服务的能力进行业务流程设计。需求分析。分析业务情况，明确业务诉求，并提炼出数据治理流程的实现框架，支撑具体数据治理实施流程的设计。业务调研。明确DataArts Studio服务的能力边界，并分析后续的业务负载情况。流程设计。以实际业务情况结合DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南
MRS Hive SQL - 数据治理中心 DataArts Studio

默认选择SQL脚本中设置的数据连接，支持修改。数据库是默认选择SQL脚本中设置的数据库，支持修改。 MRS资源队列否选择已创建好的MRS资源队列。说明：需要先在数据安全服务队列权限功能中，配置对应的队列后，才能在此处选择到已配置的队列。当有多处同时配置了资源队列时，此处配置的资源队列为最高优先级。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

过滤类型为通配符或正则表达式时支持此参数。用于过滤输入路径下的文件。通配符使用*csv 正则表达式使用.*\.csv 时间过滤用于过滤满足时间范围的文件。文件的修改时间晚于输入的起始时间或早于输入的终止时间才会被传输。同时输入起始时间和终止时间，文件的修改时间在这个区间内才会被传输。否起始时间

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
管理动态脱敏策略 - 数据治理中心 DataArts Studio

无需选择，自动匹配数据连接中的数据源集群。 *数据库选择敏感数据所在的数据库。 *schema 选择敏感数据所在的schema。 *数据表选择敏感数据所在的数据表。 *数据列您需要勾选一个或多个待脱敏列，并根据不同数据列的数据类型，选择合适的脱敏规则。各类数据源中不同数据类型支持的脱敏规则不同，详见参考：动态脱敏规则介绍。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 动态脱敏任务
API授权操作(授权/取消授权/申请/续约) - 数据治理中心 DataArts Studio

USIVE专享版。 Content-Type 是 String 消息体的类型（格式），有Body体的情况下必选，没有Body体无需填写。如果请求消息体中含有中文字符，则需要通过charset=utf8指定中文字符集，例如取值为：application/json;charset=utf8。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > API管理接口
MRS Spark - 数据治理中心 DataArts Studio

挂起当前作业执行计划：当前作业实例的状态为运行异常，该节点的后续节点以及依赖于当前作业的后续作业实例都会处于等待运行状态。是否空跑否如果勾选了空跑，该节点不会实际执行，将直接返回成功。任务组否选择任务组。任务组配置好后，可以更细粒度的进行当前任务组中的作业节点的并发数控制，比如作业中包含多个节点、补数据、重跑等场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
MRS Spark SQL - 数据治理中心 DataArts Studio

挂起当前作业执行计划：当前作业实例的状态为运行异常，该节点的后续节点以及依赖于当前作业的后续作业实例都会处于等待运行状态。是否空跑否如果勾选了空跑，该节点不会实际执行，将直接返回成功。任务组否选择任务组。任务组配置好后，可以更细粒度的进行当前任务组中的作业节点的并发数控制，比如作业中包含多个节点、补数据、重跑等场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
新建实时集成作业 - 数据治理中心 DataArts Studio

作业名称自定义作业的名称，只能包含英文字母、数字、中文、“-”、“_”、“.”，且长度为1～128个字符。作业类型选择作业的类型，须选择实时处理。离线处理：对已收集的大量数据进行批量处理和分析，这些任务通常是在计算资源和存储资源方面经过优化，以确保高效的数据处理和分析。这些

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）

总条数： 489

上一页
1
...
5
6
7
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ETL Job - 数据治理中心 DataArts Studio

新建离线处理集成作业 - 数据治理中心 DataArts Studio

复制作业 - 数据治理中心 DataArts Studio

创建资源 - 数据治理中心 DataArts Studio

查询资源列表 - 数据治理中心 DataArts Studio

新建维度 - 数据治理中心 DataArts Studio

复制脚本 - 数据治理中心 DataArts Studio

配置默认项 - 数据治理中心 DataArts Studio

修改资源 - 数据治理中心 DataArts Studio

复制名称和重命名作业 - 数据治理中心 DataArts Studio

配置角色 - 数据治理中心 DataArts Studio

获取申请详情 - 数据治理中心 DataArts Studio

DataArts Studio使用流程 - 数据治理中心 DataArts Studio

MRS Hive SQL - 数据治理中心 DataArts Studio

配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

管理动态脱敏策略 - 数据治理中心 DataArts Studio

API授权操作(授权/取消授权/申请/续约) - 数据治理中心 DataArts Studio

MRS Spark - 数据治理中心 DataArts Studio

MRS Spark SQL - 数据治理中心 DataArts Studio

新建实时集成作业 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线