搜索_华为云

源端为Kafka - 数据治理中心 DataArts Studio

topic列表，可以为多个topic，以“,”作为分隔符。 fromJobConfig.kafkaConsumerStrategy 是枚举从Kafka拉取数据时的初始偏移量设置： LATEST：最大偏移量，即最新的数据。 EARLIEST：最小偏移量，即最老的数据。 fromJobConfig.isPermanency

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
停止作业 - 数据治理中心 DataArts Studio

作业名称。请求参数表2 请求Header参数参数名是否必选参数类型说明 workspace 否 String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。说明：多个DataArts Studio实例需要指定工作空间。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
目的端为Hive - 数据治理中心 DataArts Studio

id&gid&name”。 toJobConfig.shouldClearTable 否 Boolean 导入前是否清空目标表的数据，如果设置为true，任务启动前会清除目标表中数据。父主题：目的端作业参数说明

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
配置数据血缘 - 数据治理中心 DataArts Studio

TOM即自定义类型，在手动配置血缘时，对于不支持的数据源，您可以添加为自定义类型。图1 手动配置血缘关系示例例如，当需要配置数据开发Pipeline作业中MRS Spark节点的血缘关系时，由于MRS Spark节点不支持自动血缘解析，则需要手动配置MRS Spark节点的血缘关系。操作步骤如下：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考 > 节点数据血缘
审计数据访问日志 - 数据治理中心 DataArts Studio

abled。审计功能开关默认开启，如果已关闭则请参考修改数据库参数章节将audit_enabled设置为ON。已开启需要审计的审计项。 DWS各类审计项及其开启方法，请参考设置数据库审计日志章节。对于DWS数据源，未开启三权分立时，默认拥有SYSADMIN属性的用户可以查看

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 数据安全运营
管理集群标签 - 数据治理中心 DataArts Studio

Studio服务进入数据集成界面可以看到。单击集群名称后，选择“标签”页签。图2 修改集群配置单击“添加/编辑标签”，通过添加、修改标签为CDM集群设置资源标识。图3 添加标签一个集群最多可添加10个标签。标签键（key）的最大长度为36个字符，标签值（value）的最大长度为43个字符。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 创建并管理CDM集群
JSONUtil内嵌对象 - 数据治理中心 DataArts Studio

path(String jsonStr,String jsonPath) 返回json字符串指定路径下的字段值。类似于XPath，path方法可以通过路径检索或设置JSON，其路径中可以使用.或[]等访问成员、数值，例如：tables[0].table_name。字符串变量str的内容如下： {

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > EL表达式参考
CDM Job - 数据治理中心 DataArts Studio

点名称同步变化禁用该功能。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
停止补数据实例 - 数据治理中心 DataArts Studio

补数据实例名称。请求参数表2 请求Header参数参数名是否必选参数类型说明 workspace 否 String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。说明：多个DataArts Studio实例需要指定工作空间。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V2） > 作业开发API
停止作业实例 - 数据治理中心 DataArts Studio

获取方法请参见查询作业实例列表请求参数表2 请求Header参数参数名是否必选参数类型说明 workspace 否 String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。说明：多个DataArts Studio实例需要指定工作空间。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
源端为DIS - 数据治理中心 DataArts Studio

fromJobConfig.streamName 是 String DIS的通道名。 fromJobConfig.disConsumerStrategy 是枚举设置从DIS拉取数据时的初始偏移量： LATEST：最大偏移量，即最新的数据。 FROM_LAST_STOP：从上次停止处继续拉取。 EARLIEST：最小偏移量，即最早的数据。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
删除资源 - 数据治理中心 DataArts Studio

resource_id。请求参数表2 请求Header参数参数名是否必选参数类型说明 workspace 否 String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。说明：多个DataArts Studio实例需要指定工作空间。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 资源管理API
管理作业标签 - 数据治理中心 DataArts Studio

如果导入的作业名有重复，系统会按后面一列来识别，标签标识按照该行来处理。添加方式：支持追加和覆盖两种。追加：若该作业已设置了作业标签，新添加的标签不会覆盖原来的标签。覆盖：若该作业已设置了作业标签，新添加的标签将会直接覆盖原来的标签。单击“确定”，完成导入。导出作业标签在数据开发主界面的左侧导航栏，选择“配置管理

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
配置权限集 - 数据治理中心 DataArts Studio

在“权限集”页面单击“新建”，创建权限集。图1 创建权限集新建权限集配置请参考表1，参数配置完成单击“确定”即可。表1 参数设置参数名参数设置 *权限集名称标识权限集，实例下唯一。建议名称中包含含义，避免无意义的描述，以便于快速识别所需权限集。 *父权限集选择对应的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > 数据权限访问控制
DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

持各种WEB应用，成本低，中小企业首选。 ORACLE ORACLE数据库系统是以分布式数据库为核心的一组软件产品，是目前最流行的客户/服务器(CLIENT/SERVER)或B/S体系结构的数据库之一。 ORACLE数据库是目前世界上使用最为广泛的数据库管理系统，作为一个通用的数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心
管理资源 - 数据治理中心 DataArts Studio

jar：用户jar文件。 pyFile：用户Python文件。 file：用户文件。 archive：用户AI模型文件。支持的文件后缀名为：zip、tgz、tar.gz、tar、jar。资源位置是选择资源所在的位置，当前支持OBS和HDFS两种资源存储位置。HDFS当前只支持MRS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理
撤销任务包 - 数据治理中心 DataArts Studio

D。请求参数表2 请求Header参数参数名是否必选参数类型说明 workspace 否 String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。说明：多个DataArts Studio实例需要指定工作空间。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V2） > 作业开发API
CDM作业配置管理 - 数据治理中心 DataArts Studio

CDM依次将Task提交给运行池运行。根据集群配置管理中的“最大抽取并发数”参数，超出规格的Task排队等待运行。因此作业抽取并发数和集群最大抽取并发数参数设置为适当的值可以有效提升迁移速度，您可参考下文有效配置抽取并发数。集群最大抽取并发数的上限建议为vCPU核数*2，如表1所示。表1 集群最大抽取并发数配置建议

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
管理回收站 - 数据治理中心 DataArts Studio

限集（包含空间权限集、权限集以及通用角色）、动态脱敏策略数据或密钥。不同数据还原时的操作基本一致，后续步骤以还原权限集数据为例，为您介绍如何还原数据。在权限集页签，找到待还原的权限集，单击列表操作栏中的“还原”进行数据还原。或者勾选待还原的权限集，单击列表上方的“还原”，进行批量还原。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全
步骤4：元数据采集 - 数据治理中心 DataArts Studio

在左侧导航树中，单击“任务监控”，查看采集任务是否成功。图6 查看监控任务当采集任务成功后，在左侧导航栏单击“数据目录”，选择“技术资产”页签，然后设置筛选条件，例如选中连接“mrs_hive_link”，以及选中“Table”，将显示符合条件的所有的表。图7 技术资产单击所需要的元数据名称，即可查看详情信息。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程

总条数： 1076

上一页
1
...
49
50
51
...
54
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

源端为Kafka - 数据治理中心 DataArts Studio

停止作业 - 数据治理中心 DataArts Studio

目的端为Hive - 数据治理中心 DataArts Studio

配置数据血缘 - 数据治理中心 DataArts Studio

审计数据访问日志 - 数据治理中心 DataArts Studio

管理集群标签 - 数据治理中心 DataArts Studio

JSONUtil内嵌对象 - 数据治理中心 DataArts Studio

CDM Job - 数据治理中心 DataArts Studio

停止补数据实例 - 数据治理中心 DataArts Studio

停止作业实例 - 数据治理中心 DataArts Studio

源端为DIS - 数据治理中心 DataArts Studio

删除资源 - 数据治理中心 DataArts Studio

管理作业标签 - 数据治理中心 DataArts Studio

配置权限集 - 数据治理中心 DataArts Studio

DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

管理资源 - 数据治理中心 DataArts Studio

撤销任务包 - 数据治理中心 DataArts Studio

CDM作业配置管理 - 数据治理中心 DataArts Studio

管理回收站 - 数据治理中心 DataArts Studio

步骤4：元数据采集 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线