搜索_华为云

MongoDB/DDS增量迁移 - 数据治理中心 DataArts Studio

Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。在创建CDM表/文件迁移的作业，源连接选择为MongoDB连接或者DDS连接时，高级属性的可选参数中可以配置查询筛选。图1 MongoDB查询筛选此参数支

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导 > 增量迁移原理介绍
创建MySQL连接器 - 数据治理中心 DataArts Studio

料链接，按照相应指导获取驱动文件。在“驱动管理”页面中，选择以下方式上传MySQL驱动。方式一：单击对应驱动名称右侧操作列的“上传”，选择本地已下载的驱动。方式二：单击对应驱动名称右侧操作列的“从sftp复制”，配置sftp连接器名称和驱动文件路径。在“集群管理”界面，单击集群后的“作业管理”，选择“连接管理

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
配置数据血缘 - 数据治理中心 DataArts Studio

支持自动血缘解析的作业节点及场景作业节点支持场景 DLI SQL 支持解析DLI中表与表之间数据插入产生的血缘。支持通过建表语句产生的OBS文件到DLI表之间的血缘。 DWS SQL 支持Insert into等DML操作产生的DWS表之间的血缘。 MRS Hive SQL 支持Insert

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系
配置数据血缘 - 数据治理中心 DataArts Studio

支持自动血缘解析的作业节点及场景作业节点支持场景 DLI SQL 支持解析DLI中表与表之间数据插入产生的血缘。支持通过建表语句产生的OBS文件到DLI表之间的血缘。 DWS SQL 支持Insert into等DML操作产生的DWS表之间的血缘。 MRS Hive SQL 支持Insert

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考 > 节点数据血缘
配置DIS源端参数 - 数据治理中心 DataArts Studio

最早：最小偏移量，即拉取最早的数据。最新 APP名字配置用户数据消费程序的唯一标识符，不存在时会自动创建。 cdm 数据格式解析数据时使用的格式：二进制格式：适用于文件迁移场景，不解析数据内容原样传输。 CSV格式：以CSV格式解析源数据。 JSON格式：以JSON格式解析源数据。二进制格式字段分隔符

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置ElasticSearch目的端参数 - 数据治理中心 DataArts Studio

类型。此处即使自定义也不会生效。 type 操作操作类型。 INDEX：不指定主键，es内部生成id，使得每次写入都是不同id的新增数据文件。 CREATE：需要指定主键。如果主键已经存在，写入失败。 UPDATE：需要指定主键。如果主键已经存在，覆盖原有数据。 UPSERT：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
导出资源 - 数据治理中心 DataArts Studio

resources 否 Array of longs 资源ID数组。 export_mode 否 String 导出模式，null表示导出到本地文件系统，obs表示导出至obs，仅限于导出质量报告使用。 obs_service_type 否 String 业务类型，technology

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据质量API > 导入导出接口
数据开发 - 数据治理中心 DataArts Studio

position 63-64 : ordinal not in range ( 128 )”怎么处理？查看日志时，系统提示“OBS日志文件不存在，请检查文件是否被删除或者没有OBS写入权限。”怎么办？ Shell/Python节点执行失败，后台报错session is down 请求头

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题
上传CDM连接驱动 - 数据治理中心 DataArts Studio

jar格式驱动。前提条件已创建集群。已参见表1下载对应的驱动。已参见FTP/SFTP连接参数说明创建SFTP连接并将对应的驱动上传至线下文件服务器（可选）。如何获取驱动不同类型的关系数据库，需要适配不同类型的驱动。注意，上传的驱动版本不必与待连接的数据库版本相匹配，直接参考表1获取建议版本的JDK8

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
查询作业 - 数据治理中心 DataArts Studio

jobType=NORMAL_JOB：表示查询表/文件迁移的作业。 jobType=BATCH_JOB：表示查询整库迁移的作业。 jobType=SCENARIO_JOB：表示查询场景迁移的作业。不指定该参数时，默认只查询表/文件迁移的作业。请求参数表3 请求Header参数

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 作业管理
Shell - 数据治理中心 DataArts Studio

数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本的调度频率合理配置MaxSessions的值。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell和Python脚本都是发往

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
DataArts Studio的工作空间可以删除吗？ - 数据治理中心 DataArts Studio

数据开发组件：作业，作业目录，脚本，脚本目录和资源。数据质量组件：质量作业和对账作业。数据目录组件：技术资产中的表（Table）和文件（File）类型资产，以及元数据采集任务。数据服务组件：数据服务集群，API和APP。数据安全组件：敏感数据发现任务，脱敏策略，静态脱敏任务和数据水印任务。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 咨询与计费
通过数据质量对比数据迁移前后结果 - 数据治理中心 DataArts Studio

Studio控制台，单击相应工作空间后的“数据集成”。在“集群管理”页面，单击所创建集群操作列“作业管理”，进入“作业管理”页面。在表/文件迁移页签中，单击新建作业，创建数据迁移作业。配置DWS源端作业参数、MRS Hive目的端作业参数，参数说明请参见配置DWS源端参数、配置MRS

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
配置MongoDB目的端参数 - 数据治理中心 DataArts Studio

的账号是否有元数据查询的权限。 COLLECTION 迁移行为将记录迁移到MongoDB目的端时，选择需要进行的插入行为操作。新增：将文件记录直接插入指定的集合。有则新增，无则替换：以指定的过滤键作为查询条件。如果在集合中找到匹配的记录，则替换该记录（找到多条匹配记录时，只

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
源端为DIS - 数据治理中心 DataArts Studio

DIS分区ID，该参数支持输入多个分区ID，使用“,”分隔。 fromJobConfig.dataFormat 是枚举解析数据时使用的格式： BINARY：适用于文件迁移场景，不解析数据内容原样传输。 CSV：以CSV格式解析源数据。 fromJobConfig.separator 否 String 字段分隔符。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
新建数据质量规则 - 数据治理中心 DataArts Studio

单击“导出”，弹出“导出规则模板”对话框。单击“导出”，切换到“导出记录”页签。在导出文件列表中，单击最新导出文件对应的“下载”，可将规则模板的Excel表格下载到本地。导入规则模板系统支持将自定义的规则模板批量导入，一次最大可导入4MB数据的文件。选择“数据质量监控 > 规则模板”，单击“导入”，弹出“导入规则模板”对话框。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
新建DataArts Studio与MySQL数据库的连接 - 数据治理中心 DataArts Studio

huawei.opengauss.jdbc.Driver：连接GaussDB数据源时，选择此驱动程序名称。驱动文件来源是选择驱动文件的来源方式。驱动文件路径是驱动文件在OBS上的路径。需要您自行到官网下载.jar格式驱动并上传至OBS中。 MySQL驱动：获取地址https://downloads

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 管理中心典型场景教程
DataArts Studio配置数据搬迁简介 - 数据治理中心 DataArts Studio

CDM集群和数据服务专享版集群在工作空间之间相互隔离，建议您在新空间提前准备好对应旧空间的集群。搬迁依赖于OBS功能，请您提前规划OBS桶和文件夹目录。 DataArts Studio数据搬迁时，依赖各组件的备份或导入导出能力。您可以根据自己的数据需求，自由选择搬迁哪个组件的数据。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
配置MongoDB目的端参数 - 数据治理中心 DataArts Studio

业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 table 高级属性迁移行为选择写入目的端的迁移方式。新增：将文件记录直接插入指定的集合。有则替换，无则新增：以指定的过滤键作为查询条件。如果在集合中找到匹配的记录，则替换该记录。如果不存在，则添加新记录。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
关系数据库增量迁移 - 数据治理中心 DataArts Studio

会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 Where子句参数位置：在创建表/文件迁移作业时，如果源端为关系型数据库，那么在源端作业参数的高级属性下面可以看到“Where子句”参数。参数原理：通过“Where子句”参数可以配置一个SQL语句（例如：age

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导 > 增量迁移原理介绍

总条数： 371

上一页
1
...
13
14
15
...
19
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MongoDB/DDS增量迁移 - 数据治理中心 DataArts Studio

创建MySQL连接器 - 数据治理中心 DataArts Studio

配置数据血缘 - 数据治理中心 DataArts Studio

配置数据血缘 - 数据治理中心 DataArts Studio

配置DIS源端参数 - 数据治理中心 DataArts Studio

配置ElasticSearch目的端参数 - 数据治理中心 DataArts Studio

导出资源 - 数据治理中心 DataArts Studio

数据开发 - 数据治理中心 DataArts Studio

上传CDM连接驱动 - 数据治理中心 DataArts Studio

查询作业 - 数据治理中心 DataArts Studio

Shell - 数据治理中心 DataArts Studio

DataArts Studio的工作空间可以删除吗？ - 数据治理中心 DataArts Studio

通过数据质量对比数据迁移前后结果 - 数据治理中心 DataArts Studio

配置MongoDB目的端参数 - 数据治理中心 DataArts Studio

源端为DIS - 数据治理中心 DataArts Studio

新建数据质量规则 - 数据治理中心 DataArts Studio

新建DataArts Studio与MySQL数据库的连接 - 数据治理中心 DataArts Studio

DataArts Studio配置数据搬迁简介 - 数据治理中心 DataArts Studio

配置MongoDB目的端参数 - 数据治理中心 DataArts Studio

关系数据库增量迁移 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线