搜索_华为云

创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

CDM集群与云上服务同区域情况下，同虚拟私有云、同子网、同安全组的不同实例默认网络互通；如果同虚拟私有云但是子网或安全组不同，还需配置路由规则及安全组规则，配置路由规则请参见如何配置路由规则章节，配置安全组规则请参见如何配置安全组规则章节。此外，您还必须确保该云服务的实例与CDM集群所属的企业项目必须相同，如果不同，需要修改工作空间的企业项目。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
配置数据入湖检测规则（高级特性） - 数据治理中心 DataArts Studio

在“数据入湖检测规则”页面中，单击配置规则。图1 数据入湖检测规则页面在弹出的规则配置窗口中，选择所需的识别规则，单击“提交”完成规则配置。图2 配置规则（可选）如需将数据入湖检测规则应用到数据集成（离线作业）的表敏感数据实时检测中，则还需配置规则策略，各配置参数说明请参见表1。图3

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据治理
配置调度身份 - 数据治理中心 DataArts Studio

在数据开发主界面的左侧导航栏，选择“配置管理 > 配置”。单击“调度身份配置”，公共调度身份选择“公共委托”。单击右边的“+”在委托列表中选择合适的委托，也可重新创建委托。创建委托和配置权限，请参见参考：创建委托和参考：配置委托权限。图1 配置工作空间级委托单击“确定”，回到调度身份配置页面，再单击，完成公共委托配置。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
支持的数据源 - 数据治理中心 DataArts Studio

支持不支持 - 关系型数据库 RDS（MySQL）、RDS（PostgreSQL）、RDS（SQL Server）、Oracle、RDS（SAP HANA）、GBASE8A 说明：创建数据连接时也支持用户使用自建的数据库，如MySQL、PostgreSQL、SQL Server、达梦数据库DM、SAP

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
配置PostgreSQL源端参数 - 数据治理中心 DataArts Studio

Where子句 “使用SQL语句”选择“否”时，显示该参数，表示配置抽取范围的Where子句，不配置时抽取整表。该参数支持配置为时间宏变量，实现抽取指定日期的数据，详细说明请参见关系数据库增量迁移。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CD

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
使用Python脚本连接MRS安全集群执行Impala SQL - 数据治理中心 DataArts Studio

端软件包到待安装客户端节点的指定目录。以待安装客户端的用户登录将要安装客户端的节点，并解压客户端软件包后，执行install命令进行安装，详细内容请参考安装客户端（3.x及之后版本）。 MRS 3.x之前版本集群在集群创建后，在主Master节点默认安装有客户端，安装目录为“/opt/client”。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
配置PostgreSQL目的端参数 - 数据治理中心 DataArts Studio

清除全部数据：写入数据前会清除目标表中数据。清除部分数据：需要配置“where条件”参数，CDM根据条件选择性删除目标表的数据。清除部分数据 where条件 “导入开始前”参数选择为“清除部分数据”时配置，配置后导入前根据where条件删除目的表的数据。 age > 18 and

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
配置SQLServer源端参数 - 数据治理中心 DataArts Studio

Where子句 “使用SQL语句”选择“否”时，显示该参数，表示配置抽取范围的Where子句，不配置时抽取整表。该参数支持配置为时间宏变量，实现抽取指定日期的数据，详细说明请参见关系数据库增量迁移。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CD

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
管理配置中心 - 数据治理中心 DataArts Studio

标准模板管理功能配置功能配置用于自定义数据架构中的各项功能。在DataArts Studio控制台首页，选择对应工作空间的“数据架构”模块，进入数据架构页面。在数据架构控制台，单击左侧导航树中的“配置中心”，进入相应页面后再单击“功能配置”。在功能配置页面，可根据用户具

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 通用操作
查看汇总表详情 - 数据治理中心 DataArts Studio

CREATE_SUCCESS: 创建成功 CREATE_FAILED: 创建失败 UPDATE_SUCCESS: 更新成功 UPDATE_FAILED: 更新失败 SUMMARY_SUCCESS: 整体成功 SUMMARY_FAILED: 整体失败 RUNNING: 整体运行 OFFLINE: 已下线

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 汇总表接口
字段类型映射关系 - 数据治理中心 DataArts Studio

字段类型映射关系 MySQL与MRS Hudi字段类型映射 PostgreSQL与DWS字段类型映射父主题：数据集成（实时作业）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
配置数据血缘 - 数据治理中心 DataArts Studio

图3 配置血缘输入完成血缘的输入表配置后，单击确定，继续配置血缘的输出表。假如MRS Spark作业中的输出表为“a”，则血缘输出配置如图4所示。图4 配置血缘输出完成血缘的输出表配置后，单击确认，则此MRS Spark节点的血缘关系手动配置成功。后续当需要查看血缘关系

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系
配置数据血缘 - 数据治理中心 DataArts Studio

图3 配置血缘输入完成血缘的输入表配置后，单击确定，继续配置血缘的输出表。假如MRS Spark作业中的输出表为“a”，则血缘输出配置如图4所示。图4 配置血缘输出完成血缘的输出表配置后，单击确认，则此MRS Spark节点的血缘关系手动配置成功。后续当需要查看血缘关系

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考 > 节点数据血缘
配置SQLServer目的端参数 - 数据治理中心 DataArts Studio

清除全部数据：写入数据前会清除目标表中数据。清除部分数据：需要配置“where条件”参数，CDM根据条件选择性删除目标表的数据。清除部分数据 where条件 “导入开始前”参数选择为“清除部分数据”时配置，配置后导入前根据where条件删除目的表的数据。 age > 18 and

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
参考：CDM性能实测数据 - 数据治理中心 DataArts Studio

常见数据源的性能实测结果分别如表1和表2所示。表1 读取性能实测数据数据源数据源规格版本单并发抽取速率（行/s）多并发抽取速率（行/s）云数据库 MySQL 8U 32G MySQL 5.7 42052 195313（并发度：40） Oracle 8U 16G 19C 18539 18706（并发度：10）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
操作环境与数据准备 - 数据治理中心 DataArts Studio

添加规则，放通入方向的DataArts Studio实例安全组，详情请参见如何配置安全组规则章节。您需要在云数据库RDS服务控制台，创建一个MySQL数据库实例，用于模拟原始数据源。建议创建MySQL数据库时，相关网络参数与DataArts Studio实例中的CDM集群的所在

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 图数据自动化构建与分析
Apache HDFS数据连接参数说明 - 数据治理中心 DataArts Studio

需使用该特性，请联系客服或技术支持人员。基础与网络连通配置是否使用集群配置是此参数用于选择用户已经创建好的集群配置。您可以通过使用集群配置，简化Hadoop连接参数配置。默认：关闭。 URI 是是否使用集群配置开关打开时显示该参数。表示NameNode URI地址。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
Apache Hive数据连接参数说明 - 数据治理中心 DataArts Studio

使用。如需使用该特性，请联系客服或技术支持人员。基础与网络连通配置是否使用集群配置是此参数用于选择用户已经创建好的集群配置。您可以通过使用集群配置，简化Hadoop连接参数配置。 URI 是使用集群配置为否时，是必选项。 NameNode URI地址。例如：hdfs://nn1_example

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
管理员操作 - 数据治理中心 DataArts Studio

Studio数据连接。配置企业模式环境隔离配置开发、生产环境的DLI队列和DB映射配置的环境隔离。对于DWS、MRS Hive和MRS Spark这三种数据源，如果在创建数据连接时选择同一个集群资源，则需要在同一个数据湖服务下配置两套数据库，进行开发与生产环境隔离，具体请参见DB配置。对于

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > （可选）升级企业模式工作空间 > 企业模式角色操作
DRS任务切换到实时Migration作业配置 - 数据治理中心 DataArts Studio

表数量配置在50张以内性能最佳。图1 查看DRS任务表数量同步流量查看进入DRS任务监控，查看监控指标，以“写目标库频率”为主要评估指标，同时观察DRS任务是否有时延。 Migration在配置8CU的情况下可以支撑8000条/秒的同步速率。流量较大的表建议单独配置作业。图2

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程

总条数： 1168

上一页
1
...
5
6
7
...
59
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

配置数据入湖检测规则（高级特性） - 数据治理中心 DataArts Studio

配置调度身份 - 数据治理中心 DataArts Studio

支持的数据源 - 数据治理中心 DataArts Studio

配置PostgreSQL源端参数 - 数据治理中心 DataArts Studio

使用Python脚本连接MRS安全集群执行Impala SQL - 数据治理中心 DataArts Studio

配置PostgreSQL目的端参数 - 数据治理中心 DataArts Studio

配置SQLServer源端参数 - 数据治理中心 DataArts Studio

管理配置中心 - 数据治理中心 DataArts Studio

查看汇总表详情 - 数据治理中心 DataArts Studio

字段类型映射关系 - 数据治理中心 DataArts Studio

配置数据血缘 - 数据治理中心 DataArts Studio

配置数据血缘 - 数据治理中心 DataArts Studio

配置SQLServer目的端参数 - 数据治理中心 DataArts Studio

参考：CDM性能实测数据 - 数据治理中心 DataArts Studio

操作环境与数据准备 - 数据治理中心 DataArts Studio

Apache HDFS数据连接参数说明 - 数据治理中心 DataArts Studio

Apache Hive数据连接参数说明 - 数据治理中心 DataArts Studio

管理员操作 - 数据治理中心 DataArts Studio

DRS任务切换到实时Migration作业配置 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线