搜索_华为云

配置实时集成作业 - 数据治理中心 DataArts Studio

配置实时集成作业完成数据连接、网络、资源组等准备工作的配置后，您可创建并配置实时集成作业，将多种输入及输出数据源搭配组成同步链路，进行数据的实时同步。前提条件已开通华为账号，并授权使用实时数据集成服务，详情请参考注册华为账号并开通华为云和授权使用实时数据集成。已购买资源组，详情请参见购买数据集成资源组。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
配置DWS源端参数 - 数据治理中心 DataArts Studio

Where子句 “使用SQL语句”选择“否”时，显示该参数，表示配置抽取范围的Where子句，不配置时抽取整表。该参数支持配置为时间宏变量，实现抽取指定日期的数据，详细说明请参见关系数据库增量迁移。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CD

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置LTS源端参数 - 数据治理中心 DataArts Studio

配置LTS源端参数表1 LTS作为源端时的作业参数参数名说明取值样例源连接名称对应关系数据库的表名。 TABLENAME 单次查询数据条数一次从日志服务查询的数据条数。 128 日志分组日志组是云日志服务进行日志管理的基本单位。 _ 日志流日志流是日志读写的基本单位。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
配置节点并发数 - 数据治理中心 DataArts Studio

400 图1 配置节点并发数单击“保存”，完成配置。查看历史节点并发数在数据开发主界面的左侧导航栏，选择“配置管理 > 配置”。选择“节点并发数”。在历史节点并发数界面，选择历史时间段。单击“确定”。查看历史节点并发数的时间区间最大为24小时。父主题：配置

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
示例场景说明 - 数据治理中心 DataArts Studio

示例场景说明本实践通过DataArts Studio服务的数据集成CDM组件、数据开发DLF组件和数据仓库服务（DWS）对电影评分原始数据进行分析，输出评分最高和最活跃Top10电影。您可以学习到数据集成模块的数据迁移和数据开发模块的脚本开发、作业开发、作业调度等功能，以及DWS

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 初级版：基于DWS的电影评分数据集成与开发流程
配置作业源端参数 - 数据治理中心 DataArts Studio

配置作业源端参数配置MySql源端参数配置Hive源端参数配置HDFS源端参数配置Hudi源端参数配置PostgreSQL源端参数配置SQLServer源端参数配置Oracle源端参数配置DLI源端参数配置OBS源端参数配置SAP HANA源端参数配置Kafka源端参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
新建DataArts Studio与DWS数据湖的连接 - 数据治理中心 DataArts Studio

CDM集群与云上服务同区域情况下，同虚拟私有云、同子网、同安全组的不同实例默认网络互通；如果同虚拟私有云但是子网或安全组不同，还需配置路由规则及安全组规则，配置路由规则请参见如何配置路由规则章节，配置安全组规则请参见如何配置安全组规则章节。此外，您还必须确保该云服务的实例与DataArts Studio工作空间所属

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 管理中心典型场景教程
配置数据访问权限 - 数据治理中心 DataArts Studio

配置数据访问权限数据权限简介配置数据目录权限配置数据表权限（待下线）管理审批中心（待下线）父主题：数据目录

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录
添加通知配置 - 数据治理中心 DataArts Studio

添加通知配置通过添加通知配置，可以快速创建作业的通知配置信息。右键单击作业名称，单击“添加通知配置”，此通知配置为作业的新增配置，详细指导请参见配置通知。如果要对作业已有通知配置进行修改，请进入通知管理页面，按照配置通知指导进行配置修改。单个作业跳转到通知管理页面后，会对该作

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
通过数据质量对比数据迁移前后结果 - 数据治理中心 DataArts Studio

单击“新建”，配置对账作业的基本信息，如图8所示。图8 配置对账作业基本信息单击“下一步”，进入规则配置页面。您需要单击规则卡片中的，然后配置对账规则，选择数据迁移前后两张数据表，并配置告警规则，如图9所示。图9 配置对账规则源端和目的端的信息需要分别配置。配置告警条件，其

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
创建并配置简单模式工作空间 - 数据治理中心 DataArts Studio

创建并配置简单模式工作空间创建简单模式工作空间设置工作空间配额（可选）修改作业日志存储路径父主题：购买并配置DataArts Studio

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio
配置数据血缘 - 数据治理中心 DataArts Studio

图3 配置血缘输入完成血缘的输入表配置后，单击确定，继续配置血缘的输出表。假如MRS Spark作业中的输出表为“a”，则血缘输出配置如图4所示。图4 配置血缘输出完成血缘的输出表配置后，单击确认，则此MRS Spark节点的血缘关系手动配置成功。后续当需要查看血缘关系

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考 > 节点数据血缘
批量配置作业 - 数据治理中心 DataArts Studio

单击作业目录中的，选择“显示复选框”。图1 显示作业复选框勾选需要批量配置的作业，单击 > 作业配置。图2 作业配置菜单配置作业的通用项。图3 通用配置表1 通用配置参数说明节点状态轮询时间设置所选作业的所有节点轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

CDM迁移数据到DWS时如何选取分布列？问题描述 CDM迁移数据到DWS时如何选取分布列？解决方案在使用CDM迁移数据到数据仓库服务（DWS）或者FusionInsight LibrA，且CDM在DWS端自动创建一个新表时，在创建作业的字段映射界面，需要选择分布列，如图1所示。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

由于文本文件中无法用字符串定义null值，此配置项定义将何种字符串标识为null。例如：如果配置为null，则数据中如果存在某行某列值为“null”，则会被解析为null值。 - MD5文件名后缀文件格式为二进制格式时支持此参数。校验CDM抽取的文件，是否与源文件一致。 .md5 父主题：配置作业源端参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
配置SAP HANA源端参数 - 数据治理中心 DataArts Studio

Where子句 “使用SQL语句”选择“否”时，显示该参数，表示配置抽取范围的Where子句，不配置时抽取整表。该参数支持配置为时间宏变量，实现抽取指定日期的数据，详细说明请参见关系数据库增量迁移。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CD

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
配置Redis源端参数 - 数据治理中心 DataArts Studio

配置Redis源端参数表1 Redis作为源端时的作业参数参数类型参数名说明取值样例基本参数 redis键前缀对应关系数据库的表名。 TABLENAME 值存储类型存储类型分STRING、HASH。 STRING 高级属性键分隔符用来分隔关系数据库的表和列名。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
配置ClickHouse源端参数 - 数据治理中心 DataArts Studio

Where子句 “使用SQL语句”选择“否”时，显示该参数，表示配置抽取范围的Where子句，不配置时抽取整表。该参数支持配置为时间宏变量，实现抽取指定日期的数据，详细说明请参见关系数据库增量迁移。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CD

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
Hive连接参数说明 - 数据治理中心 DataArts Studio

是否需要测试Hive JDBC连通。否是否使用集群配置您可以通过使用集群配置，简化Hadoop连接参数配置。否集群配置名仅当“是否使用集群配置”为“是”时，此参数有效。此参数用于选择用户已经创建好的集群配置。集群配置的创建方法请参见管理集群配置。 hive_01 单击“显示高级属性

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
产品功能 - 数据治理中心 DataArts Studio

数据集成：多种方式异构数据源高效接入数据集成提供30+同构/异构数据源之间数据集成的功能，帮助您实现数据自由流动。支持自建和云上的文件系统，关系数据库，数据仓库，NoSQL，大数据云服务，对象存储等数据源。数据集成基于分布式计算框架，利用并行化处理技术，支持用户稳定高效地对海量数据进行移动，实现

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍

总条数： 1111

上一页
1
2
3
4
5
...
56
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置实时集成作业 - 数据治理中心 DataArts Studio

配置DWS源端参数 - 数据治理中心 DataArts Studio

配置LTS源端参数 - 数据治理中心 DataArts Studio

配置节点并发数 - 数据治理中心 DataArts Studio

示例场景说明 - 数据治理中心 DataArts Studio

配置作业源端参数 - 数据治理中心 DataArts Studio

新建DataArts Studio与DWS数据湖的连接 - 数据治理中心 DataArts Studio

配置数据访问权限 - 数据治理中心 DataArts Studio

添加通知配置 - 数据治理中心 DataArts Studio

通过数据质量对比数据迁移前后结果 - 数据治理中心 DataArts Studio

创建并配置简单模式工作空间 - 数据治理中心 DataArts Studio

配置数据血缘 - 数据治理中心 DataArts Studio

批量配置作业 - 数据治理中心 DataArts Studio

CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

配置SAP HANA源端参数 - 数据治理中心 DataArts Studio

配置Redis源端参数 - 数据治理中心 DataArts Studio

配置ClickHouse源端参数 - 数据治理中心 DataArts Studio

Hive连接参数说明 - 数据治理中心 DataArts Studio

产品功能 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线