搜索_华为云

Apache Kafka同步到MRS Kafka作业配置 - 数据治理中心 DataArts Studio

是否写入脏数据选择是否记录脏数据，默认不记录脏数据，当脏数据过多时，会影响同步任务的整体同步速度。链路是否支持写入脏数据，以实际界面为准。否：默认为否，不记录脏数据。表示不允许脏数据存在。如果同步过程中产生脏数据，任务将失败退出。是：允许脏数据，即任务产生脏数据时不影响任务执行。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
数据库部署在其他云 - 数据治理中心 DataArts Studio

组VPC网段访问数据库的权限。各厂商云数据库添加白名单的方法不同，请参考各数据库官方文档进行操作。同时，其他云数据库若配置了安全组，则还需要增加入方向规则，放通Migration资源组VPC网段，使其可以访问数据库监听端口。各数据源所用端口不尽相同，可参考数据源安全组应放通哪

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通
步骤1：流程设计 - 数据治理中心 DataArts Studio

需要支持数据水印？本示例不涉及支持对Hive数据源数据进行数据水印嵌入需要支持文件水印？本示例不涉及支持对结构化数据文件注入暗水印，支持对非结构化数据文件注入明水印需要支持动态水印？本示例不涉及支持对Hive和Spark数据源数据配置动态水印策略 8 数据服务需要开放哪些数据源数据？

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
查询连接详情（待下线） - 数据治理中心 DataArts Studio

请求Header参数参数名是否必选参数类型说明 workspace 否 String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。响应参数表3 Connection参数说明参数名是否必选参数类型说明

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 连接管理API（待下线）
配置元数据采集任务 - 数据治理中心 DataArts Studio

勾选“忽略更新、添加操作”：不采集数据源中的元数据数据源元数据已删除当数据连接中元数据发生变化时，通过配置删除策略，设置数据目录中元数据的更新方式。勾选“从数据目录中删除元数据”：当数据源中的某些元数据已经被删除，数据目录中也将同步删除对应的元数据勾选“忽略删除”：当数据源中的某些元数据已经被删除，数据目录中不同步删除对应元数据。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 采集数据源的元数据
创建数据连接 - 数据治理中心 DataArts Studio

qualified_name 否 String 数据连接限定名称。 dw_id 否 String 数据连接id，可通过数据连接列表中获取。 create_user 否 String 数据连接创建者。 create_time 否 Number 数据连接创建时间，时间戳。响应参数状态码：

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 管理中心API > 数据连接管理
配置资源权限 - 数据治理中心 DataArts Studio

参考MRS Ranger数据连接参数说明填写正确的RangerAdmin业务IP和Ranger服务端口。在管理中心测试Ranger数据连接时，不会校验Ranger业务IP和服务端口，即使填写错误也不会提示，因此建议进行人工检查。已开启对应MRS集群的Ranger鉴权功能，安全

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > Ranger权限访问控制
开发实时处理单任务MRS Flink Jar作业 - 数据治理中心 DataArts Studio

重新启动输入数据路径否设置输入数据路径，系统支持从HDFS或OBS的目录路径进行配置。输出数据路径否设置输出数据路径，系统支持从HDFS或OBS的目录路径进行配置。表2 配置高级参数参数是否必选说明作业状态轮询时间（秒）是设置轮询时间（30~60秒、12

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
问题案例总览 - 数据治理中心 DataArts Studio

问题案例总览表1 问题案例总览类型相关文档网络打通数据源和资源组网络不通如何排查？网络打通数据源安全组放通哪些端口可满足Migration访问？ Hudi 如何配置Hudi Compaction的Spark周期任务？ DWS MySQL到DWS实时同步中，同步新增列的DDL时报错怎么办？

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（实时作业）
通过VPN连通网络 - 数据治理中心 DataArts Studio

2.16.0.0/19），使其可以访问数据库监听端口。各数据源所用端口不尽相同，可参考数据源安全组应放通哪些端口可满足Migration访问？进行安全组规则端口配置。（可选）其他云数据库所在网络及VPN网关添加路由。必要时，其他云数据库所在网络需要添加路由，目的地址指向Mi

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在其他云
通过云专线连通网络 - 数据治理中心 DataArts Studio

16.0.0/19），使其可以访问数据库监听端口。各数据源所用端口不尽相同，可参考数据源安全组应放通哪些端口可满足Migration访问？进行安全组规则端口配置。（可选）其他云数据库所在网络添加路由，专线添加远端子网。必要时，其他云数据库所属网络需要添加路由，目的地址指向

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在其他云
DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

支持目标数据库中的表比源数据库多列场景，但是需要避免以下场景可能导致的任务失败。目标数据库多的列要求非空且没有默认值，源数据库insert数据，同步到目标数据库后多的列为null，不符合目标数据库要求。目标数据库多的列设置固定默认值，且有唯一约束。源数据库insert多条数据后，同步到目标数据库后

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
Cassandra连接参数说明 - 数据治理中心 DataArts Studio

服务节点一个或者多个节点的地址，以“;”分隔。建议同时配置多个节点。 192.168.0.1;192.168.0.2 端口连接的Cassandra节点的端口号。 9042 用户名连接Cassandra的用户名。 cdm 密码连接Cassandra的密码。 - 连接超时时长

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
购买DataArts Studio实例 - 数据治理中心 DataArts Studio

说明：购买非免费版DataArts Studio实例时，会默认包含一个数据集成CDM集群，此集群规格建议用于作为连接代理。如需用于数据迁移作业，请购买更高规格的批量数据迁移增量包，详情请参考购买批量数据迁移增量包。计费方式包年包月当前DataArts Studio基础包仅支持包年包月计费方式。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio
创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

开放连接端口。如果目标数据源为云上服务（如DWS、MRS及ECS等），则网络互通需满足如下条件： CDM集群与云上服务处于不同区域的情况下，需要通过公网或者专线打通网络。通过公网互通时，需确保CDM集群已绑定EIP，数据源所在的主机可以访问公网且防火墙规则已开放连接端口。 CD

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
调度作业 - 数据治理中心 DataArts Studio

如作业中包含多个节点、补数据、重跑等场景。举例1：任务组里面最大并发数配置为2，作业节点有5个，当作业运行时，只有两个节点在运行中，其它节点在等待运行。举例2：任务组里面最大并发数配置为2，补数据的并发周期数设置为5，当作业进行补数据时，有两个补数据生成的作业实例在运行中，其

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
MongoDB同步到DWS作业配置 - 数据治理中心 DataArts Studio

是否写入脏数据选择是否记录脏数据，默认不记录脏数据，当脏数据过多时，会影响同步任务的整体同步速度。链路是否支持写入脏数据，以实际界面为准。否：默认为否，不记录脏数据。表示不允许脏数据存在。如果同步过程中产生脏数据，任务将失败退出。是：允许脏数据，即任务产生脏数据时不影响任务执行。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
MRS Presto数据连接参数说明 - 数据治理中心 DataArts Studio

Presto）。数据连接名称是数据连接的名称，只能包含字母、数字、下划线和中划线，且长度不超过100个字符。标签否标识数据连接的属性。设置标签后，便于统一管理。说明：标签的名称，只能包含中文、英文字母、数字和下划线，不能以下划线开头，且长度不能超过100个字符。适用组件

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
表达式概述 - 数据治理中心 DataArts Studio

表达式概述数据开发模块作业中的节点参数可以使用表达式语言（Expression Language，简称EL），根据运行环境动态生成参数值。可以根据Pipeline输入参数、上游节点输出等决定是否执行此节点。数据开发模块EL表达式使用简单的算术和逻辑计算，引用内嵌对象，包括作业对象和一些工具类对象。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > EL表达式参考
传统周期调度 - 数据治理中心 DataArts Studio

传统周期调度解释说明周期调度作业支持设置调度周期符合条件的作业为依赖作业。设置依赖作业的操作详情请参考配置作业调度任务（批处理作业）章节。例如周期调度作业A，可设置其依赖作业为作业B，如图1所示进行配置。则仅当其依赖的作业B在某段时间内所有实例运行完成、且不存在失败实例时，才开始执行作业A。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践 > 周期调度依赖策略

总条数： 961

上一页
1
...
8
9
10
...
49
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Apache Kafka同步到MRS Kafka作业配置 - 数据治理中心 DataArts Studio

数据库部署在其他云 - 数据治理中心 DataArts Studio

步骤1：流程设计 - 数据治理中心 DataArts Studio

查询连接详情（待下线） - 数据治理中心 DataArts Studio

配置元数据采集任务 - 数据治理中心 DataArts Studio

创建数据连接 - 数据治理中心 DataArts Studio

配置资源权限 - 数据治理中心 DataArts Studio

开发实时处理单任务MRS Flink Jar作业 - 数据治理中心 DataArts Studio

问题案例总览 - 数据治理中心 DataArts Studio

通过VPN连通网络 - 数据治理中心 DataArts Studio

通过云专线连通网络 - 数据治理中心 DataArts Studio

DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

Cassandra连接参数说明 - 数据治理中心 DataArts Studio

购买DataArts Studio实例 - 数据治理中心 DataArts Studio

创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

调度作业 - 数据治理中心 DataArts Studio

MongoDB同步到DWS作业配置 - 数据治理中心 DataArts Studio

MRS Presto数据连接参数说明 - 数据治理中心 DataArts Studio

表达式概述 - 数据治理中心 DataArts Studio

传统周期调度 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线