搜索_华为云

Oracle同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

数据库账号权限类型名称权限要求源数据库连接账号 Oracle 库需要开启归档日志，同时需表查询权限和日志解析权限，开通对应权限详情请参考Oracle数据源如何开通归档日志、查询权限和日志解析权限？。目标数据库连接账号 MRS用户需要拥有Hadoop和Hive组件的读写权限，建议参照图1所示角色及用户组配置MRS用户。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
开发实时处理单任务MRS Flink SQL作业 - 数据治理中心 DataArts Studio

样，查询结果存到数据库是以YYYY-MM-DD格式，而页面显示查询结果是经过转换后的格式。 Flink SQL作业支持语法检查。在编辑器上方，单击“语法检查”，可以对SQL语句进行语义校验。SQL语句校验完成后，可以在下方查看语法校验结果。 Flink SQL作业支持代码调试功能

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
Apache Kafka同步到MRS Kafka作业配置 - 数据治理中心 DataArts Studio

表3 同步对象范围类型名称使用须知同步对象范围支持完整同步Kafka Topic所有消息内容，但不支持对Kafka Topic消息进行解析重组后同步。注意事项除了数据源版本、连接账号权限及同步对象范围外，您还需要注意的事项请参见下表。表4 注意事项类型名称使用和操作限制

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
导出导入作业 - 数据治理中心 DataArts Studio

单击作业目录中的，选择“显示复选框”。勾选需要导出的作业，单击 > 导出作业，可选择“只导出作业”或“导出作业及其依赖脚本和资源定义”。导出完成后，即可通过浏览器下载地址，获取到导出的zip文件。图1 选择并导出作业在弹出的“导出作业”界面，选择需要导出的作业范围和状态，单击“确定”，可以在下载中心查看导入结果。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

_cluster”，为Spark作业提供运行所需的物理资源。获取Spark作业代码本示例使用的Spark作业代码来自maven库（下载地址：https://repo.maven.apache.org/maven2/org/apache/spark/spark-examples_2

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
修改集群 - 数据治理中心 DataArts Studio

Boolean 消息通知。 phoneNum 否 String 手机号码，最多填写20个，以英文逗号分隔。 email 否 String 邮箱地址，最多填写20个，以英文逗号分隔。响应参数无请求示例修改集群配置。 POST /v1.1/1551c7f6c808414d8e9f

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
脚本/MyBatis方式生成API - 数据治理中心 DataArts Studio

HTTP请求方式，表示请求什么类型的操作，包含GET、POST等，遵循resultful风格。 GET：请求服务器返回指定资源，推荐使用GET请求。 POST：请求服务器新增资源或执行特殊操作。POST请求当前不支持body体，而是直接透传。描述对API进行简要描述。标签

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 创建API
PostgreSQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

timezone string 本地时区 - 连接目的端数据库时指定的session时区，支持时区标准写法，例如utc+8等。刷新源表和目标表映射，检查映射关系是否正确，同时可根据需求修改表属性、添加附加字段，并通过“自动建表”能力在目的端DWS数据库中建出相应的表。图10 源表与目标表映射

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
配置资源权限 - 数据治理中心 DataArts Studio

nger服务端口。在管理中心测试Ranger数据连接时，不会校验Ranger业务IP和服务端口，即使填写错误也不会提示，因此建议进行人工检查。已开启对应MRS集群的Ranger鉴权功能，安全模式默认开启Ranger鉴权，普通模式默认关闭Ranger鉴权。详情请参考启用Ranger鉴权。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > Ranger权限访问控制
MongoDB同步到DWS作业配置 - 数据治理中心 DataArts Studio

当前支持的修改操作有：在目标字段赋值中增、减加字段的映射规则。修改全局参数，如处理器核数、是否自动重试等内容。修改数据源的高级属性。当前不支持的修改操作有：在目标字段赋值中，修改已有的字段映射规则。如，将原本是源表字段赋值的规则，修改成手动赋值的规则。修改源端的集合或修改目标端的表。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
创建DataArts Studio数据连接 - 数据治理中心 DataArts Studio

Studio同区域的OBS，则不支持RDS数据连接。主机连接当前仅支持Linux系统主机。当所连接的数据湖发生变化（如MRS集群扩容等情况）时，您需要重新编辑并保存该连接。数据连接中的数据湖认证信息如果发生变化（如密码过期）时，此连接会失效。建议您将数据湖认证信息设定为永久有效，避免由于连接失败导致业务受损。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心
区域和可用区如何选择？ - 数据治理中心 DataArts Studio

支持五天无理由退订。实例购买/试用成功后，无法转移到另一个区域/可用区。区域和终端节点终端节点（Endpoint）即调用API的请求地址，不同服务不同区域的终端节点不同。本服务的Endpoint可从终端节点Endpoint获取。父主题：咨询与计费

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 咨询与计费
提交表权限申请 - 数据治理中心 DataArts Studio

响应Body参数参数参数类型描述 describe String 描述 permission_center_url String 审批页面地址 workspace_id String 工作空间id 状态码： 400 表8 响应Body参数参数参数类型描述 error_code

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据安全API > 权限审批接口
产品功能 - 数据治理中心 DataArts Studio

支持去隐私、字符串操作、日期操作等常用字段的数据转换功能。文件加密在迁移文件到文件系统时，数据集成支持对写入云端的文件进行加密。 MD5校验一致性支持使用MD5校验，检查端到端文件的一致性，并输出校验结果。脏数据归档支持将迁移过程中处理失败的、被清洗过滤掉的、不符合字段转换或者不符合清洗规则的数据自动归

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
入门实践 - 数据治理中心 DataArts Studio

免了权限过大的风险。如何查看表行数和库大小在数据治理流程中，我们常常需要统计数据表行数或数据库的大小。其中，数据表的行数可以通过SQL命令或数据质量作业获取；数据库大小可以直接在数据目录组件中查看，详情可参考本实践。通过数据质量对比数据迁移前后结果数据对账对数据迁移流程中

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门
配置HDFS目的端参数 - 数据治理中心 DataArts Studio

作业中目的连接为HDFS连接时，目的端作业参数如表1所示。表1 HDFS作为目的端时的作业参数参数名说明取值样例写入目录写入数据到HDFS服务器的目录。该参数支持配置为时间宏变量，且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配合，可以实现定期同步新增数据，详细说明请参见使用时间宏变量完成增量同步。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
新建Hadoop集群配置 - 数据治理中心 DataArts Studio

> 现有集群”，单击集群名称进入集群详情页面，单击“组件管理”。单击“下载客户端”。“客户端类型”选择“仅配置文件”，“下载路径”选择“服务器端”或“远端主机”，自定义文件保存路径后，单击“确定”开始生成客户端配置文件。将生成的配置文件，保存到本地路径。具体可参见MapReduce服务文档。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
Apache HDFS数据连接参数说明 - 数据治理中心 DataArts Studio

您可以通过使用集群配置，简化Hadoop连接参数配置。默认：关闭。 URI 是是否使用集群配置开关打开时显示该参数。表示NameNode URI地址。可以填写为：hdfs://namenode实例的ip:8020。 IP与主机名映射否是否使用集群配置开关打开时显示该参数。运行模式

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
MySQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

timezone string 本地时区 - 连接目的端数据库时指定的session时区，支持时区标准写法，例如utc+8等。刷新源表和目标表映射，检查映射关系是否正确，同时可根据需求修改表属性、添加附加字段，并通过“自动建表”能力在目的端DWS数据库中建出相应的表。图10 源表与目标表映射

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

务里仅开启生成compaction计划，具体可以参考如何配置Hudi Compaction的Spark周期任务？。刷新源表和目标表映射，检查映射关系是否正确，同时可根据需求修改表属性、添加附加字段，并通过“自动建表”能力在目的端Hudi数据库中建出相应的表。图11 源表与目标表映射

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程

总条数： 226

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Oracle同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

开发实时处理单任务MRS Flink SQL作业 - 数据治理中心 DataArts Studio

Apache Kafka同步到MRS Kafka作业配置 - 数据治理中心 DataArts Studio

导出导入作业 - 数据治理中心 DataArts Studio

开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

修改集群 - 数据治理中心 DataArts Studio

脚本/MyBatis方式生成API - 数据治理中心 DataArts Studio

PostgreSQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

配置资源权限 - 数据治理中心 DataArts Studio

MongoDB同步到DWS作业配置 - 数据治理中心 DataArts Studio

创建DataArts Studio数据连接 - 数据治理中心 DataArts Studio

区域和可用区如何选择？ - 数据治理中心 DataArts Studio

提交表权限申请 - 数据治理中心 DataArts Studio

产品功能 - 数据治理中心 DataArts Studio

入门实践 - 数据治理中心 DataArts Studio

配置HDFS目的端参数 - 数据治理中心 DataArts Studio

新建Hadoop集群配置 - 数据治理中心 DataArts Studio

Apache HDFS数据连接参数说明 - 数据治理中心 DataArts Studio

MySQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线