搜索_华为云

CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

CDM迁移作业的抽取并发数应该如何设置？ CDM通过数据迁移作业，将源端数据迁移到目的端数据源中。其中，主要运行逻辑如下：数据迁移作业提交运行后，CDM会根据作业配置中的“抽取并发数”参数，将每个作业拆分为多个Task，即作业分片。不同源端数据源的作业分片维度有所不同，因此某

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
Kafka连接 - 数据治理中心 DataArts Studio

Kafka连接介绍通过Kafka连接器可以与开源的Kafka数据源建立连接，并按照用户指定配置将Kafka中的数据迁移到其它数据源。目前仅支持从Kafka导出数据。连接样例 { "links": [ { "link-config-values":

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
同步MRS Hive和Hetu权限 - 数据治理中心 DataArts Studio

从下拉列表中选择数据连接类型中已创建的数据连接，若未创建请参考创建DataArts Studio数据连接新建连接。注意，所选择的Hetu连接所在的集群应与Hive连接所在的集群一致。集群名称无需选择，自动匹配数据连接中的数据源集群。 *Catalog Hetu上的数据源名称，本集群的Hive数据源名称默

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > 数据权限访问控制
管理样本库 - 数据治理中心 DataArts Studio

管理样本库数据安全支持将您提供的OBS或HDFS样本文件生成样本库。当新建随机脱敏或字符替换类型的脱敏算法时，可以选择将敏感数据脱敏为样本库文件中的值，详见新建脱敏算法。本章主要介绍如何创建样本。前提条件已在OBS或HDFS中上传样本文件。样本文件只支持txt格式，大小建议不

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 静态脱敏任务
正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

文件格式”必须选择“CSV格式”。图1 正则表达式参数在迁移CSV格式的文件时，CDM支持使用正则表达式分隔字段，并按照解析后的结果写入目的端。正则表达式语法请参考对应的相关资料，这里举例下面几种日志文件的正则表达式的写法： Log4J日志 Log4J审计日志 Tomcat日志

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

文件格式”必须选择“CSV格式”。图1 正则表达式参数在迁移CSV格式的文件时，CDM支持使用正则表达式分隔字段，并按照解析后的结果写入目的端。正则表达式语法请参考对应的相关资料，这里举例下面几种日志文件的正则表达式的写法： Log4J日志 Log4J审计日志 Tomcat日志

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
示例场景说明 - 数据治理中心 DataArts Studio

准备工作，包括使用DataArts Studio前的准备、数据源准备和数据湖准备。数据开发，包含创建DLI SQL脚本和开发作业。分析10大用户关注最多的产品分析10大用户评价最差的商品开发并调度作业，通过编排作业和配置作业调度策略，定期执行作业，使得用户可以每天获取到最新的数据分析结果。服务退订，如果不再使用DataArts

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程
数据集成概述 - 数据治理中心 DataArts Studio

支持当CDM作业执行失败时，将数据回滚到作业开始之前的状态，自动清理目的表中的数据。字段转换支持去隐私、字符串操作、日期操作等常用字段的数据转换功能。文件加密在迁移文件到文件系统时，CDM支持对写入云端的文件进行加密。 MD5校验一致性支持使用MD5校验，检查端到端文件的一致性，并输出校验结果。脏数据归档

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
月周期的作业依赖天周期的作业，为什么天周期作业还未跑完，月周期的作业已经开始运行？ - 数据治理中心 DataArts Studio

月周期的作业依赖天周期的作业，为什么天周期作业还未跑完，月周期的作业已经开始运行？可能原因月周期的作业依赖天周期的作业，依赖的是上个月的天周期作业是否全部运行完成，周期调度依赖原理的理解有误导致的。如下图，月周期的作业依赖天周期的作业。为什么在天周期的作业还未跑完，月周期的作业已经开始运行？

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

CDM不同集群规格对应并发的作业数是多少？ CDM通过数据迁移作业，将源端数据迁移到目的端数据源中。其中，主要运行逻辑如下：数据迁移作业提交运行后，CDM会根据作业配置中的“抽取并发数”参数，将每个作业拆分为多个Task，即作业分片。不同源端数据源的作业分片维度有所不同，因此

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
源端为对象存储 - 数据治理中心 DataArts Studio

传输数据时所用的文件格式，目前支持以下文件格式： CSV_FILE：CSV格式，用于迁移文件到数据表的场景。 JSON_FILE：JSON格式，一般都是用于迁移文件到数据表的场景。 BINARY_FILE：二进制格式，不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
基本概念 - 数据治理中心 DataArts Studio

在云上和云下的同构/异构数据源之间批量迁移数据。数据源即数据的来源，本质是讲存储或处理数据的媒介，比如：关系型数据库、数据仓库、数据湖等。每一种数据源不同，其数据的存储、传输、处理和应用的模式、场景、技术和工具也不相同。源数据源数据强调数据状态是“创建”之后的“原始状态”

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
面向的读者 - 数据治理中心 DataArts Studio

面向的读者本文面向的读者包括：企事业各级管理人员、参与数据工作的相关人员、工具平台开发维护的相关人员等。

帮助中心 > 数据治理中心 DataArts Studio > 数据治理方法论
开发SQL脚本 - 数据治理中心 DataArts Studio

enabled（启用AQE用于倾斜的连接操作，可以通过自动检测倾斜的数据并相应地优化连接算法来提高性能） spark.sql.mergeSmallFiles.enabled（启用合并小文件功能，可以通过将小文件合并成较大的文件来提高性能，可以减少处理许多小文件的时间，并通过减少需要从远程存储中读取的文件数量来提高数据本地性。）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
Redis数据连接参数说明 - 数据治理中心 DataArts Studio

Redis部署方式为Single时的必选项。类似关系数据库的数据库名称。例如：0。配置文件路径是认证类型为KERBEROS时显示该参数。集群配置文件的OBS存放路径。 keytab文件路径是认证类型为KERBEROS时显示该参数。配置keytab文件的OBS存放路径。 Principal名称

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
数据架构中的指标与数据质量的指标的区别？ - 数据治理中心 DataArts Studio

数据架构中的指标与数据质量的指标的区别？问题描述数据架构中的指标与数据质量的指标的区别，需要具体说明一下，便于用户理解。解决方案数据架构中指标侧重业务维度，用来衡量目标总体特征的统计数值；数据质量中指标侧重监控维度，用来管理所有业务指标，包括指标的来源、定义等。注意，数

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据架构
步骤1：数据准备 - 数据治理中心 DataArts Studio

创建CSV文件（UTF-8无bom格式），文件名称为对应的数据表名，将后文提供的各样例数据分别复制粘贴到不同CSV文件中，然后保存CSV文件。以下是Windows下生成.csv文件的办法之一：使用文本编辑工具（例如记事本等）新建一个txt文档，将后文提供的样例数据复制进文档中。注意复制后检查数据的行数及数据

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程
免费版：基于DLI的电商BI报表数据开发流程 - 数据治理中心 DataArts Studio

免费版：基于DLI的电商BI报表数据开发流程示例场景说明步骤1：数据准备步骤2：数据开发处理步骤3：服务退订

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门
迁移作业原理 - 数据治理中心 DataArts Studio

通过公网互通时，网络带宽受到公网带宽的限制。CDM侧公网带宽规格受限于CDM集群所绑定的弹性公网IP，数据源侧受限于其所访问的公网带宽规格。通过VPN、NAT或专线互通时，网络带宽受到VPN、NAT或专线带宽的限制。目的端写入性能取决于目的端数据源的性能。如需优化，请参见目的端数据源的相关说明文档。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
管理动态脱敏策略 - 数据治理中心 DataArts Studio

无需选择，自动匹配数据连接中的数据源集群。 *数据库选择敏感数据所在的数据库。 *schema 选择敏感数据所在的schema。 *数据表选择敏感数据所在的数据表。 *数据列您需要勾选一个或多个待脱敏列，并根据不同数据列的数据类型，选择合适的脱敏规则。各类数据源中不同数据类型支持的脱敏规则不同，详见参考：动态脱敏规则介绍。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 动态脱敏任务

总条数： 1656

上一页
1
...
6
7
8
...
83
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

Kafka连接 - 数据治理中心 DataArts Studio

同步MRS Hive和Hetu权限 - 数据治理中心 DataArts Studio

管理样本库 - 数据治理中心 DataArts Studio

正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

示例场景说明 - 数据治理中心 DataArts Studio

数据集成概述 - 数据治理中心 DataArts Studio

月周期的作业依赖天周期的作业，为什么天周期作业还未跑完，月周期的作业已经开始运行？ - 数据治理中心 DataArts Studio

CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

源端为对象存储 - 数据治理中心 DataArts Studio

基本概念 - 数据治理中心 DataArts Studio

面向的读者 - 数据治理中心 DataArts Studio

开发SQL脚本 - 数据治理中心 DataArts Studio

Redis数据连接参数说明 - 数据治理中心 DataArts Studio

数据架构中的指标与数据质量的指标的区别？ - 数据治理中心 DataArts Studio

步骤1：数据准备 - 数据治理中心 DataArts Studio

免费版：基于DLI的电商BI报表数据开发流程 - 数据治理中心 DataArts Studio

迁移作业原理 - 数据治理中心 DataArts Studio

管理动态脱敏策略 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线