搜索_华为云

DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

配置源端参数。选择需要同步的Kafka Topic，各同步场景下选择需要同步主题的方式请参考下表。表5 选择需要同步的主题同步场景配置方式单表输入一个需要迁移的Kafka Topic。图4 输入Kafka Topic 整库选择需要迁移的Kafka Topic。图5

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
步骤3：数据集成 - 数据治理中心 DataArts Studio

取值样例名称连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。 obs_link OBS终端节点终端节点（Endpoint）即调用API的请求地址，不同服务不同区域的终端节点不同。您可以通过以下方式获取OBS桶的Endpoint信息： OBS桶的Endpoin

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
通过DataArts Studio调度大数据服务时需要注意什么？ - 数据治理中心 DataArts Studio

Studio调度大数据服务时，需要注意的地方需要说明一下。解决方案 DLI和MRS作为大数据服务，不具备锁管理的能力。因此如果同时对表进行读和写操作时，会导致数据冲突、操作失败。如果您需要对大数据服务数据表进行读表和写表操作，建议参考以下方式之一进行串行操作处理：将读表和写表操作拆分为同一作业的不同节点

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
申请与审批权限（部分高级特性） - 数据治理中心 DataArts Studio

级数据的权限申请设置不同的审批流程。值得注意的是，审批策略为DataArts Studio实例级别配置，各工作空间之间数据互通，全局可见并生效。在DataArts Studio控制台首页，选择对应工作空间的“数据安全”模块，进入数据安全页面。单击数据安全左侧导航树中的“权限审批”，进入权限审批页面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > 数据权限访问控制
管理员操作 - 数据治理中心 DataArts Studio

Spark数据源，如果使用一套相同的集群，则需要配置数据源资源映射的DB数据库映射关系进行开发生产环境隔离。数据准备与同步：数据湖服务创建完成后，您需要按照项目规划（例如数据开发需要操作的库表等），分别在开发和生产环境的数据湖服务中，新建数据库、数据库模式（仅DWS需要）、数据表等。对于集群化的数据源

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > （可选）升级企业模式工作空间 > 企业模式角色操作
节点概述 - 数据治理中心 DataArts Studio

节点概述节点定义对数据执行的操作。数据开发模块提供数据集成、计算&分析、数据库操作、资源管理等类型的节点，您可以根据业务模型选择所需的节点。节点的参数支持使用EL表达式，EL表达式的使用方法详见表达式概述。节点间的连接方式支持串行和并行。串行连接：按顺序逐个执行节点，当A节点执行完成后，再执行B节点。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
目的端为OBS - 数据治理中心 DataArts Studio

该参数。选择“是”后，迁移对象文件时会复制源文件的Content-Type属性，主要用于静态网站的迁移场景。归档存储的桶不支持设置Content-Type属性，所以如果开启了该参数，目的端选择写入的桶时，必须选择非归档存储的桶。 toJobConfig.quoteChar 否

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
步骤3：数据开发处理 - 数据治理中心 DataArts Studio

本步骤通过电影信息和评分信息的原始数据，分析评分最高的Top10电影和最活跃的Top10电影，然后通过作业定期调度执行并将结果每日导出到表中，以支撑信息分析。创建DWS SQL脚本top_rating_movie（用于存放评分最高的Top10电影）评分最高Top10电影的计算方法是：先计

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 初级版：基于DWS的电影评分数据集成与开发流程
上传增量数据 - 数据治理中心 DataArts Studio

这样CDM每天凌晨自动执行全量迁移，但因为“重复文件处理方式”选择了“跳过重复文件”，相同名称且相同大小的文件不迁移，所以只会上传每天新增的文件。单击“保存”，完成CDM的增量同步配置。父主题：使用CDM上传数据到OBS

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 贸易数据极简上云与统计分析 > 使用CDM上传数据到OBS
步骤1：数据准备 - 数据治理中心 DataArts Studio

称为对应的数据表名，将后文提供的各样例数据分别复制粘贴到不同CSV文件中，然后保存CSV文件。以下是Windows下生成.csv文件的办法之一：使用文本编辑工具（例如记事本等）新建一个txt文档，将后文提供的样例数据复制进文档中。注意复制后检查数据的行数及数据分行的正确性（注

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 初级版：基于DWS的电影评分数据集成与开发流程
MySQL同步到Kafka作业配置 - 数据治理中心 DataArts Studio

为数据库账号密码修改，导致的任务连接失败。连接源和目标数据库的账号密码修改后，请同步修改管理中心对应的连接信息，避免任务连接失败后自动重试，导致数据库账号被锁定影响使用。支持的同步对象范围在使用Migration进行同步时，不同类型的链路，支持的同步对象范围不同，详细情况可参考下表。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
获取当前目录下的所有类型列表 - 数据治理中心 DataArts Studio

用户Token，使用Token认证时必选。通过调用IAM服务的“获取用户Token”接口获取响应消息头中X-Subject-Token的值。 workspace 是 String 工作空间ID，获取方法请参见实例ID和工作空间ID。 Dlm-Type 否 String 数据服务的版本类型，指定SHARED共享版或EXCLUSIVE专享版。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > 服务目录管理接口
创建MySQL连接器 - 数据治理中心 DataArts Studio

在“驱动管理”页面中，选择以下方式上传MySQL驱动。方式一：单击对应驱动名称右侧操作列的“上传”，选择本地已下载的驱动。方式二：单击对应驱动名称右侧操作列的“从sftp复制”，配置sftp连接器名称和驱动文件路径。在“集群管理”界面，单击集群后的“作业管理”，选择“连接管理

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
Shell - 数据治理中心 DataArts Studio

Sessions的配置值确定。请根据Shell或Python脚本的调度频率合理配置MaxSessions的值。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell和Python脚本都是发往ECS主机的/tmp目录下去运行的，需要确保/tmp目录磁盘不被占满。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
获取当前目录下的目录列表（全量） - 数据治理中心 DataArts Studio

获取当前目录下的目录列表（全量）功能介绍获取当前目录下的目录列表（全量数据，不分页，推荐仅用于生成目录树等无法分页的场景）。调用方法请参见如何调用API。 URI GET /v1/{project_id}/service/servicecatalogs/{catalog_id}/catalogs

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > 服务目录管理接口
更新表的异常数据输出配置 - 数据治理中心 DataArts Studio

REJECT: 已驳回 logic_tb_id String 逻辑实体的ID，ID字符串。 biz_catalog_id String 归属的业务分类的id，ID字符串。 catalog_path String 归属的业务分类的路径 {"l1Id":"","l2Id":"","l3Id":""}。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 质量规则接口
新建复合指标 - 数据治理中心 DataArts Studio

在数据架构控制台，单击左侧导航树的“技术指标”，然后选择“复合指标”页签，进入复合指标页面。在复合指标列表中，勾选需要删除的复合指标，单击列表上方的“更多 >删除”按钮，系统弹出“删除”对话框。单击“确定”。导入复合指标可通过导入的方式将复合指标批量快速的导入到系统中。在复合指标列表上方，单击“更多

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 指标设计 > 技术指标
数据血缘方案简介 - 数据治理中心 DataArts Studio

可追溯性：数据的血缘关系，体现了数据的生命周期，体现了数据从产生到消亡的整个过程，具备可追溯性。层次性：数据的血缘关系是有层次的。对数据的分类、归纳、总结等对数据进行的描述信息又形成了新的数据，不同程度的描述信息形成了数据的层次。 DataArts Studio生成的血缘关系图如图1所示，为数据表对象，为

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考 > 节点数据血缘
DWS SQL - 数据治理中心 DataArts Studio

挂起当前作业执行计划：当前作业实例的状态为运行异常，该节点的后续节点以及依赖于当前作业的后续作业实例都会处于等待运行状态。是否空跑否如果勾选了空跑，该节点不会实际执行，将直接返回成功。任务组否选择任务组。任务组配置好后，可以更细粒度的进行当前任务组中的作业节点的并发数控制，比如作业中包含多个节点、补数据、重跑等场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
数据血缘方案简介 - 数据治理中心 DataArts Studio

可追溯性：数据的血缘关系，体现了数据的生命周期，体现了数据从产生到消亡的整个过程，具备可追溯性。层次性：数据的血缘关系是有层次的。对数据的分类、归纳、总结等对数据进行的描述信息又形成了新的数据，不同程度的描述信息形成了数据的层次。 DataArts Studio生成的血缘关系图如图1所示，为数据表对象，为

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系

总条数： 596

上一页
1
...
7
8
9
...
30
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

步骤3：数据集成 - 数据治理中心 DataArts Studio

通过DataArts Studio调度大数据服务时需要注意什么？ - 数据治理中心 DataArts Studio

申请与审批权限（部分高级特性） - 数据治理中心 DataArts Studio

管理员操作 - 数据治理中心 DataArts Studio

节点概述 - 数据治理中心 DataArts Studio

目的端为OBS - 数据治理中心 DataArts Studio

步骤3：数据开发处理 - 数据治理中心 DataArts Studio

上传增量数据 - 数据治理中心 DataArts Studio

步骤1：数据准备 - 数据治理中心 DataArts Studio

MySQL同步到Kafka作业配置 - 数据治理中心 DataArts Studio

获取当前目录下的所有类型列表 - 数据治理中心 DataArts Studio

创建MySQL连接器 - 数据治理中心 DataArts Studio

Shell - 数据治理中心 DataArts Studio

获取当前目录下的目录列表（全量） - 数据治理中心 DataArts Studio

更新表的异常数据输出配置 - 数据治理中心 DataArts Studio

新建复合指标 - 数据治理中心 DataArts Studio

数据血缘方案简介 - 数据治理中心 DataArts Studio

DWS SQL - 数据治理中心 DataArts Studio

数据血缘方案简介 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线