搜索_华为云

创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

如果目标数据源为云下的数据库，则需要通过公网或者专线打通网络。通过公网互通时，需确保CDM集群已绑定EIP、CDM云上安全组出方向放通云下数据源所在的主机、数据源所在的主机可以访问公网且防火墙规则已开放连接端口。如果目标数据源为云上服务（如DWS、MRS及ECS等），则网络互通需满足如下条件：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
配置HDFS目的端参数 - 数据治理中心 DataArts Studio

配置HDFS目的端参数表1 HDFS作为目的端时的作业参数参数类型参数名说明取值样例基本参数写入目录写入数据到HDFS服务器的目录。 /user/cdm/output 文件格式传输数据时使用的格式。其中CSV和JSON仅支持迁移到数据表场景，二进制格式适用于文件迁移场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
在ECS上调试好的shell脚本，在DLF中shell脚本执行异常，如何处理？ - 数据治理中心 DataArts Studio

在ECS上调试好的shell脚本，在DLF中shell脚本执行异常，如何处理？问题描述在ECS上调试好的shell脚本，在DLF中shell脚本执行异常。脚本内容是通过gsql连接dws查询某库表数据行数的。 ECS调试结果： DLF脚本运行结果：图1 脚本运行结果解决方案

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
上传CDM连接驱动 - 数据治理中心 DataArts Studio

jar格式驱动。前提条件已创建集群。已参见表1下载对应的驱动。已参见FTP/SFTP连接参数说明创建SFTP连接并将对应的驱动上传至线下文件服务器（可选）。如何获取驱动不同类型的关系数据库，需要适配不同类型的驱动。注意，上传的驱动版本不必与待连接的数据库版本相匹配，直接参考表1获取建议版本的JDK8

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
基本概念 - 数据治理中心 DataArts Studio

的所有权限。每位成员至少要拥有一个角色，并且可以同时拥有多种角色。数据集成集群一个数据集成集群运行在一个弹性云服务器之上，用户可以在集群中创建数据迁移作业，在云上和云下的同构/异构数据源之间批量迁移数据。数据源即数据的来源，本质是讲存储或处理数据的媒介，比如：关系型数据库

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
配置SQLServer源端参数 - 数据治理中心 DataArts Studio

配置SQLServer源端参数支持从云端的数据库服务导出数据。这些非云服务的数据库，既可以是用户在本地数据中心自建的数据库，也可以是用户在ECS上部署的，还可以是第三方云上的数据库服务。表1 SQLServer作为源端时的作业参数参数类型参数名说明取值样例基本参数使用SQL语句

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
配置HDFS目的端参数 - 数据治理中心 DataArts Studio

作业中目的连接为HDFS连接时，目的端作业参数如表1所示。表1 HDFS作为目的端时的作业参数参数名说明取值样例写入目录写入数据到HDFS服务器的目录。该参数支持配置为时间宏变量，且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配合，可以实现定期同步新增数据，详细说明请参见使用时间宏变量完成增量同步。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
新建Hadoop集群配置 - 数据治理中心 DataArts Studio

> 现有集群”，单击集群名称进入集群详情页面，单击“组件管理”。单击“下载客户端”。“客户端类型”选择“仅配置文件”，“下载路径”选择“服务器端”或“远端主机”，自定义文件保存路径后，单击“确定”开始生成客户端配置文件。将生成的配置文件，保存到本地路径。具体可参见MapReduce服务文档。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
PostgreSQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

全量同步阶段：任务启动和全量数据同步阶段，请不要在源数据库执行DDL操作，否则可能导致任务异常。增量同步阶段：请勿修改源数据库表的主键或者唯一键（主键不存在时），否则可能导致增量数据不一致或任务失败。请勿修改源数据库中表的replica identity属性，否则可能导致增量数据不一致或任务失败。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
约束与限制 - 数据治理中心 DataArts Studio

Oracle数据源约束不支持Oracle实时增量数据同步。分布式缓存服务（DCS）和Redis数据源约束第三方云的Redis服务无法支持作为源端。如果是用户在本地数据中心或ECS上自行搭建的Redis支持作为源端或目的端。仅支持Hash和String两种数据格式。文档数据库服务（DDS）和MongoDB数据源约束

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
查询集群详情 - 数据治理中心 DataArts Studio

REBOOT_FAILURE：重启失败。 type String 节点类型，只支持一种类型“cdm”。 id String 节点的虚拟机ID。 name String 节点的虚拟机名称。 isFrozen String 节点是否冻结：0：否。1：是。 components String 组件。 config_status

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
查询集群列表 - 数据治理中心 DataArts Studio

REBOOT_FAILURE：重启失败。 type String 节点类型，只支持一种类型“cdm”。 id String 节点的虚拟机ID。 name String 节点的虚拟机名称。 isFrozen String 节点是否冻结：0：否。1：是。 components String 组件。 config_status

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
开发Python脚本 - 数据治理中心 DataArts Studio

见主机连接参数说明。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
创建数据集成作业 - 数据治理中心 DataArts Studio

ttp是80。 443 OBS桶类型用户下拉选择即可，一般选择为“对象存储”。对象存储访问标识(AK) AK和SK分别为登录OBS服务器的访问标识与密钥。您需要先创建当前账号的访问密钥，并获得对应的AK和SK。您可以通过如下方式获取访问密钥。登录控制台，在用户名下拉列表中选择“我的凭证”。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 图数据自动化构建与分析
编排API简介 - 数据治理中心 DataArts Studio

API工作流不能有环状结构，不能有孤立算子，最多支持20层深度。图1 API工作流编排页面表1 API工作流算子介绍配置入口算子是否必选介绍触发器入口API 必选入口API算子是API工作流的入口，工作流发布后可通过调用入口API来调用API工作流。在入口AP

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API
创建企业模式工作空间 - 数据治理中心 DataArts Studio

Studio实例默认工作空间关联的企业项目。企业项目管理是一种按企业项目管理云资源的方式，具体请参见《企业管理用户指南》。如果已经创建了企业项目，这里才可以选择。当DataArts Studio实例需连接云上服务（如DWS、MRS、RDS等），还必须确保DataArts Stud

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > （可选）升级企业模式工作空间
配置方式生成API - 数据治理中心 DataArts Studio

HTTP请求方式，表示请求什么类型的操作，包含GET、POST等，遵循resultful风格。 GET：请求服务器返回指定资源，推荐使用GET请求。 POST：请求服务器新增资源或执行特殊操作。POST请求当前不支持body体，而是直接透传。描述对API进行简要描述。标签

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 创建API
开发Shell脚本 - 数据治理中心 DataArts Studio

见主机连接参数说明。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
步骤3：数据集成 - 数据治理中心 DataArts Studio

步骤3：数据集成本章节将介绍如何使用DataArts Studio数据集成将源数据批量迁移到云上。创建集群批量数据迁移集群提供数据上云和数据入湖的集成能力，全向导式配置和管理，支持单表、整库、增量、周期性数据集成。DataArts Studio基础包中已经包含一个数据集成的

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
资产识别与管理 - 数据治理中心 DataArts Studio

资产识别与管理云资源的标识与管理可通过标签实现。使用场景通常您的业务系统可能使用了华为云的多种云服务，您可以为这些云服务下不同的资源实例分别设置标签（对于DataArts Studio而言，标签作用于其实例上），各服务产生的计费详单中都会体现这些资源实例和实例上设置的标签。

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍 > 安全

总条数： 311

上一页
1
...
6
7
8
...
16
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

配置HDFS目的端参数 - 数据治理中心 DataArts Studio

在ECS上调试好的shell脚本，在DLF中shell脚本执行异常，如何处理？ - 数据治理中心 DataArts Studio

上传CDM连接驱动 - 数据治理中心 DataArts Studio

基本概念 - 数据治理中心 DataArts Studio

配置SQLServer源端参数 - 数据治理中心 DataArts Studio

配置HDFS目的端参数 - 数据治理中心 DataArts Studio

新建Hadoop集群配置 - 数据治理中心 DataArts Studio

PostgreSQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

约束与限制 - 数据治理中心 DataArts Studio

查询集群详情 - 数据治理中心 DataArts Studio

查询集群列表 - 数据治理中心 DataArts Studio

开发Python脚本 - 数据治理中心 DataArts Studio

创建数据集成作业 - 数据治理中心 DataArts Studio

编排API简介 - 数据治理中心 DataArts Studio

创建企业模式工作空间 - 数据治理中心 DataArts Studio

配置方式生成API - 数据治理中心 DataArts Studio

开发Shell脚本 - 数据治理中心 DataArts Studio

步骤3：数据集成 - 数据治理中心 DataArts Studio

资产识别与管理 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线