搜索_华为云

数据集成 - 数据治理中心 DataArts Studio

CDM可以跨账户使用吗？ CDM集群是否支持升级操作？ CDM迁移性能如何？ CDM不同集群规格对应并发的作业数是多少？是否支持增量迁移？是否支持字段转换？ Hadoop类型的数据源进行数据迁移时，建议使用的组件版本有哪些？数据源为Hive时支持哪些数据格式？是否支持同步作业到其他集群？

帮助中心 > 数据治理中心 DataArts Studio > 常见问题
获取实例列表 - 数据治理中心 DataArts Studio

String 资源类型，hws.resource.type.dayu。 resource_spec_code String 产品规格编码(即实例类型编码)，例如dayu.starter，dayu.basic，dayu.advanced等。可通过查询其他实例信息进行获取。 product_id

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 管理中心API > 实例管理
配置OBS目的端参数 - 数据治理中心 DataArts Studio

数值无效。 , 写入文件大小源端为数据库时该参数才显示，支持按大小分成多个文件存储，避免导出的文件过大，单位为MB。 1024 编码类型文件编码类型，例如：“UTF-8”或“GBK”。“文件格式”为“二进制格式”时该参数值无效。 GBK 首行为标题行从关系型数据库导出数据到

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发 > 配置作业目的端参数
配置OBS目的端参数 - 数据治理中心 DataArts Studio

的桶下。 obslink OBS桶写入MD5校验结果的OBS桶。 cdm05 写入目录写入MD5校验结果的目录。 /md5/ 编码类型文件编码类型，例如：“UTF-8”或“GBK”。“文件格式”为“二进制格式”时该参数值无效。 GBK 使用包围符 “文件格式”为“CSV格式

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
配置Elasticsearch/云搜索服务（CSS）目的端参数 - 数据治理中心 DataArts Studio

类型。此处即使自定义也不会生效。 type 管道ID 该参数用于数据传到Elasticsearch后，通过Elasticsearch的数据转换pipeline进行数据格式变换。目的端为Elasticsearch时需要先在kibana中创建管道ID。目的端为CSS时不需要创建管

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
步骤8：数据资产查看 - 数据治理中心 DataArts Studio

步骤8：数据资产查看在DataArts Studio数据目录模块中，您可以查看数据地图，详情请参见数据目录章节。数据地图包含业务资产和技术资产，业务资产就是指逻辑实体和业务对象，技术资产就是指数据连接、数据库对象等。本章节介绍如何在DataArts Studio数据目录中查看

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
逆向数据库（关系建模） - 数据治理中心 DataArts Studio

下拉选择Schema。该参数仅DWS和POSTGRESQL模型的表有效。更新已有表在导入时，如果所要导入的表在关系模型中已存在，是否更新已有的表。在导入时，系统将按表编码进行判断将要导入的表在当前的关系模型中是否已存在。在导入时，只有创建或更新操作，不会删除已有的表。不更新：如果表已存在，将直接跳过，不更新。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 通用操作
配置HBase/CloudTable目的端参数 - 数据治理中心 DataArts Studio

造成数据丢失。否匹配数据类型是：源端数据库中的Short、Int、Long、Float、Double、Decimal类型列的数据，会转换为Byte[]数组（二进制）写入HBase，其他类型的按字符串写入。如果这几种类型中，有合并做rowkey的，则依然当字符串写入。该功能

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
时间宏变量使用解析 - 数据治理中心 DataArts Studio

eformat(yyyy-MM-dd)}”。目的端的“写入目录”配置为“/opt/ttxx/${timestamp()}”。经过宏定义转换，这个作业表示：将Oracle数据库的“SQOOP.CDM_20171016”表中数据，迁移到HDFS的“/opt/ttxx/1508115701746”目录中。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
时间宏变量使用解析 - 数据治理中心 DataArts Studio

eformat(yyyy-MM-dd)}”。目的端的“写入目录”配置为“/opt/ttxx/${timestamp()}”。经过宏定义转换，这个作业表示：将Oracle数据库的“SQOOP.CDM_20171016”表中数据，迁移到HDFS的“/opt/ttxx/1508115701746”目录中。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成
数据开发概述 - 数据治理中心 DataArts Studio

支持管理DWS、DLI、MRS Hive等多种数据仓库。支持可视化和DDL方式管理数据库表。脚本开发提供在线脚本编辑器，支持多人协作进行SQL、Shell、Python脚本在线代码开发和调测。支持使用变量和函数。作业开发提供图形化设计器，支持拖拉拽方式快速构建数据处理工作流。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
查看关系详情 - 数据治理中心 DataArts Studio

RelationVO object value，统一的返回结果的外层数据结构。表6 RelationVO 参数参数类型描述 id String 编码，ID字符串。 source_table_id String 源表ID，ID字符串。 target_table_id String 目标表ID，ID字符串。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 关系建模接口
如何将云下内网或第三方云上的私网与CDM连通？ - 数据治理中心 DataArts Studio

在的主机、数据源所在的主机可以访问公网且防火墙规则已开放连接端口。在本地数据中心和云服务VPC之间建立VPN通道。通过NAT（网络地址转换，Network Address Translation）或端口转发，以代理的方式访问。这里重点介绍如何通过端口转发工具来实现访问内部数据，流程如下：

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成
源端为DMS Kafka，目的端为OBS - 数据治理中心 DataArts Studio

__partition__ __offset__ _timestamp__ 手动赋值 - udf方法支持填写Flink的内置函数用于数据转换。例如：CONCAT(CAST(NOW() as STRING), `col_name`)、DATE_FORMAT(NOW(), 'yy')。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 实时处理集成作业开发 > 配置源端和目标端参数
目的端为OBS - 数据治理中心 DataArts Studio

recordMD5Directory 否 String 写入MD5校验结果的目录。 toJobConfig.encodeType 否 String 编码类型，例如：“UTF_8”或“GBK”。 toJobConfig.markerFile 否 String 当作业执行成功时，会在写入目录下

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
配置ElasticSearch目的端参数 - 数据治理中心 DataArts Studio

管道ID 需要先在kibana中创建管道ID，这里才可以选择，该参数用于数据传到Elasticsearch后，通过Elasticsearch的数据转换pipeline进行数据格式变换。 pipeline_id 开启路由开启路由后，支持指定某一列的值作为路由写入Elasticsearch。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发 > 配置作业目的端参数
新建复合指标 - 数据治理中心 DataArts Studio

导入”，进入“导入配置”页签。图3 导入复合指标下载复合指标导入模板，编辑完成后保存至本地。选择是否更新已有数据。如果系统中已有的编码和模板中的编码相同，系统则认为是数据重复。不更新：当数据重复时，不会替换系统中原有的数据。更新：当数据重复时系统中的原有数据为草稿状态，则会覆盖生成新的草稿数据。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 指标设计 > 技术指标
创建码表 - 数据治理中心 DataArts Studio

"", "code_table_fields" : [ { "ordinal" : 1, "name_ch" : "编码", "name_en" : "code", "data_type" : "STRING", "description"

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 码表管理接口
配置脱敏策略 - 数据治理中心 DataArts Studio

面进行选择，这里不再赘述。配置完成后单击“确定”。已被绑定脱敏算法的分类规则不支持被重复绑定。图1 新建脱敏适配脱敏算法后，支持用户在线进行测试。输入测试数据，单击“测试”，在测试结果文本框中进行验证。开启或关闭状态，只有启用状态下的脱敏策略才可生效。查看数据脱敏效果在DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 配置数据安全策略（待下线）
修改码表 - 数据治理中心 DataArts Studio

"", "code_table_fields" : [ { "ordinal" : 1, "name_ch" : "编码", "name_en" : "code", "data_type" : "STRING", "description"

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 码表管理接口

总条数： 690

上一页
1
...
10
11
12
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据集成 - 数据治理中心 DataArts Studio

获取实例列表 - 数据治理中心 DataArts Studio

配置OBS目的端参数 - 数据治理中心 DataArts Studio

配置OBS目的端参数 - 数据治理中心 DataArts Studio

配置Elasticsearch/云搜索服务（CSS）目的端参数 - 数据治理中心 DataArts Studio

步骤8：数据资产查看 - 数据治理中心 DataArts Studio

逆向数据库（关系建模） - 数据治理中心 DataArts Studio

配置HBase/CloudTable目的端参数 - 数据治理中心 DataArts Studio

时间宏变量使用解析 - 数据治理中心 DataArts Studio

时间宏变量使用解析 - 数据治理中心 DataArts Studio

数据开发概述 - 数据治理中心 DataArts Studio

查看关系详情 - 数据治理中心 DataArts Studio

如何将云下内网或第三方云上的私网与CDM连通？ - 数据治理中心 DataArts Studio

源端为DMS Kafka，目的端为OBS - 数据治理中心 DataArts Studio

目的端为OBS - 数据治理中心 DataArts Studio

配置ElasticSearch目的端参数 - 数据治理中心 DataArts Studio

新建复合指标 - 数据治理中心 DataArts Studio

创建码表 - 数据治理中心 DataArts Studio

配置脱敏策略 - 数据治理中心 DataArts Studio

修改码表 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线