搜索_华为云

新建衍生指标 - 数据治理中心 DataArts Studio

更新：当数据重复时系统中的原有数据为草稿状态，则会覆盖生成新的草稿数据。系统中的原有数据为发布状态，则会生成下展数据。单击“添加文件”，选择编辑完成的导入模板。单击“上传文件”，上传完成后，自动跳转到“上次导入”页签，查看已导入的数据。单击“关闭”。导出可通过导出的方式将衍生指标导出到本地。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 指标设计 > 技术指标
新建数据表 - 数据治理中心 DataArts Studio

数据表所属的数据连接。系统默认。数据库是数据表所属的数据库。系统默认。数据位置是选择数据存储的位置： OBS DLI 数据格式是选择数据的格式。“数据位置”为“OBS”时，配置该参数。 parquet：支持读取不压缩、snappy压缩、gzip压缩的parquet数据。 csv：支持读取不压缩、gzip压缩的csv数据。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 数据管理
查询作业详情 - 数据治理中心 DataArts Studio

选择对应的连接名称与topic，当有新的kafka消息时将会触发作业运行一次配置为：KAFKA 事件类型，当前只支持监听DIS通道的新上报数据事件，每上报一条数据，触发作业运行一次。配置为：DIS 选择要监听的OBS路径，如果该路径下有新增文件，则触发调度；新增的文件的路径名，可以通过变量Job

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
参考：作业分片维度 - 数据治理中心 DataArts Studio

Apache Hive HDFS读取方式时，支持按Hive文件分片。 JDBC读取方式时，不支持分片。对象存储对象存储服务（OBS）支持按文件分片。文件系统 FTP 支持按文件分片。 SFTP 支持按文件分片。 HTTP 支持按文件分片。关系型数据库云数据库 MySQL 支持按表字段分片。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
通过数据开发实现数据增量迁移 - 数据治理中心 DataArts Studio

Studio服务的DLF组件提供了一站式的大数据协同开发平台，借助DLF的在线脚本编辑、周期调度CDM的迁移作业，也可以实现增量数据迁移。这里以DWS导入到OBS为例，介绍DLF配合CDM实现增量迁移的流程：获取CDM作业的JSON 修改JSON 创建DLF作业获取CDM作业的JSON

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
支持的数据类型 - 数据治理中心 DataArts Studio

smallint类型的数据占用了两个字节的存储空间，其中一个二进制位表示整数值的正负号，其它15个二进制位表示长度和大小，可以表示-2的15次方~2的15次方-1范围内的所有整数。 SMALLINT SMALLINT NUMBER tinyint tinyint类型的数据占用了一个字节的存储空

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
配置方式生成API - 数据治理中心 DataArts Studio

一个特定功能或场景的API集合，类似文件夹，指定当前API保存的位置，后续可以在指定的API目录中检索当前API。 API目录是数据服务中API的最小组织单元。您可以选择新建API目录已创建的目录。请求Path API访问路径，例如：/getUserInfo。请求Path即完整的URL中

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 创建API
数据迁移进阶实践 - 数据治理中心 DataArts Studio

数据迁移进阶实践增量迁移原理介绍时间宏变量使用解析事务模式迁移迁移文件时加解密 MD5校验文件一致性字段转换器配置指导新增字段操作指导指定文件名迁移正则表达式分隔半结构化文本记录数据迁移入库时间文件格式介绍不支持数据类型转换规避指导

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
配置RestApi源端参数 - 数据治理中心 DataArts Studio

{"namePrefix":"test"} 每次拉取的数量每次拉取的数量。是 1000 分页大小参数名称分页大小参数名称。默认会放到query参数中，它的值为每次拉取的数量。如果body参数中包含此参数名，则会将它的值替换为每次拉取的数量。是 pageSize 分页页码参数名称

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

128GB 128 图1 集群最大抽取并发数配置作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。作业抽取并发数可参考集群最大抽取并发数配置，但不建议超过集群最大抽取并发数上限。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
通过API工具调用APP认证方式的API - 数据治理中心 DataArts Studio

通过API工具调用APP认证方式的API APP认证方式的API接口可以分别绑定不同的应用，安全级别最高。如果您需要API工具调用APP认证方式的API，则需要先通过JavaScript SDK包中的demo.html手动生成认证信息，再使用API工具调用。本章节以Postma

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API > 通过不同方式调用API
关键操作指导 - 数据治理中心 DataArts Studio

关键操作指导增量迁移原理介绍事务模式迁移迁移文件时加解密 MD5校验文件一致性字段转换器配置指导新增字段操作指导指定文件名迁移正则表达式分隔半结构化文本记录数据迁移入库时间文件格式介绍不支持数据类型转换规避指导自动建表原理介绍父主题：数据集成（CDM作业）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

128GB 128 图1 集群最大抽取并发数配置作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。作业抽取并发数可参考集群最大抽取并发数配置，但不建议超过集群最大抽取并发数上限。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
配置Kafka/DMS Kafka源端参数 - 数据治理中心 DataArts Studio

从Kafka拉取数据时的初始偏移量：最新：最大偏移量，即拉取最新的数据。最早：最小偏移量，即拉取最早的数据。已提交：拉取已提交的数据。时间范围：拉取时间范围内的数据。最新抽取数据最大运行时间持续拉取数据时间。如天调度作业，根据每天topic产生的数据量，配置足够的拉取时间。单位：分钟。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
新建DataArts Studio与MySQL数据库的连接 - 数据治理中心 DataArts Studio

数据库的用户名，创建集群的时候，输入的用户名。密码是数据库的访问密码，创建集群的时候，输入的密码。数据集成配置数据库名称是配置为要连接的数据库名称。使用本地API 否可选参数，选择是否使用数据库本地API加速。创建MySQL连接时，CDM会自动尝试启用MySQL数据库的local_

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 管理中心典型场景教程
GBase数据连接参数说明 - 数据治理中心 DataArts Studio

定已上传的驱动文件。数据源认证及其他功能配置用户名是数据库的用户名，创建集群的时候，输入的用户名。密码是数据库的访问密码，创建集群的时候，输入的密码。数据集成配置数据库名称是配置为要连接的数据库名称。单次请求行数否可选参数，指定每次请求获取的行数，根据

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
数据集成概述 - 数据治理中心 DataArts Studio

支持当CDM作业执行失败时，将数据回滚到作业开始之前的状态，自动清理目的表中的数据。字段转换支持去隐私、字符串操作、日期操作等常用字段的数据转换功能。文件加密在迁移文件到文件系统时，CDM支持对写入云端的文件进行加密。 MD5校验一致性支持使用MD5校验，检查端到端文件的一致性，并输出校验结果。脏数据归档

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
API管理接口 - 数据治理中心 DataArts Studio

约) 查看API发布信息(专享版) 查看API不同操作对应的实例信息(专享版) 查看API调试信息(专享版) 导入包含API信息的EXCEL文件导出包含API信息的EXCEL文件全量导出包含API的EXCEL压缩文件下载EXCEL模板父主题：数据服务API

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API
执行Python脚本，报错“UnicodeEncodeError :‘ascii' codec cant encode characters in position 63-64 : ordinal not in range ( 128 )”怎么处理？ - 数据治理中心 DataArts Studio

在文件中设置标准编码方式。 # -*- coding: utf-8 -*-；或者设置主机的编码格式：在python安装目录的Lib\site-packages文件夹下新建一个sitecustomize.py文件，在文件中写入如下内容。 # encoding=utf8 #import sys #reload(sys)

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
批量导出作业 - 数据治理中心 DataArts Studio

"exportDepend":true } 响应示例成功响应响应消息的Content-Type是application/octet-stream，需要解析转化为一个文件，可以参考解析响应消息体中的流样例代码。响应是一个压缩文件，文件名为jobs.zip，解压后文件结构如下： jobs +---job_batch

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API

总条数： 1467

上一页
1
...
9
10
11
...
74
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新建衍生指标 - 数据治理中心 DataArts Studio

新建数据表 - 数据治理中心 DataArts Studio

查询作业详情 - 数据治理中心 DataArts Studio

参考：作业分片维度 - 数据治理中心 DataArts Studio

通过数据开发实现数据增量迁移 - 数据治理中心 DataArts Studio

支持的数据类型 - 数据治理中心 DataArts Studio

配置方式生成API - 数据治理中心 DataArts Studio

数据迁移进阶实践 - 数据治理中心 DataArts Studio

配置RestApi源端参数 - 数据治理中心 DataArts Studio

CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

通过API工具调用APP认证方式的API - 数据治理中心 DataArts Studio

关键操作指导 - 数据治理中心 DataArts Studio

CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

配置Kafka/DMS Kafka源端参数 - 数据治理中心 DataArts Studio

新建DataArts Studio与MySQL数据库的连接 - 数据治理中心 DataArts Studio

GBase数据连接参数说明 - 数据治理中心 DataArts Studio

数据集成概述 - 数据治理中心 DataArts Studio

API管理接口 - 数据治理中心 DataArts Studio

执行Python脚本，报错“UnicodeEncodeError :‘ascii' codec cant encode characters in position 63-64 : ordinal not in range ( 128 )”怎么处理？ - 数据治理中心 DataArts Studio

批量导出作业 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线