搜索_华为云

Apache Hive数据连接参数说明 - 数据治理中心 DataArts Studio

数据连接的名称，只能包含字母、数字、下划线和中划线，且长度不超过100个字符。标签否标识数据连接的属性。设置标签后，便于统一管理。说明：标签的名称，只能包含中文、英文字母、数字和下划线，不能以下划线开头，且长度不能超过100个字符。适用组件是选择此连接适用的组件。勾选组件后，才能在相应组件内使用本连接。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
CDM有哪些优势？ - 数据治理中心 DataArts Studio

并行化处理技术，使用CDM迁移数据的优势如表1所示。表1 CDM优势优势项用户自行开发 CDM 易使用自行准备服务器资源，安装配置必要的软件并进行配置，等待时间长。程序在读写两端会根据数据源类型，使用不同的访问接口，一般是数据源提供的对外接口，例如JDBC、原生API等

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
CDM与其他数据迁移服务有什么区别，如何选择？ - 数据治理中心 DataArts Studio

Migration，简称CDM）是一种高效、易用的数据集成服务。CDM围绕大数据迁移上云和智能数据湖解决方案，提供了简单易用的迁移能力和多种数据源到数据湖的集成能力，降低了客户数据源迁移和集成的复杂性，有效的提高您数据迁移和集成的效率。更多详情请参见云数据迁移服务。 CDM进行数

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
Apache Kafka到MRS Kafka参数调优 - 数据治理中心 DataArts Studio

消费Kafka时服务器将返回的每个分区的最大字节数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。 properties.max.poll.records int 500 消费者每次poll时返回的最大消息条数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
配置离线处理集成作业 - 数据治理中心 DataArts Studio

标端对应类型的字段中。字段映射配置：选择字段映射关系、设置字段批量映射规则。字段映射关系同名映射：对字段名称相同的字段进行映射。使用已有数据进行相同列名的字段自动映射。同行映射：源表和目标表的字段名称不一致，但字段对应相同行的数据进行映射。查询源端和目的端的字段，再进行相同行的字段自动映射。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
ORACLE数据连接参数说明 - 数据治理中心 DataArts Studio

cle连接。数据源认证及其他功能配置用户名是待连接数据库的用户。该数据库用户需要有数据表的读写权限，以及对元数据的读取权限。说明： CONNECT权限的用户(只读用户)创建连接时会出现“表或视图不存在”的提示，需要执行如下操作进行授权：以root用户登录oracle节点。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
数据开发概述 - 数据治理中心 DataArts Studio

或多个业务相关的作业，一个作业可以被多个解决方案复用。作业：作业由一个或多个节点组成，执行作业可以完成对数据的一系列操作。脚本：脚本（Script）是一种批处理文件的延伸，是一种纯文本保存的程序，一般来说的计算机脚本程序是确定的一系列控制计算机进行运算操作动作的组合，在其中可以实现一定的逻辑分支等。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
配置MongoDB源端参数 - 数据治理中心 DataArts Studio

表1 MongoDB作为源端时的作业参数参数类型参数名说明是否必须填取值样例基本参数数据库输入或选择数据库名称，单击输入框后面的按钮可进入集合的选择界面。是 default 集合名输入或选择集合名，单击输入框后面的按钮可进入集合的选择界面。该参数支持配置为时

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
Shell/Python节点执行失败，后台报错session is down - 数据治理中心 DataArts Studio

请求消息的时间间隔，默认是0，不发送请求。然而ClientAliveInterval 300表示五分钟发送一次，然后客户端响应，这样就保持长连接了。ClientAliveCountMax的默认值3。ClientAliveCountMax表示服务器发出请求后客户端没有响应的次数达到

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

_cr，该示例表示配置了MRS集群的指定队列。同时在MRS集群的作业管理下，在操作的“更多 > 查看详情”里面可以查看该作业的详细信息。说明：为本次执行的作业配置相关优化参数（例如线程、内存、CPU核数等），用于优化资源使用效率，提升作业的执行性能。Spark代理连接不支持该配置。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
DMS Kafka到OBS参数调优 - 数据治理中心 DataArts Studio

消费Kafka时服务器将返回的每个分区的最大字节数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。 properties.max.poll.records int 500 消费者每次poll时返回的最大消息条数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
文件格式介绍 - 数据治理中心 DataArts Studio

字段分隔符用于分隔CSV文件中的列的字符，支持单字符和多字符，也支持特殊字符，详见表1。编码类型文件的编码类型，默认是UTF-8，中文的编码有时会采用GBK。如果源端指定该参数，则使用指定的编码类型去解析文件；目的端指定该参数，则写入文件的时候，以指定的编码类型写入。使用包围符

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
文件格式介绍 - 数据治理中心 DataArts Studio

字段分隔符用于分隔CSV文件中的列的字符，支持单字符和多字符，也支持特殊字符，详见表1。编码类型文件的编码类型，默认是UTF-8，中文的编码有时会采用GBK。如果源端指定该参数，则使用指定的编码类型去解析文件；目的端指定该参数，则写入文件的时候，以指定的编码类型写入。使用包围符

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
实时报警平台搭建 - 数据治理中心 DataArts Studio

创建数据表关键操作说明：图9中的脚本开发区为临时调试区，关闭脚本页签后，开发区的内容将丢失。如需保留该SQL脚本，请单击，将脚本保存至指定的目录中。关键参数说明：数据连接：1中创建的DLI数据连接。数据库：2中创建的数据库。资源队列：使用DLI提供的默认资源队列“default”。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
For Each节点使用介绍 - 数据治理中心 DataArts Studio

SQL节点，编排图3所示的作业。 DLI SQL的语句中把要替换的变量配成${}这种参数的形式。在下面的SQL语句中，所做的操作是把${Source}表中的数据全部导入${Destination}中，${fromTable}、${toTable} 就是要替换的变量参数。SQL语句为：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
上传存量数据 - 数据治理中心 DataArts Studio

CDM会迁移整个目录下的文件到OBS。文件格式：选择“二进制格式”。这里的文件格式是指CDM传输数据时所用的格式，不会改变原始文件自身的格式。迁移文件到文件时，推荐使用“二进制格式”，传输的效率和性能都最优。目的端作业配置：目的连接名称：选择7创建的OBS连接“obslink”。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 贸易数据极简上云与统计分析 > 使用CDM上传数据到OBS
编排API简介 - 数据治理中心 DataArts Studio

编排API简介数据服务API编排是指将已经开发好的服务API接口，在无需编写复杂代码的情况下，根据特定的业务逻辑和流程进行可视化的重组和重构，从而实现在不影响原生接口的前提下进行简便的二次开发。API编排为您提供拖拽式、可视化的API工作流程编排能力，您可以按照业务逻辑，以串行

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API
For Each节点使用介绍 - 数据治理中心 DataArts Studio

SQL节点，编排图3所示的作业。 DLI SQL的语句中把要替换的变量配成${}这种参数的形式。在下面的SQL语句中，所做的操作是把${Source}表中的数据全部导入${Destination}中，${fromTable}、${toTable} 就是要替换的变量参数。SQL语句为：

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
OBS连接 - 数据治理中心 DataArts Studio

} ] } 连接参数参数是否必选类型说明 linkConfig.storageType 是 String 对象存储的类型。 linkConfig.obsBucketType 否 String OBS桶类型。对象桶：OB。并行文件系统：PFS。说明：

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
配置实时集成作业 - 数据治理中心 DataArts Studio

同步场景：包含单表、整库、分库分表场景，各数据源支持的场景不一，详情请参见使用教程。不同场景介绍如表1所示。表1 同步场景参数说明场景类型说明单表支持将源端一个实例下的单张表实时同步至目的端一个实例下的单张表。整库支持将源端一个实例下多个库的多张表批量实时同步到目的端一个实例下的多个库表，一个任务中最多支持200张目标表。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）

总条数： 221

上一页
1
...
7
8
9
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Apache Hive数据连接参数说明 - 数据治理中心 DataArts Studio

CDM有哪些优势？ - 数据治理中心 DataArts Studio

CDM与其他数据迁移服务有什么区别，如何选择？ - 数据治理中心 DataArts Studio

Apache Kafka到MRS Kafka参数调优 - 数据治理中心 DataArts Studio

配置离线处理集成作业 - 数据治理中心 DataArts Studio

ORACLE数据连接参数说明 - 数据治理中心 DataArts Studio

数据开发概述 - 数据治理中心 DataArts Studio

配置MongoDB源端参数 - 数据治理中心 DataArts Studio

Shell/Python节点执行失败，后台报错session is down - 数据治理中心 DataArts Studio

开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

DMS Kafka到OBS参数调优 - 数据治理中心 DataArts Studio

文件格式介绍 - 数据治理中心 DataArts Studio

文件格式介绍 - 数据治理中心 DataArts Studio

实时报警平台搭建 - 数据治理中心 DataArts Studio

For Each节点使用介绍 - 数据治理中心 DataArts Studio

上传存量数据 - 数据治理中心 DataArts Studio

编排API简介 - 数据治理中心 DataArts Studio

For Each节点使用介绍 - 数据治理中心 DataArts Studio

OBS连接 - 数据治理中心 DataArts Studio

配置实时集成作业 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线