搜索_华为云

Apache Kafka到MRS Kafka参数调优 - 数据治理中心 DataArts Studio

景，可以适当调高每次获取的数据量，以提高性能。 properties.max.partition.fetch.bytes int 1048576 消费Kafka时服务器将返回的每个分区的最大字节数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。 properties

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
修改作业 - 数据治理中心 DataArts Studio

集群名称。通过DataArts Studio管理控制台 > 数据集成，在批量数据迁移集群列表可以获取到集群名称。 jobName 是 String 作业名称。通过DataArts Studio管理控制台 > 数据集成，在批量数据迁移集群列表单击对应的集群管理，进入后在作业管理中获取作业名称。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
获取审批工单列表 - 数据治理中心 DataArts Studio

cluster_name String 集群名称 datasource_type String 数据源类型 HIVE数据源 DWS数据源 DLI数据源 expire_time String 超时时间 permissions Array of permissions objects 申请权限详情列表

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据安全API > 权限审批接口
查询API信息 - 数据治理中心 DataArts Studio

String 数据源的类型。枚举值： MYSQL：MYSQL数据源 DLI：DLI数据源 DWS：DWS数据源 HIVE：HIVE数据源 HBASE：HBASE数据源 connection_name String 数据连接名称。 connection_id String 数据连接ID。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > API管理接口
实时作业概述 - 数据治理中心 DataArts Studio

功能描述多种数据源间的数据同步支持多种数据源链路组合，您可以将多种输入及输出数据源搭配组成同步链路进行数据同步。详情请参见支持的数据源。复杂网络环境下的数据同步支持云数据库、本地IDC、ECS自建数据库等多种环境下的数据同步。在配置同步任务前，您可以根据数据库所在网络环境

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
DIS连接参数说明 - 数据治理中心 DataArts Studio

Endpoint可从终端节点Endpoint获取。 - 访问标识(AK) 登录DIS服务器的访问标识。您需要先创建当前账号的访问密钥，并获得对应的AK和SK。 - 密钥(SK) 登录DIS服务器的密钥。您需要先创建当前账号的访问密钥，并获得对应的AK和SK。 - 项目ID DIS的项目ID。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

是否写入脏数据选择是否记录脏数据，默认不记录脏数据，当脏数据过多时，会影响同步任务的整体同步速度。链路是否支持写入脏数据，以实际界面为准。否：默认为否，不记录脏数据。表示不允许脏数据存在。如果同步过程中产生脏数据，任务将失败退出。是：允许脏数据，即任务产生脏数据时不影响任务执行。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
产品功能 - 数据治理中心 DataArts Studio

元数据管理模块是数据湖治理的基石，支持创建自定义策略的采集任务，可采集数据源中的技术元数据。支持自定义业务元模型，批量导入业务元数据，关联业务和技术元数据、全链路的血缘管理和应用。图5 全链路数据血缘数据地图数据地图围绕数据搜索，服务于数据分析、数据开发、数据挖掘、数据运营等数据表的使用

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
约束与限制 - 数据治理中心 DataArts Studio

作业运行过程中，任务异常中断，目标端已写入的部分数据不会清理，需手动清理。单文件传输大小不超过1TB。数据库迁移通用限制和约束 CDM以批量迁移为主，仅支持有限的数据库增量迁移，不支持数据库实时增量迁移，推荐使用数据复制服务（DRS）来实现数据库增量迁移到RDS。 CDM支持的数据库整库迁移，仅支持数据表迁移，不

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
配置HBase/CloudTable目的端参数 - 数据治理中心 DataArts Studio

TBL_2 导入前清空数据选择目的端表中数据的处理方式。是：任务启动前会清除目标表中数据。否：导入前不清空目标表中的数据，如果选“否”且表中有数据，则数据会追加到已有的表中。是自动创表只有当源端为关系数据库时，才有该参数。表示写入表数据时，用户选择的操作：不自动创建：不自动建表。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

选择JSON对象或JSON数组。 JSON对象记录节点文件类型为JSON对象时支持此参数。记录数据的根节点。该节点对应的数据为JSON数组，系统会以同一模式从该数组中提取数据。多层嵌套的JSON节点以字符“.”分割。 data.list 高级属性使用rfc4180解析器文件格式为CSV格式时支持此参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
配置OBS目的端参数 - 数据治理中心 DataArts Studio

用于文件到文件的迁移。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，此处的“文件格式”只能选择与源端的文件格式一致。说明：当源端为MRS Hive数据源时，仅支持配置CSV格式。当源端为FTP/SFTP数据源时，仅支持配置二进制格式。 CSV格式

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
配置Oracle源端参数 - 数据治理中心 DataArts Studio

取整表。该参数支持配置为时间宏变量，实现抽取指定日期的数据，详细说明请参见关系数据库增量迁移。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
DMS Kafka到OBS参数调优 - 数据治理中心 DataArts Studio

景，可以适当调高每次获取的数据量，以提高性能。 properties.max.partition.fetch.bytes int 1048576 消费Kafka时服务器将返回的每个分区的最大字节数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。 properties

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
源端为对象存储 - 数据治理中心 DataArts Studio

fromJobConfig.inputFormat 是枚举传输数据时所用的文件格式，目前支持以下文件格式： CSV_FILE：CSV格式，用于迁移文件到数据表的场景。 JSON_FILE：JSON格式，一般都是用于迁移文件到数据表的场景。 BINARY_FILE：二进制格式，不解析文件

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
MRS Spark数据连接参数说明 - 数据治理中心 DataArts Studio

API连接仅支持在数据开发组件使用，其他组件例如数据架构、数据质量、数据目录等无法使用此连接。在数据开发组件不支持通过可视化方式查看与管理该连接下的数据库、数据表和字段。特别的，仅当连接MRS 3.2.1以及之后版本的MRS集群时，支持通过可视化方式查看数据库、数据表和字段，但仍不支持可视化方式管理。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
在ECS上调试好的shell脚本，在DLF中shell脚本执行异常，如何处理？ - 数据治理中心 DataArts Studio

在ECS上调试好的shell脚本，在DLF中shell脚本执行异常，如何处理？问题描述在ECS上调试好的shell脚本，在DLF中shell脚本执行异常。脚本内容是通过gsql连接dws查询某库表数据行数的。 ECS调试结果： DLF脚本运行结果：图1 脚本运行结果解决方案

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
获取导入导出的任务状态 - 数据治理中心 DataArts Studio

String 结束时间。 status String 任务状态，WAITING表示等待执行，RUNNING表示执行中，TIMEOUT表示执行超时，FAILED表示执行失败，SUCCESS表示执行成功。 error_msg String 错误信息。 project_id String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据质量API > 导入导出接口
SAP HANA数据连接参数说明 - 数据治理中心 DataArts Studio

说明：仅GaussDB数据源支持多域名的方式，多个域名之间用“,”分隔。如果为MySQL、PostgreSQL或达梦数据库 DM等线下数据源，可以通过数据库管理员获取相应的访问地址。端口是关系型数据库数据源的访问端口。如果为RDS或GaussDB等云上数据源，可以通过管理控制台获取访问地址：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
构造请求 - 数据治理中心 DataArts Studio

HTTP方法方法说明 GET 请求服务器返回指定资源。 PUT 请求服务器更新指定资源。 POST 请求服务器新增资源或执行特殊操作。 DELETE 请求服务器删除指定资源，如删除对象等。 HEAD 请求服务器资源头部。 PATCH 请求服务器更新资源的部分内容。当资源不存在的

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 如何调用API

总条数： 336

上一页
1
...
12
13
14
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Apache Kafka到MRS Kafka参数调优 - 数据治理中心 DataArts Studio

修改作业 - 数据治理中心 DataArts Studio

获取审批工单列表 - 数据治理中心 DataArts Studio

查询API信息 - 数据治理中心 DataArts Studio

实时作业概述 - 数据治理中心 DataArts Studio

DIS连接参数说明 - 数据治理中心 DataArts Studio

MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

产品功能 - 数据治理中心 DataArts Studio

约束与限制 - 数据治理中心 DataArts Studio

配置HBase/CloudTable目的端参数 - 数据治理中心 DataArts Studio

配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

配置OBS目的端参数 - 数据治理中心 DataArts Studio

配置Oracle源端参数 - 数据治理中心 DataArts Studio

DMS Kafka到OBS参数调优 - 数据治理中心 DataArts Studio

源端为对象存储 - 数据治理中心 DataArts Studio

MRS Spark数据连接参数说明 - 数据治理中心 DataArts Studio

在ECS上调试好的shell脚本，在DLF中shell脚本执行异常，如何处理？ - 数据治理中心 DataArts Studio

获取导入导出的任务状态 - 数据治理中心 DataArts Studio

SAP HANA数据连接参数说明 - 数据治理中心 DataArts Studio

构造请求 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线