搜索_华为云

申请与审批权限（部分高级特性） - 数据治理中心 DataArts Studio

权限申请前，需要在数据目录组件，对数据连接成功进行过元数据采集，详见元数据采集任务。约束与限制一个密级下只允许存在一条审批策略，不选密级也只允许存在一条审批策略。创建基于密级的审批策略时，需要满足以下条件：已开启数据地图组件。已采集相关密级数据的元数据。已完成敏感数据发现任务，并将密级信息同步到数据地图。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > 数据权限访问控制
开发一个DWS SQL作业 - 数据治理中心 DataArts Studio

集群名：环境准备中创建的DWS集群名称。绑定Agent：环境准备中创建的CDM集群。创建数据库在DWS中创建数据库，以“gaussdb”数据库为例。创建数据库的详情请参考新建数据库进行操作。创建数据表在“gaussdb”数据库中创建数据表trade_log和trade_report。详情请参考如下建表脚本。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

8192 数据缓存队列条数，默认为8192，当源表中单条数据过大时（如1MB），缓存过多数据会导致内存溢出，可以考虑减小该值。 debezium.max.queue.size.in.bytes int 0 数据缓存队列大小，默认为0，即表示缓存队列不考虑数据大小，只按照数据条数计算。在debezium

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
查询集群详情 - 数据治理中心 DataArts Studio

REBOOT_FAILURE：重启失败。 type String 节点类型，只支持一种类型“cdm”。 id String 节点的虚拟机ID。 name String 节点的虚拟机名称。 isFrozen String 节点是否冻结：0：否。1：是。 components String 组件。 config_status

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
MySQL到DMS Kafka参数调优 - 数据治理中心 DataArts Studio

8192 数据缓存队列条数，默认为8192，当源表中单条数据过大时（如1MB），缓存过多数据会导致内存溢出，可以考虑减小该值。 debezium.max.queue.size.in.bytes int 0 数据缓存队列大小，默认为0，即表示缓存队列不考虑数据大小，只按照数据条数计算。在debezium

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
配置HDFS目的端参数 - 数据治理中心 DataArts Studio

取值样例基本参数写入目录写入数据到HDFS服务器的目录。 /user/cdm/output 文件格式传输数据时使用的格式。其中CSV和JSON仅支持迁移到数据表场景，二进制格式适用于文件迁移场景。 CSV格式换行符处理方式指定在写入文本文件表的数据包含换行符，特指(\n|\r|\r\n)的情况下处理换行符的策略。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
MRS Hudi连接参数说明 - 数据治理中心 DataArts Studio

Manager的密码。 - OBS支持是否支持OBS存储，如果hudi表数据存储在OBS，需要打开此开关。是访问标识（AK） “OBS支持”设置为“是”时，呈现此参数。 AK和SK分别为登录OBS服务器的访问标识与密钥。您需要先创建当前账号的访问密钥，并获得对应的AK和SK。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
配置MySQL源端参数 - 数据治理中心 DataArts Studio

取整表。该参数支持配置为时间宏变量，实现抽取指定日期的数据，详细说明请参见关系数据库增量迁移。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
配置DWS源端参数 - 数据治理中心 DataArts Studio

号是否有元数据查询的权限。说明：该参数支持配置通配符（*），实现导出以某一前缀开头或者以某一后缀结尾的所有数据库。例如： SCHEMA*表示导出所有以“SCHEMA”开头的数据库。 *SCHEMA表示导出所有以“SCHEMA”结尾的数据库。 *SCHEMA*表示数据库名称中只

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

事实表通常整表数据规模较大，以新增数据为主，更新数据占比小，且更新数据大多落在近一段时间范围内（年或月或天），下游读取该表进行ETL计算时通常会使用时间范围进行裁剪（例如最近一天、一月、一年），这种表通常可以通过数据的创建时间来做分区以保证最佳读写性能。维度表数据量一般整表数据规模较小

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
实时报警平台搭建 - 数据治理中心 DataArts Studio

方案设计操作流程如下：实时数据导入：通过数据接入服务（DIS）将数据中心的告警数据实时导入到数据湖探索（DLI）。数据清洗和预处理：DLI对告警数据进行数据清洗和预处理。发送告警消息：当告警级别超过指定值时向用户发送短信。数据导出和存储：清洗过的数据进入DIS通道，DIS根据导入时间将告警数据按日期存放到OBS。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
处理消息 - 数据治理中心 DataArts Studio

n的值。 workspace 是 String 工作空间ID，获取方法请参见实例ID和工作空间ID。 Dlm-Type 否 String 数据服务的版本类型，指定SHARED共享版或EXCLUSIVE专享版。 Content-Type 是 String 消息体的类型（格式），有B

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > 消息管理接口
配置Redis源端参数 - 数据治理中心 DataArts Studio

是用户在本地数据中心或ECS上自行搭建的Redis支持作为源端或目的端。作业中源连接为从本地Redis导出的数据时，源端作业参数如表1所示。表1 Redis作为源端时的作业参数参数类型参数名说明取值样例基本参数 Redis键前缀键的前缀，类似关系型数据库的表名。 TABLE

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置Doris源端参数 - 数据治理中心 DataArts Studio

取值样例基本参数使用SQL语句导出关系型数据库的数据时，您可以选择使用自定义SQL语句导出。否 SQL语句 “使用SQL语句”选择“是”时，您可以在这里输入自定义的SQL语句，CDM将根据该语句导出数据。说明： SQL语句只能查询数据，支持join和嵌套写法，但不能有多条查询语句，比如

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
源端为FTP/SFTP - 数据治理中心 DataArts Studio

fromJobConfig.inputFormat 是枚举传输数据时所用的文件格式，目前支持以下文件格式： CSV_FILE：CSV格式，用于迁移文件到数据表的场景。 JSON_FILE：JSON格式，一般都是用于迁移文件到数据表的场景。 BINARY_FILE：二进制格式，不解析文件

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
更新API - 数据治理中心 DataArts Studio

描述 type 否 String 数据源的类型。枚举值： MYSQL：MYSQL数据源 DLI：DLI数据源 DWS：DWS数据源 HIVE：HIVE数据源 HBASE：HBASE数据源 connection_name 否 String 数据连接名称。 connection_id

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > API管理接口
约束与限制 - 数据治理中心 DataArts Studio

方式访问DataArts Studio。各组件API的流量限制请参见API概览。数据集成API的约束如下： CDM的作业数据量太多，会造成数据库压力，建议定时清理不需要的作业。短时间内下发大量作业，可能会导致集群资源耗尽异常等，您调用API时需要注意。 CDM是批量离线迁移工具，不建议客户创建大量小作业场景。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 使用前必读
配置OBS源端参数 - 数据治理中心 DataArts Studio

基本参数桶名待迁移数据所在的桶名。 BUCKET_2 源目录或文件 “列表文件”选择为“否”时，才有该参数。待迁移数据的目录或单个文件路径。文件路径支持输入多个文件（最多50个），默认以“|”分隔，也可以自定义文件分隔符，具体请参见文件列表迁移。待迁移数据的目录，将迁移目录下

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置GBase源端参数 - 数据治理中心 DataArts Studio

取值样例基本参数使用SQL语句导出关系型数据库的数据时，您可以选择使用自定义SQL语句导出。否 SQL语句 “使用SQL语句”选择“是”时，您可以在这里输入自定义的SQL语句，作业将根据该语句导出数据。说明： SQL语句只能查询数据，支持join和嵌套写法，但不能有多条查询语句，比如

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
新建Hadoop集群配置 - 数据治理中心 DataArts Studio

> 现有集群”，单击集群名称进入集群详情页面，单击“组件管理”。单击“下载客户端”。“客户端类型”选择“仅配置文件”，“下载路径”选择“服务器端”或“远端主机”，自定义文件保存路径后，单击“确定”开始生成客户端配置文件。将生成的配置文件，保存到本地路径。具体可参见MapReduce服务文档。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接

总条数： 336

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

申请与审批权限（部分高级特性） - 数据治理中心 DataArts Studio

开发一个DWS SQL作业 - 数据治理中心 DataArts Studio

MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

查询集群详情 - 数据治理中心 DataArts Studio

MySQL到DMS Kafka参数调优 - 数据治理中心 DataArts Studio

配置HDFS目的端参数 - 数据治理中心 DataArts Studio

MRS Hudi连接参数说明 - 数据治理中心 DataArts Studio

配置MySQL源端参数 - 数据治理中心 DataArts Studio

配置DWS源端参数 - 数据治理中心 DataArts Studio

MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

实时报警平台搭建 - 数据治理中心 DataArts Studio

处理消息 - 数据治理中心 DataArts Studio

配置Redis源端参数 - 数据治理中心 DataArts Studio

配置Doris源端参数 - 数据治理中心 DataArts Studio

源端为FTP/SFTP - 数据治理中心 DataArts Studio

更新API - 数据治理中心 DataArts Studio

约束与限制 - 数据治理中心 DataArts Studio

配置OBS源端参数 - 数据治理中心 DataArts Studio

配置GBase源端参数 - 数据治理中心 DataArts Studio

新建Hadoop集群配置 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线