搜索_华为云

MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

MAX（单表数据量大小（G）/2G*2，再向上取整，4）。分区表桶数 = MAX（单分区数据量大小（G）/2G*2，再后向上取整，1）。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。 changelog

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
Oracle同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

MAX（单表数据量大小（G）/2G*2，再向上取整，4）。分区表桶数 = MAX（单分区数据量大小（G）/2G*2，再后向上取整，1）。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。 changelog

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
查询连接 - 数据治理中心 DataArts Studio

project_id 是 String 项目ID，获取方法请参见项目ID和账号ID。 cluster_id 是 String 集群ID。 link_name 是 String 连接名称。请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 连接管理
新建数据连接 - 数据治理中心 DataArts Studio

在同一个数据连接下，可支持多个作业运行和多个脚本开发，当数据连接保存的信息发生变化时，您只需在连接管理中编辑修改该数据连接的信息。新建数据连接数据开发模块的数据连接，是基于管理中心的数据连接完成的，创建方法请参考配置DataArts Studio数据连接参数。查看连接引用当用户需要查看某个连接被引用的情况时，可以参考如下操作查看引用。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 数据管理
通过数据开发使用参数传递灵活调度CDM作业 - 数据治理中心 DataArts Studio

创建并执行数据开发作业在DataArts Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。在数据开发主界面的左侧导航栏，选择“数据开发 > 作业开发” 。在“作业开发”界面中，单击“新建作业”，如图3所示。图3 新建作业在弹出的“新建作

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
DLI Spark - 数据治理中心 DataArts Studio

像。作业名称是填写DLI Spark作业的名称，只能包含英文字母、数字、“_”，且长度为1~64个字符。默认与节点的名称一致。作业运行资源否选择作业运行的资源规格： 8核32G内存 16核64G内存 32核128G内存作业主类是 Spark作业的主类名称。当应用程序类型为“

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
实时报警平台搭建 - 数据治理中心 DataArts Studio

${dayParam}：dayParam是指alarm_info表分区值，在脚本编辑器下方输入具体的参数值“$getCurrentTime(@@yyyyMMdd@@,-24*60*60)”。 ${obsPathYear}：obsPathYear是指OBS分区目录路径，在脚本编辑器下方

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
MySQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

作业执行支持并发数。该参数无需配置，跟随处理器核数变化而自动变化。 1 自动重试作业失败时是否开启自动重试。否最大重试次数 “自动重试”为是时显示该参数。 1 重试间隔时间 “自动重试”为是时显示该参数。 120秒是否写入脏数据选择是否记录脏数据，默认不记录脏数据，当脏数据过多时，会影响同步任务的整体同步速度。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
配置HBase 目的端参数 - 数据治理中心 DataArts Studio

导入前清空数据导入前是否清空表中的数据。是：清空表中数据。否：不清空。否高级属性 Rowkey冗余是否将选做Rowkey的数据同时写入HBase的列。否 WAL开关是否写WAL，不写WAL能提升性能，但如果HBase服务宕机可能会造成数据丢失。是匹配数据类型是否匹配类型，

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
Flink Jar作业开发指导 - 数据治理中心 DataArts Studio

参数是否必选说明 Flink作业名称是输入Flink作业名称。系统支持Flink作业名称按照工作空间-作业名称格式自动填入。作业名称只能包含英文字母、数字、中划线和下划线，且长度为1~64个字符，不能包含中文字符。 MRS集群名是选择MRS集群名称。说明：单任务Flink

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
创建并管理工作空间 - 数据治理中心 DataArts Studio

员角色。在主账号创建的DataArts Studio实例中，该账号下的IAM用户如需创建工作空间，需要由主账号给IAM用户赋予DAYU Administrator或Tenant Administrator权限。在子用户创建的DataArts Studio实例中，主账号默认具有该DataArts

帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 管理工作空间
配置Elasticsearch/云搜索服务（CSS）目的端参数 - 数据治理中心 DataArts Studio

开启路由后，支持指定某一列的值作为路由写入Elasticsearch。说明：开启路由前建议先建好目的端索引，可提高查询效率。否路由字段 “开启路由”参数选择为“是”时配置，用于配置目的端路由字段。目的端索引存在但是获取不到字段信息时，支持手动填写字段。路由字段允许为空，为空时写入Elasticsearch不指定routing值。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
目的端为OBS - 数据治理中心 DataArts Studio

toJobConfig.bucketName 是 String OBS的桶名，例如“cdm”。 toJobConfig.outputDirectory 是 String 数据写入路径，例如“data_dir”。 toJobConfig.outputFormat 是枚举写入数据时所用的文件格式（二进制除外），支持以下文件格式：

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
最小化权限授权实践 - 数据治理中心 DataArts Studio

"ecs:servers:get", "ecs:servers:list", "ecs:servers:stop", "ecs:servers:start", "ecs:flavors:get"

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
字段转换器配置指导 - 数据治理中心 DataArts Studio

如果字段映射关系不正确，您可以通过拖拽字段、单击对字段批量映射两种方式来调整字段映射关系。创建表达式转换器时，表达式的功能是对该字段的数据进行处理，故不建议使用时间宏，如需使用，请根据以下场景处理（源端是文件类的配置时仅支持方式一）：方式一：新建表达式转换器时，表达式需要用''包围。 ${datefo

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
字段转换器配置指导 - 数据治理中心 DataArts Studio

如果字段映射关系不正确，您可以通过拖拽字段、单击对字段批量映射两种方式来调整字段映射关系。创建表达式转换器时，表达式的功能是对该字段的数据进行处理，故不建议使用时间宏，如需使用，请根据以下场景处理（源端是文件类的配置时仅支持方式一）：方式一：新建表达式转换器时，表达式需要用''包围。 ${datefo

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
Python - 数据治理中心 DataArts Studio

节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试是节点执行失败后，是否重新执行节点。是：重新执行节点，请配置以下参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导

总条数： 330

上一页
1
...
11
12
13
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

Oracle同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

查询连接 - 数据治理中心 DataArts Studio

新建数据连接 - 数据治理中心 DataArts Studio

通过数据开发使用参数传递灵活调度CDM作业 - 数据治理中心 DataArts Studio

DLI Spark - 数据治理中心 DataArts Studio

实时报警平台搭建 - 数据治理中心 DataArts Studio

MySQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

配置HBase 目的端参数 - 数据治理中心 DataArts Studio

Flink Jar作业开发指导 - 数据治理中心 DataArts Studio

创建并管理工作空间 - 数据治理中心 DataArts Studio

配置Elasticsearch/云搜索服务（CSS）目的端参数 - 数据治理中心 DataArts Studio

目的端为OBS - 数据治理中心 DataArts Studio

最小化权限授权实践 - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

Python - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线