搜索_华为云

Oracle同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

关系到表的性能，需要格外引起注意。非分区表桶数 = MAX(单表数据量大小(G)/2G*2，再向上取整，4) 分区表桶数 = MAX(单分区数据量大小(G)/2G*2，再后向上取整，1) 其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

支持目标数据库中的表比源数据库多列场景，但是需要避免以下场景可能导致的任务失败。目标数据库多的列要求非空且没有默认值，源数据库insert数据，同步到目标数据库后多的列为null，不符合目标数据库要求。操作步骤本小节以RDS for MySQL到MRS Hudi的实时同步为示例

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
开发实时处理单任务MRS Flink Jar作业 - 数据治理中心 DataArts Studio

仅单次调度才显示。系统默认为当前时间。事件触发时间仅事件驱动调度才显示。系统默认为事件触发时间。周期调度仅周期调度才显示。系统默认为调度周期。具体时间仅周期调度才显示。周期调度配置的具体运行时间。起始日期仅周期调度才显示。周期调度的生效时间。后N个实例作业运行调度的实例个数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
全量导出/导出/导入API - 数据治理中心 DataArts Studio

l文件的形式导出API。图3 导出API 打开下载到本地的Excel文件，可以查看导出的API。不同类型的API会分别导出到文件页签中，单击下方页签可以切换查看并编辑。图4 Excel文件样式导入API 在DataArts Studio控制台首页，选择对应工作空间的“数据服务”模块，进入数据服务页面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 管理API
数据集成API错误码 - 数据治理中心 DataArts Studio

必须指定MongoDB服务的数据库名称。未指定MongoDB服务的数据库名称。未指定MongoDB服务的数据库名称，请指定数据库后，再重试。 Cdm.1307 400 必须指定MongoDB服务的字段列表。未指定MongoDB服务的字段列表。未指定MongoDB服务的字段列表，请指定字段列表后，再重试。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 附录 > 错误码
权限治理使用流程 - 数据治理中心 DataArts Studio

nger组件提供默认策略放通权限（详见配置组件权限策略），因此待授权用户默认具备MRS Hive库表的数据权限。如果需要去除授权用户的默认权限，则需要您在Ranger组件上去除系统默认策略中的public用户组，操作步骤如下：使用admin账户登录MRS服务的Manager页面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理
CloudTable连接参数说明 - 数据治理中心 DataArts Studio

有效。此参数用于选择用户已经创建好的集群配置。集群配置的创建方法请参见管理集群配置。 hadoop_01 单击“显示高级属性”，然后单击“添加”，您可以添加客户端的配置属性。所添加的每个属性需配置属性名称和值。对于不再需要的属性，可单击属性后的“删除”按钮进行删除。父主题：配置连接参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
查看同步日志 - 数据治理中心 DataArts Studio

Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。在数据开发主界面的左侧导航栏，选择“运维调度 > 作业监控”。选择“实时集成作业监控”页签，单击作业名称。在详情页面，选择“日志信息”，在左侧日志列表中单击具体日志文件，即可实时查看作业的运行日志。图1 日志信息1

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 实时集成任务运维
SDK使用前准备 - 数据治理中心 DataArts Studio

SDK”。单击SDK使用引导区域里对应语言的SDK，下载SDK包到本地。进行SDK包完整性校验。Windows操作系统下，打开本地命令提示符框，输入如下命令，在本地生成已下载SDK包的SHA256值，其中，“D:\java-sdk.zip”为SDK包的本地存放路径和SDK包名，请根据实际情况修改。

帮助中心 > 数据治理中心 DataArts Studio > SDK参考 > 数据服务SDK参考
基本概念 - 数据治理中心 DataArts Studio

API的鉴权过程中，您需要用到账号、用户和密码等信息。项目区域默认对应一个项目，这个项目由系统预置，用来隔离物理区域间的资源（计算资源、存储资源和网络资源），以默认项目为单位进行授权，用户可以访问您账号中该区域的所有资源。如果您希望进行更加精细的权限控制，可以在区域默认的项目

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 使用前必读
开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

关键说明：图1中的脚本开发区为临时调试区，关闭脚本页签后，开发区的内容将丢失。您可以通过“提交”来保存并提交脚本版本。数据连接：建立Hive的数据连接创建的连接。开发Hive SQL作业 Hive SQL脚本开发完成后，我们为Hive SQL脚本构建一个周期执行的作业，使得该脚本能定期执行。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
配置Redis源端参数 - 数据治理中心 DataArts Studio

配置Redis源端参数第三方云的Redis服务无法支持作为源端。如果是用户在本地数据中心或ECS上自行搭建的Redis支持作为源端或目的端。作业中源连接为从本地Redis导出的数据时，源端作业参数如表1所示。表1 Redis作为源端时的作业参数参数类型参数名说明取值样例

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
业务指标 - 数据治理中心 DataArts Studio

指标数据统计的基本计量单位。 *统计周期指标统计的周期颗粒度。统计维度常用的统计维度，维度一般存在层级关系。 *刷新频率指标数据的刷新的最小频率。统计口径&修饰词除统计周期和维度外，该指标常用的统计口径&修饰词，限制指标数据的范围。指标应用场景描述该指标重要的应用场景，包括在线报表、例行报告、汇报材料等。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 指标设计
MySQL同步到DMS Kafka作业配置 - 数据治理中心 DataArts Studio

tition。按表的主键值hash值投递到不同的Partition。源端无主键情况下，目的端默认投递到partition 0。需要同步的数据库操作支持同步的数据库操作包括DDL和DML，可单选或多选，不选择的情况下默认同步所有操作。投递到Kafka的数据格式选择投递到

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
溯源数据水印 - 数据治理中心 DataArts Studio

约束与限制数据水印溯源的源文件大小不能超过20MB。为实现准确溯源，请确保数据的完整性以及正确性：数据水印溯源的表数据文件第一列不允许为空，表数据记录数建议在5000以上。创建数据水印溯源任务在DataArts Studio控制台首页，选择对应工作空间的“数据安全”模块，进入数据安全页面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 管理数据水印
目的端为HBase/CloudTable - 数据治理中心 DataArts Studio

当选取多个列做rowkey时，连接多列的分隔符，例如：“|”。 toJobConfig.isRowkeyRedundancy 否 Boolean 是否将选做Rowkey的数据同时写入HBase的列。 toJobConfig.algorithm 否枚举创建新HBase表时采用的压缩算法，支持SNAPPY和GZ算法，默认为“NONE”。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
DMS Kafka数据连接参数说明 - 数据治理中心 DataArts Studio

Studio或KPS使用KMS加密时，会自动生成默认密钥dlf/default或kps/default。关于默认密钥的更多信息，请参见什么是默认密钥。 KMS是一种安全、可靠、简单易用的密钥托管服务，对密钥的所有操作都会进行访问控制及日志跟踪，提供所有密钥的使用记录，满足审计和合规性要求。绑定Agent

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
配置HDFS目的端参数 - 数据治理中心 DataArts Studio

数据加密密钥 “加密方式”选择“AES-256-GCM”时显示该参数，密钥由长度64的十六进制数组成。请您牢记这里配置的“数据加密密钥”，解密时的密钥与这里配置的必须一致。如果不一致系统不会报异常，只是解密出来的数据会错误。 DD0AE00DFECD78BF051BCFDA25BD4E3

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
如何处理API对应的数据表数据量较大时，获取数据总条数比较耗时的问题？ - 数据治理中心 DataArts Studio

如何处理API对应的数据表数据量较大时，获取数据总条数比较耗时的问题？问题场景创建API时，已打开“返回总条数”开关。当API对应的数据表数据量较大时，获取数据总条数比较耗时。图1 返回总条数解决方案在分页查询时，您可以通过参数（参数名use_total_num）控制是否计算并返回数据总条数。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据服务
MySQL到DMS Kafka参数调优 - 数据治理中心 DataArts Studio

越多，分片个数越小。当表的条数过多时，作业会划分较多的分片，从而占用过多的内存导致内存问题，请解决表的条数适当调整该值。当scan.incremental.snapshot.backfill.skip为false时，实时处理集成作业会缓存单个分片的数据，此时分片越大，占用内存

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优

总条数： 1103

上一页
1
...
13
14
15
...
56
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Oracle同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

开发实时处理单任务MRS Flink Jar作业 - 数据治理中心 DataArts Studio

全量导出/导出/导入API - 数据治理中心 DataArts Studio

数据集成API错误码 - 数据治理中心 DataArts Studio

权限治理使用流程 - 数据治理中心 DataArts Studio

CloudTable连接参数说明 - 数据治理中心 DataArts Studio

查看同步日志 - 数据治理中心 DataArts Studio

SDK使用前准备 - 数据治理中心 DataArts Studio

基本概念 - 数据治理中心 DataArts Studio

开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

配置Redis源端参数 - 数据治理中心 DataArts Studio

业务指标 - 数据治理中心 DataArts Studio

MySQL同步到DMS Kafka作业配置 - 数据治理中心 DataArts Studio

溯源数据水印 - 数据治理中心 DataArts Studio

目的端为HBase/CloudTable - 数据治理中心 DataArts Studio

DMS Kafka数据连接参数说明 - 数据治理中心 DataArts Studio

配置HDFS目的端参数 - 数据治理中心 DataArts Studio

如何处理API对应的数据表数据量较大时，获取数据总条数比较耗时的问题？ - 数据治理中心 DataArts Studio

MySQL到DMS Kafka参数调优 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线