搜索_华为云

MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

只按照数据条数计算。在debezium.max.queue.size无法有效限制内存占用时，考虑显式设置该值来限制缓存数据的大小。目的端优化 Hudi写入优化。 Hudi表写入性能慢，优先审视表设计是否合理，建议使用Hudi Bucket索引的MOR表，并根据实际数据量配置B

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
HDFS连接 - 数据治理中心 DataArts Studio

运行模式连接其中一个集群，其余需使用STANDALONE。 linkConfig.properties 否 Map 属性配置，可以添加客户端的配置属性，所添加的每个属性需配置属性名称和值父主题：连接参数说明

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
MySQL到DMS Kafka参数调优 - 数据治理中心 DataArts Studio

只按照数据条数计算。在debezium.max.queue.size无法有效限制内存占用时，考虑显式设置该值来限制缓存数据的大小。目的端优化 Kafka写入优化。 Kafka写入通常速率极快，若有阻塞的场景请优先增加并发解决。父主题：任务性能调优

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
支持的数据源 - 数据治理中心 DataArts Studio

支持的数据源实时集成作业支持的数据源如表1所示。表1 实时集成作业支持的数据源数据源分类源端数据源对应的目的端数据源相关文档说明关系型数据 MySQL Hadoop：MRS Hudi MySQL同步到MRS Hudi作业配置 MySQL数据库建议使用版本：5.6、5

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
MRS Spark Python - 数据治理中心 DataArts Studio

MRS Spark Python 功能通过MRS Spark Python节点实现在MRS中执行预先定义的Spark Python作业。 MRS Spark Python算子的具体使用教程，请参见开发一个MRS Spark Python作业。参数用户可参考表1，表2和表3配置MRS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
简易变量集参考 - 数据治理中心 DataArts Studio

简易变量集参考简易变量集提供了一系列自定义的变量，自定义参数会根据任务调度的业务日期、计划时间及参数的取值格式自动替换为具体的值，实现在任务调度时间内参数的动态替换。当前系统支持业务日期、计划时间、业务id三类参数的自定义。业务日期是指在调度时间内，任务预期调度运行时间的前

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
源端为FTP/SFTP - 数据治理中心 DataArts Studio

BINARY_FILE：二进制格式，不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。当选择“BINARY_FILE”时，目的端也必须为文件系统。 fromJobConfig.lineSeparator 否 String 文件中的换行符，默认自动识别"\\n"、"\\

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
创建数据标准 - 数据治理中心 DataArts Studio

创建数据标准功能介绍创建数据标准。调用方法请参见如何调用API。 URI POST /v2/{project_id}/design/standards 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见项目ID和账号ID。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 数据标准接口
MRS Ranger数据连接参数说明 - 数据治理中心 DataArts Studio

MRS Ranger数据连接参数说明表1 MRS Ranger数据连接参数是否必选说明数据连接类型是 MRS Ranger连接固定选择为MapReduce服务（MRS Ranger）。数据连接名称是数据连接的名称，只能包含字母、数字、下划线和中划线，且长度不超过100个字符。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
获取主题树信息 - 数据治理中心 DataArts Studio

获取主题树信息功能介绍获取数据资产主题树信息l1，l2，l3。调用方法请参见如何调用API。 URI GET /v2/{project_id}/design/subjects/business 表1 路径参数参数是否必选参数类型描述 project_id 是 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 主题管理接口
实时集成作业监控 - 数据治理中心 DataArts Studio

在作业的“操作”列，支持作业级别的恢复。停止操作请参见实时集成作业监控：恢复。 6 查看作业实例状态单击作业名称前方的，查看该作业下的子作业ID、源端数据源、目的端数据源、异常信息等内容。 7 查看作业详细信息单击作业名称，支持查看该作业的基本信息、监控信息、日志信息。查看作业详细信息请参见实时集成作业监控：查看作业详细信息。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 作业监控
HBase连接 - 数据治理中心 DataArts Studio

运行模式连接其中一个集群，其余需使用STANDALONE。 linkConfig.properties 否 Map 属性配置，可以添加客户端的配置属性，所添加的每个属性需配置属性名称和值父主题：连接参数说明

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
CDM有哪些优势？ - 数据治理中心 DataArts Studio

示。表1 CDM优势优势项用户自行开发 CDM 易使用自行准备服务器资源，安装配置必要的软件并进行配置，等待时间长。程序在读写两端会根据数据源类型，使用不同的访问接口，一般是数据源提供的对外接口，例如JDBC、原生API等，因此在开发脚本时需要依赖大量的库、SDK等，开发管理成本较高。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
数据仓库服务（DWS）连接参数说明 - 数据治理中心 DataArts Studio

配置过大或过小，可能影响作业的时长。 1000 单次提交行数可选参数，单击“显示高级属性”后显示。指定每次批量提交的行数，根据数据目的端和作业数据规模的大小配置该参数。如果配置过大或过小，可能影响作业的时长。 10000 SSL加密可选参数，控制是否通过SSL加密方式连接数据仓库。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
配置元数据采集任务 - 数据治理中心 DataArts Studio

配置元数据采集任务本章主要介绍如何通过配置元数据采集策略新建采集任务，不同类型的数据源对应的采集策略不尽相同。元数据管理依据采集任务的配置策略，采集对应的技术元数据信息。约束与限制当元数据采集任务未指定采集范围时，默认采集该数据连接下的所有数据表/文件。采集任务运行完成后，

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 采集数据源的元数据
MRS Hetu数据连接参数说明 - 数据治理中心 DataArts Studio

MRS Hetu数据连接参数说明表1 MRS Hetu数据连接参数是否必选说明数据连接类型是 MRS Hetu连接固定选择为MapReduce服务（MRS Hetu）。数据连接名称是数据连接的名称，只能包含字母、数字、下划线和中划线，且长度不超过100个字符。标签

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
MRS Impala数据连接参数说明 - 数据治理中心 DataArts Studio

MRS Impala数据连接参数说明表1 MRS Impala数据连接参数是否必选说明数据连接类型是 MRS Impala连接固定选择为MapReduce服务（MRS Impala）。数据连接名称是数据连接的名称，只能包含字母、数字、下划线和中划线，且长度不超过100个字符。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
源端为HDFS - 数据治理中心 DataArts Studio

CSV_FILE：CSV格式。 PARQUET_FILE：PARQUET格式。 BINARY_FILE：二进制格式。当选择“BINARY_FILE”时，目的端也必须为文件系统。 fromJobConfig.columnList 否 String 需要抽取的列号，列号之间使用“&”分割，并由小到大排序，例如：“1&3&5”。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
字段转换器配置指导 - 数据治理中心 DataArts Studio

概率无法获得所有列），则可以单击后选择“添加新字段”来手动增加，确保导入到目的端的数据完整。关系数据库、Hive、MRS Hudi及DLI做源端时，不支持获取样值功能。 SQLServer作为目的端数据源时，不支持timestamp类型字段的写入，需修改为其他时间类型字段写入（如datetime）。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

式”必须选择“CSV格式”。图1 正则表达式参数在迁移CSV格式的文件时，CDM支持使用正则表达式分隔字段，并按照解析后的结果写入目的端。正则表达式语法请参考对应的相关资料，这里举例下面几种日志文件的正则表达式的写法： Log4J日志 Log4J审计日志 Tomcat日志 Django日志

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践

总条数： 406

上一页
1
...
16
17
18
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

HDFS连接 - 数据治理中心 DataArts Studio

MySQL到DMS Kafka参数调优 - 数据治理中心 DataArts Studio

支持的数据源 - 数据治理中心 DataArts Studio

MRS Spark Python - 数据治理中心 DataArts Studio

简易变量集参考 - 数据治理中心 DataArts Studio

源端为FTP/SFTP - 数据治理中心 DataArts Studio

创建数据标准 - 数据治理中心 DataArts Studio

MRS Ranger数据连接参数说明 - 数据治理中心 DataArts Studio

获取主题树信息 - 数据治理中心 DataArts Studio

实时集成作业监控 - 数据治理中心 DataArts Studio

HBase连接 - 数据治理中心 DataArts Studio

CDM有哪些优势？ - 数据治理中心 DataArts Studio

数据仓库服务（DWS）连接参数说明 - 数据治理中心 DataArts Studio

配置元数据采集任务 - 数据治理中心 DataArts Studio

MRS Hetu数据连接参数说明 - 数据治理中心 DataArts Studio

MRS Impala数据连接参数说明 - 数据治理中心 DataArts Studio

源端为HDFS - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线