搜索_华为云

正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

classpath.extra 正则表达式为： ^(\d.*\d) (\w*) \[(.*)\] (\w.*).* 解析出的结果如下：表1 Log4J日志解析结果列号样值 1 2018-01-11 08:50:59,001 2 INFO 3 org.apache.sqoop

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

classpath.extra 正则表达式为： ^(\d.*\d) (\w*) \[(.*)\] (\w.*).* 解析出的结果如下：表1 Log4J日志解析结果列号样值 1 2018-01-11 08:50:59,001 2 INFO 3 org.apache.sqoop

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
使用Python脚本连接MRS安全集群执行Impala SQL - 数据治理中心 DataArts Studio

使用Python脚本连接MRS安全集群执行Impala SQL 第一步：在执行任务的服务器上安装相应的包 pip install krbcontext（版本0.10） pip install kerberos（版本1.3.1） pip install impala 命令样例如下：

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
数据血缘方案简介 - 数据治理中心 DataArts Studio

数据血缘的产生： DataArts Studio数据血缘解析方案包含自动分析血缘和手动配置血缘两种方式。一般推荐使用自动血缘解析的方式，无需手动配置即可生成血缘关系，在不支持自动血缘解析的场景下，再手动配置血缘关系。自动血缘解析，是由系统解析数据开发作业中的数据处理和数据迁移类型节点后自

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系
数据血缘方案简介 - 数据治理中心 DataArts Studio

数据血缘的产生： DataArts Studio数据血缘解析方案包含自动分析血缘和手动配置血缘两种方式。一般推荐使用自动血缘解析的方式，无需手动配置即可生成血缘关系，在不支持自动血缘解析的场景下，再手动配置血缘关系。自动血缘解析，是由系统解析数据开发作业中的数据处理和数据迁移类型节点后自

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考 > 节点数据血缘
配置Kafka/DMS Kafka源端参数 - 数据治理中心 DataArts Studio

est2 数据格式解析数据时使用的格式：二进制格式：适用于文件迁移场景，不解析数据内容原样传输。 CSV格式：以CSV格式解析源数据。 JSON：以JSON格式解析源数据。 CDC（DRS）：以DRS格式解析源数据。 CDC（JSON）：以JSON格式解析源数据。 CDC（D

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
源端为Kafka - 数据治理中心 DataArts Studio

请输入有效的消费组ID。 fromJobConfig.dataFormat 是枚举解析数据时使用的格式： BINARY：适用于文件迁移场景，不解析数据内容原样传输。 CSV：以CSV格式解析源数据。 fromJobConfig.maxPollRecords 否 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
源端为DIS - 数据治理中心 DataArts Studio

DIS分区ID，该参数支持输入多个分区ID，使用“,”分隔。 fromJobConfig.dataFormat 是枚举解析数据时使用的格式： BINARY：适用于文件迁移场景，不解析数据内容原样传输。 CSV：以CSV格式解析源数据。 fromJobConfig.separator 否 String 字段分隔符。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
获取Rest Client节点返回值教程 - 数据治理中心 DataArts Studio

本教程主要介绍如何获取Rest Client的返回值，包含以下两个使用场景举例。通过“响应消息体解析为传递参数定义”获取返回值通过EL表达式获取返回值通过“响应消息体解析为传递参数定义”获取返回值如图1所示，第一个Rest Client调用了MRS服务查询集群列表的AP

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
获取Rest Client节点返回值教程 - 数据治理中心 DataArts Studio

本教程主要介绍如何获取Rest Client的返回值，包含以下两个使用场景举例。通过“响应消息体解析为传递参数定义”获取返回值通过EL表达式获取返回值通过“响应消息体解析为传递参数定义”获取返回值如图1所示，第一个Rest Client调用了MRS服务查询集群列表的AP

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
解绑/绑定CDM集群的EIP - 数据治理中心 DataArts Studio

解绑/绑定CDM集群的EIP 操作场景 CDM集群创建完成后，支持解绑或绑定EIP。EIP即弹性公网IP，由虚拟私有云（Virtual Private Cloud，简称VPC）负责其计费。如果CDM需要访问本地数据源、Internet的数据源，或者跨VPC的云服务，则必须要为C

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 创建并管理CDM集群
如何降低CDM使用成本？ - 数据治理中心 DataArts Studio

如何降低CDM使用成本？如果是迁移公网的数据上云，可以使用NAT网关服务，实现CDM服务与子网中的其他弹性云服务器共享弹性IP，可以更经济、更方便的通过Internet迁移本地数据中心或第三方云上的数据。具体操作如下：假设已经创建好了CDM集群（无需为CDM集群绑定专用弹性

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
配置CDM作业定时任务 - 数据治理中心 DataArts Studio

荐您启用数据开发调度即可，无需配置CDM定时任务。定时任务功能原理：采用Java Quartz定时器，类似Cron表达式配置。对起始时间解析出分，小时，天，月。构造出cronb表达式。以配置天调度为例：重复周期选择1天：若当前时间2022/10/14 12:00，配置起始时间为2022/10/14

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
配置Kafka源端参数 - 数据治理中心 DataArts Studio

取值样例基本参数 Topic 主题名称。支持单个topic。 cdm_topic 数据格式解析数据时使用的格式： JSON：以JSON格式解析源数据。 CSV格式：以CSV格式解析源数据。 JSON格式消费组ID 用户指定消费组ID。如果是从DMS Kafka导出数据，专

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
Elasticsearch连接参数说明 - 数据治理中心 DataArts Studio

Elasticsearch连接参数说明 Elasticsearch连接适用于第三方云的Elasticsearch服务，以及用户在本地数据中心或ECS上自建的Elasticsearch。 Elasticsearch连接器仅支持非安全模式的Elasticsearch集群。作业运行中

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
数据目录如何可视化展示数据血缘？ - 数据治理中心 DataArts Studio

数据目录如何可视化展示数据血缘？数据血缘在数据目录中展示，首先要完成元数据采集任务，其次数据开发作业中要包含支持自动血缘解析的节点类型和场景，或者在作业节点中已自定义血缘关系的输入表和输出表。当存在运行成功的数据开发作业调度任务时，系统会生成作业中的血缘关系，并在数据目录中进行可视化展示。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据目录
附录 - 数据治理中心 DataArts Studio

附录公共消息头解析响应消息体中的流状态码错误码

 帮助中心 > 数据治理中心 DataArts Studio > API参考
配置OBS源端参数 - 数据治理中心 DataArts Studio

CSV格式：以CSV格式解析源文件，用于迁移文件到数据表的场景。 JSON格式：以JSON格式解析源文件，一般都是用于迁移文件到数据表的场景。 ORC格式：以ORC格式解析源文件，一般都是用于迁移文件到数据表的场景。 PARQUET格式：以PARQUET格式解析源文件，一般都是用于迁移文件到数据表的场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

文件格式指CDM以哪种格式解析数据，可选择以下格式： CSV格式：以CSV格式解析源文件，用于迁移文件到数据表的场景。二进制格式：选择“二进制格式”时不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。 JSON格式：以JSON格式解析源文件，一般都是用于迁移文件到数据表的场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
Elasticsearch整库迁移到云搜索服务 - 数据治理中心 DataArts Studio

Elasticsearch整库迁移到云搜索服务操作场景云搜索服务（Cloud Search Service）为用户提供结构化、非结构化文本的多条件检索、统计、报表，本章节介绍如何通过CDM将本地Elasticsearch整库迁移到云搜索服务中，流程如下：创建CDM集群并绑定EIP

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程

总条数： 200

上一页
1
2
3
4
5
...
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

使用Python脚本连接MRS安全集群执行Impala SQL - 数据治理中心 DataArts Studio

数据血缘方案简介 - 数据治理中心 DataArts Studio

数据血缘方案简介 - 数据治理中心 DataArts Studio

配置Kafka/DMS Kafka源端参数 - 数据治理中心 DataArts Studio

源端为Kafka - 数据治理中心 DataArts Studio

源端为DIS - 数据治理中心 DataArts Studio

获取Rest Client节点返回值教程 - 数据治理中心 DataArts Studio

获取Rest Client节点返回值教程 - 数据治理中心 DataArts Studio

解绑/绑定CDM集群的EIP - 数据治理中心 DataArts Studio

如何降低CDM使用成本？ - 数据治理中心 DataArts Studio

配置CDM作业定时任务 - 数据治理中心 DataArts Studio

配置Kafka源端参数 - 数据治理中心 DataArts Studio

Elasticsearch连接参数说明 - 数据治理中心 DataArts Studio

数据目录如何可视化展示数据血缘？ - 数据治理中心 DataArts Studio

附录 - 数据治理中心 DataArts Studio

配置OBS源端参数 - 数据治理中心 DataArts Studio

配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

Elasticsearch整库迁移到云搜索服务 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线