搜索_华为云

实时集成作业监控 - 数据治理中心 DataArts Studio

实时集成作业监控实时集成作业监控提供了对实时处理集成作业的状态进行监控的能力。实时处理集成作业处理实时的连续数据，主要用于实时性要求高的场景。实时作业是由一个或多个节点组成的流水线，每个节点配置独立的、节点级别的调度策略，而且节点启动的任务可以永不下线。在实时作业里，带箭头的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 作业监控
新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
新建DataArts Studio与MRS Hive数据湖的连接 - 数据治理中心 DataArts Studio

新建DataArts Studio与MRS Hive数据湖的连接本章节以新建MRS Hive连接为例，介绍如何建立DataArts Studio与数据湖底座之间的数据连接。前提条件在创建数据连接前，请确保您已创建所要连接的数据湖（如DataArts Studio所支持的数据库、云服务等）。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 管理中心典型场景教程
正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

正则表达式分隔半结构化文本在创建表/文件迁移作业时，对简单CSV格式的文件，CDM可以使用字段分隔符进行字段分隔。但是对于一些复杂的半结构化文本，由于字段值也包含了分隔符，所以无法使用分隔符进行字段分隔，此时可以使用正则表达式分隔。正则表达式参数在源端作业参数中配置，要求源连

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

正则表达式分隔半结构化文本在创建表/文件迁移作业时，对简单CSV格式的文件，CDM可以使用字段分隔符进行字段分隔。但是对于一些复杂的半结构化文本，由于字段值也包含了分隔符，所以无法使用分隔符进行字段分隔，此时可以使用正则表达式分隔。正则表达式参数在源端作业参数中配置，要求源连

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
终端节点Endpoint - 数据治理中心 DataArts Studio

终端节点Endpoint 获取终端节点终端节点（Endpoint）即调用API的请求地址，不同服务不同区域的终端节点不同。数据治理中心的终端节点Endpoint构造规则如下，请您根据业务需要选择对应区域的终端节点。 CDM数据集成接口：cdm.{region_id}.myhuaweicloud

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 使用前必读
配置API调用流控策略 - 数据治理中心 DataArts Studio

配置API调用流控策略操作场景 DataArts Studio数据服务的API流量控制基于指定规则对API的访问流量进行调节控制的限流策略，能够提供多种维度的后端服务保护功能。当前API流控支持通过用户、应用和时间段等不同维度限制API的调用次数。为了提供持续稳定的服务，您需

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API
构造请求 - 数据治理中心 DataArts Studio

构造请求本节介绍REST API请求的组成，并以调用IAM服务的管理员创建IAM用户接口为例说明如何调用API。该API用于管理员创建IAM用户。您还可以通过这个视频教程了解如何构造请求调用API：https://bbs.huaweicloud.com/videos/102987

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 如何调用API
SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

SQLServer到MRS Hudi参数调优源端优化 SQLServer抽取优化暂无优化配置项。目的端优化 Hudi写入优化 Hudi表写入性能慢，优先审视表设计是否合理，建议使用Hudi Bucket索引的MOR表，并根据实际数据量配置Bucket桶数，以达到Migration写入性能最佳。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

Oracle到MRS Hudi参数调优源端优化 Oracle抽取优化暂无优化配置项。目的端优化 Hudi写入优化 Hudi表写入性能慢，优先审视表设计是否合理，建议使用Hudi Bucket索引的MOR表，并根据实际数据量配置Bucket桶数，以达到Migration写入性能最佳。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
查看作业实例 - 数据治理中心 DataArts Studio

查看作业实例作业实例的数据保留最近90天的结果。界面说明介绍“数据质量监控 > 运维管理”页面中的区域和按键功能。图1 页面区域说明表1 运维管理页面序号区域描述 1 导航栏左侧导航栏，包括数据质量规则的存储目录。用户可以根据实际需要对规则进行分目录存放，每级

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
上传CDM连接驱动 - 数据治理中心 DataArts Studio

上传CDM连接驱动 JDBC即Java DataBase Connectivity，java数据库连接；JDBC提供的API可以让JAVA通过API方式访问关系型数据库，执行SQL语句，获取数据。 CDM连接关系数据库前，需要先上传所需关系数据库的JDK8版本.jar格式驱动。前提条件

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
配置MySql源端参数 - 数据治理中心 DataArts Studio

配置MySql源端参数支持从MySQL导出数据。表1 MySQL作为源端时的作业参数参数类型参数名说明取值样例基本参数使用SQL语句导出关系型数据库的数据时，您可以选择使用自定义SQL语句导出。否 SQL语句 “使用SQL语句”选择“是”时，您可以在这里输入自

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
配置PostgreSQL源端参数 - 数据治理中心 DataArts Studio

配置PostgreSQL源端参数支持从云端的数据库服务导出数据。这些非云服务的数据库，既可以是用户在本地数据中心自建的数据库，也可以是用户在ECS上部署的，还可以是第三方云上的数据库服务。表1 PostgreSQL作为源端时的作业参数参数类型参数名说明取值样例基本参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
审批中心 - 数据治理中心 DataArts Studio

审批中心对于简单模式工作空间，当前支持开发者在提交脚本和作业时，由指定审核人进行审批。审批中心可以对单据审批进行统一管理，对审批人进行工作空间级的配置和维护。约束与限制仅当前工作空间的管理员或者拥有DAYU Administrator、Tenant Administrato

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
管理资源 - 数据治理中心 DataArts Studio

管理资源用户可以通过资源管理功能，上传自定义代码或文本文件作为资源，在节点运行时调用。可调用资源的节点包含DLI Spark、MRS Spark、MRS MapReduce和DLI Flink Job。创建资源后，配置资源关联的文件。在作业中可以直接引用资源。当资源文件变更，

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理
配置Oracle源端参数 - 数据治理中心 DataArts Studio

配置Oracle源端参数支持从Oracle导出数据。表1 Oracle作为源端时的作业参数参数类型参数名说明取值样例基本参数使用SQL语句导出关系型数据库的数据时，您可以选择使用自定义SQL语句导出。否 SQL语句 “使用SQL语句”选择“是”时，您可以在这里

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
CDM作业配置管理 - 数据治理中心 DataArts Studio

CDM作业配置管理 CDM作业管理界面的“配置管理”页签，主要操作如下：最大抽取并发数定时备份/恢复作业参数的环境变量最大抽取并发数最大抽取并发数即集群最大抽取并发数。此处的“最大抽取并发数”参数与集群配置处的“最大抽取并发数”参数同步，在任意一处修改即可生效。 CD

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业

总条数： 933

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

实时集成作业监控 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

新建DataArts Studio与MRS Hive数据湖的连接 - 数据治理中心 DataArts Studio

正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

终端节点Endpoint - 数据治理中心 DataArts Studio

配置API调用流控策略 - 数据治理中心 DataArts Studio

构造请求 - 数据治理中心 DataArts Studio

SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

查看作业实例 - 数据治理中心 DataArts Studio

上传CDM连接驱动 - 数据治理中心 DataArts Studio

配置MySql源端参数 - 数据治理中心 DataArts Studio

配置PostgreSQL源端参数 - 数据治理中心 DataArts Studio

审批中心 - 数据治理中心 DataArts Studio

管理资源 - 数据治理中心 DataArts Studio

配置Oracle源端参数 - 数据治理中心 DataArts Studio

CDM作业配置管理 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线