搜索_华为云

新建DataArts Studio与MRS Hive数据湖的连接 - 数据治理中心 DataArts Studio

新建DataArts Studio与MRS Hive数据湖的连接本章节以新建MRS Hive连接为例，介绍如何建立DataArts Studio与数据湖底座之间的数据连接。前提条件在创建数据连接前，请确保您已创建所要连接的数据湖（如DataArts Studio所支持的数据库、云服务等）。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 管理中心典型场景教程
终端节点Endpoint - 数据治理中心 DataArts Studio

终端节点Endpoint 获取终端节点终端节点（Endpoint）即调用API的请求地址，不同服务不同区域的终端节点不同。数据治理中心的终端节点Endpoint构造规则如下，请您根据业务需要选择对应区域的终端节点。 CDM数据集成接口：cdm.{region_id}.myhuaweicloud

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 使用前必读
CDM迁移近一个月的数据 - 数据治理中心 DataArts Studio

CDM迁移近一个月的数据备HBase集群中约10TB数据，最近一个月新增的数据量约60TB，总共约70TB。H公司安装的云专线为20GE端口，支持CDM超大规格的集群（cdm.xlarge），综合考虑迁移时间、成本、性能等，这里使用2个CDM超大规格集群并行迁移。CDM集群规格如表1所示。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖
贸易数据上云场景介绍 - 数据治理中心 DataArts Studio

贸易数据上云场景介绍使用云数据迁移（Cloud Data Migration，简称CDM）将本地贸易统计数据导入到OBS，再使用数据湖探索（Data Lake Insight，简称DLI）进行贸易统计分析，帮助H咨询公司以极简、极低成本构建其大数据分析平台，使得该公司更好地聚焦业务，持续创新。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 贸易数据极简上云与统计分析
配置API调用流控策略 - 数据治理中心 DataArts Studio

配置API调用流控策略操作场景 DataArts Studio数据服务的API流量控制基于指定规则对API的访问流量进行调节控制的限流策略，能够提供多种维度的后端服务保护功能。当前API流控支持通过用户、应用和时间段等不同维度限制API的调用次数。为了提供持续稳定的服务，您需

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API
修改连接 - 数据治理中心 DataArts Studio

r：Kafka连接。dis-connector：DIS连接。elasticsearch-connector：Elasticsearch/云搜索服务连接。dli-connector：DLI连接。 http-connector：HTTP/HTTPS连接，该连接暂无连接参数。dms-k

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 连接管理
构造请求 - 数据治理中心 DataArts Studio

构造请求本节介绍REST API请求的组成，并以调用IAM服务的管理员创建IAM用户接口为例说明如何调用API。该API用于管理员创建IAM用户。您还可以通过这个视频教程了解如何构造请求调用API：https://bbs.huaweicloud.com/videos/102987

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 如何调用API
SQLServer同步到MRS Hudi - 数据治理中心 DataArts Studio

SQLServer同步到MRS Hudi 源端优化 SQLServer抽取优化暂无优化配置项。目的端优化 Hudi写入优化 Hudi表写入性能慢，优先审视表设计是否合理，建议使用Hudi Bucket索引的MOR表，并根据实际数据量配置Bucket桶数，以达到Migration写入性能最佳。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
Oracle同步到MRS Hudi - 数据治理中心 DataArts Studio

Oracle同步到MRS Hudi 源端优化 Oracle抽取优化暂无优化配置项。目的端优化 Hudi写入优化 Hudi表写入性能慢，优先审视表设计是否合理，建议使用Hudi Bucket索引的MOR表，并根据实际数据量配置Bucket桶数，以达到Migration写入性能最佳。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
创建连接 - 数据治理中心 DataArts Studio

r：Kafka连接。dis-connector：DIS连接。elasticsearch-connector：Elasticsearch/云搜索服务连接。dli-connector：DLI连接。 http-connector：HTTP/HTTPS连接，该连接暂无连接参数。dms-k

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 连接管理
配置MySql源端参数 - 数据治理中心 DataArts Studio

配置MySql源端参数支持从MySQL导出数据。表1 MySQL作为源端时的作业参数参数类型参数名说明取值样例基本参数使用SQL语句导出关系型数据库的数据时，您可以选择使用自定义SQL语句导出。否 SQL语句 “使用SQL语句”选择“是”时，您可以在这里输入自

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
配置PostgreSQL源端参数 - 数据治理中心 DataArts Studio

配置PostgreSQL源端参数支持从云端的数据库服务导出数据。这些非云服务的数据库，既可以是用户在本地数据中心自建的数据库，也可以是用户在ECS上部署的，还可以是第三方云上的数据库服务。表1 PostgreSQL作为源端时的作业参数参数类型参数名说明取值样例基本参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
CDM作业配置管理 - 数据治理中心 DataArts Studio

CDM作业配置管理 CDM作业管理界面的“配置管理”页签，主要操作如下：最大抽取并发数定时备份/恢复作业参数的环境变量最大抽取并发数最大抽取并发数即集群最大抽取并发数。此处的“最大抽取并发数”参数与集群配置处的“最大抽取并发数”参数同步，在任意一处修改即可生效。 CD

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
管理资源 - 数据治理中心 DataArts Studio

管理资源用户可以通过资源管理功能，上传自定义代码或文本文件作为资源，在节点运行时调用。可调用资源的节点包含DLI Spark、MRS Spark、MRS MapReduce和DLI Flink Job。创建资源后，配置资源关联的文件。在作业中可以直接引用资源。当资源文件变更，

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理
配置Oracle源端参数 - 数据治理中心 DataArts Studio

配置Oracle源端参数支持从Oracle导出数据。表1 Oracle作为源端时的作业参数参数类型参数名说明取值样例基本参数使用SQL语句导出关系型数据库的数据时，您可以选择使用自定义SQL语句导出。否 SQL语句 “使用SQL语句”选择“是”时，您可以在这里

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
数据架构使用流程 - 数据治理中心 DataArts Studio

数据架构使用流程 DataArts Studio数据架构的流程如下：图1 数据架构流程准备工作：添加审核人：在数据架构中，业务流程中的步骤都需要经过审批，因此，需要先添加审核人。只有工作空间管理员角色的用户才具有添加审核人的权限。管理配置中心：数据架构中提供了丰富的自定义

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构
新建作业 - 数据治理中心 DataArts Studio

新建作业作业由一个或多个节点组成，共同执行以完成对数据的一系列操作。开发作业前请先新建作业。前提条件作业在每个工作空间的最大配额为10000，作业目录最多5000个，目录层级最多为10层。请确保当前数量未达到最大配额。新建普通目录如果已存在可用的目录，则可以跳过当前操作。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
编排API简介 - 数据治理中心 DataArts Studio

编排API简介数据服务API编排是指将已经开发好的服务API接口，在无需编写复杂代码的情况下，根据特定的业务逻辑和流程进行可视化的重组和重构，从而实现在不影响原生接口的前提下进行简便的二次开发。API编排为您提供拖拽式、可视化的API工作流程编排能力，您可以按照业务逻辑，以串行

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API
步骤2：数据准备 - 数据治理中心 DataArts Studio

步骤2：数据准备使用DataArts Studio前的准备如果您是第一次使用DataArts Studio，请参考购买并配置DataArts Studio章节完成注册华为账号、购买DataArts Studio实例（DataArts Studio企业版）、创建工作空间等一系列

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
配置条件分支算子 - 数据治理中心 DataArts Studio

配置条件分支算子条件分支算子通过获取上游算子的请求参数或结果集进行条件判断，根据定义的表达式来确定下一步执行的分支。注意，多个分支满足条件时仅执行第一个满足条件的分支。表1 条件分支算子参数说明分支1 条件类型选择条件类型。满足当前条件时：表示传入“条件分支”的数据满足指定的表达式时，将执行该分支。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API

总条数： 649

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新建DataArts Studio与MRS Hive数据湖的连接 - 数据治理中心 DataArts Studio

终端节点Endpoint - 数据治理中心 DataArts Studio

CDM迁移近一个月的数据 - 数据治理中心 DataArts Studio

贸易数据上云场景介绍 - 数据治理中心 DataArts Studio

配置API调用流控策略 - 数据治理中心 DataArts Studio

修改连接 - 数据治理中心 DataArts Studio

构造请求 - 数据治理中心 DataArts Studio

SQLServer同步到MRS Hudi - 数据治理中心 DataArts Studio

Oracle同步到MRS Hudi - 数据治理中心 DataArts Studio

创建连接 - 数据治理中心 DataArts Studio

配置MySql源端参数 - 数据治理中心 DataArts Studio

配置PostgreSQL源端参数 - 数据治理中心 DataArts Studio

CDM作业配置管理 - 数据治理中心 DataArts Studio

管理资源 - 数据治理中心 DataArts Studio

配置Oracle源端参数 - 数据治理中心 DataArts Studio

数据架构使用流程 - 数据治理中心 DataArts Studio

新建作业 - 数据治理中心 DataArts Studio

编排API简介 - 数据治理中心 DataArts Studio

步骤2：数据准备 - 数据治理中心 DataArts Studio

配置条件分支算子 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线