搜索_华为云

MRS Spark SQL - 数据治理中心 DataArts Studio

MRS Spark SQL 功能通过MRS Spark SQL节点实现在MRS中执行预先定义的SparkSQL语句。参数用户可参考表1，表2和表3配置MRS Spark SQL节点的参数。表1 属性参数参数是否必选说明 MRS作业名称否 MRS的作业名称。如果未

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
同Region不同租户通过对等连接连通网络 - 数据治理中心 DataArts Studio

在配置实时同步任务前，您需要确保源端和目的端的数据库与运行实时同步任务的实时计算资源组之间网络连通，您可以根据数据库所在网络环境，选择合适的网络解决方案来实现网络连通。本章节主要为您介绍数据库部署在华为云，且与Migration资源组同Region不同租户的场景下，通过对等连接打通网络的方案。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在华为云
同Region不同租户通过企业路由器连通网络 - 数据治理中心 DataArts Studio

在配置实时同步任务前，您需要确保源端和目的端的数据库与运行实时同步任务的实时计算资源组之间网络连通，您可以根据数据库所在网络环境，选择合适的网络解决方案来实现网络连通。本章节主要为您介绍数据库部署在华为云，且与Migration资源组同Region不同租户场景下，通过企业路由器打通网络的方案。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在华为云
DLI Flink Job - 数据治理中心 DataArts Studio

DLI Flink Job 功能 DLI Flink Job节点用于创建和启动作业，或者查询DLI作业是否正在运行，实现实时流式大数据分析。 DLI Flink流式作业提交到DLI之后，若处于运行中的状态，则认为节点执行成功。若作业配置了周期调度，则会周期检查该Flink作业是否

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
数据开发概述 - 数据治理中心 DataArts Studio

数据连接：定义访问数据实体存储（计算）空间所需信息的集合，包括连接类型、名称和登录信息等。解决方案：解决方案为用户提供便捷的、系统的方式管理作业，更好地实现业务需求和目标。每个解决方案可以包含一个或多个业务相关的作业，一个作业可以被多个解决方案复用。作业：作业由一个或多个节点组成，执行作业可以完成对数据的一系列操作。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
约束与限制 - 数据治理中心 DataArts Studio

4xlarge实例规格网卡的基准/最大带宽为36/40 Gbps，理论极限值在360TB左右。对传输速度有要求的情况下可以使用多个数据集成实例实现。上述数据量为理论极限值，实际传输数据量受数据源类型、源和目的数据源读写性能、带宽等多方面因素制约，实测cdm.large规格最大可达到

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
文件增量迁移 - 数据治理中心 DataArts Studio

详见时间宏变量使用解析）。图1 文件过滤配置作业定时自动执行，“重复周期”为1天。这样每天就可以把昨天生成的文件都导入到目的端目录，实现增量同步。文件增量迁移场景下，“路径过滤器”的使用方法同“文件过滤器”一样，需要路径名称里带有时间字段，这样可以定期增量同步指定目录下的所有文件。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导 > 增量迁移原理介绍
配置PostgreSQL/SQL Server源端参数 - 数据治理中心 DataArts Studio

或表空间名称。如果选择界面没有待选择的模式或表空间，请确认对应连接里的账号是否有元数据查询的权限。说明：该参数支持配置通配符（*），实现导出以某一前缀开头或者以某一后缀结尾的所有数据库。例如： SCHEMA*表示导出所有以“SCHEMA”开头的数据库。 *SCHEMA表示导出所有以“SCHEMA”结尾的数据库。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置Oracle源端参数 - 数据治理中心 DataArts Studio

或表空间名称。如果选择界面没有待选择的模式或表空间，请确认对应连接里的账号是否有元数据查询的权限。说明：该参数支持配置通配符（*），实现导出以某一前缀开头或者以某一后缀结尾的所有数据库。例如： SCHEMA*表示导出所有以“SCHEMA”开头的数据库。 *SCHEMA表示导出所有以“SCHEMA”结尾的数据库。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
文件增量迁移 - 数据治理中心 DataArts Studio

详见时间宏变量使用解析）。图1 文件过滤配置作业定时自动执行，“重复周期”为1天。这样每天就可以把昨天生成的文件都导入到目的端目录，实现增量同步。文件增量迁移场景下，“路径过滤器”的使用方法同“文件过滤器”一样，需要路径名称里带有时间字段，这样可以定期增量同步指定目录下的所有文件。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践 > 增量迁移原理介绍
通过云专线连通网络 - 数据治理中心 DataArts Studio

前提条件已购买资源组，详情请参见购买数据集成资源组。已购买并配置云专线，与云上的至少一个虚拟私有云VPC连通。若未开通云专线请参考通过云专线实现云下IDC访问云上VPC和其他云对应官网资料进行配置。准备工作查询打通网络过程中所涉及到对象的网段（包含数据源、中转VPC、资源组），为便于理解，本章节将举例为您进行介绍。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在其他云
身份认证与访问控制 - 数据治理中心 DataArts Studio

为云资源的访问。关于IAM的详细介绍，请参见IAM产品介绍。 DataArts Studio仅支持基于系统角色的授权，不支持策略授权。为了实现精细的权限管控，DataArts Studio提供了系统角色+工作空间角色授权的能力，由工作空间角色授权具体的操作权限，并支持自定义不同权限点的工作空间角色。

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍 > 安全
权限治理使用流程 - 数据治理中心 DataArts Studio

统一权限治理对数据连接Agent、数据源版本和用户权限等均有相应的要求。在使用前，您应先检查并准备相关配置。同步IAM用户到数据源将IAM上的用户信息同步到数据源，以实现不同用户访问数据源时，能够根据其自身用户信息管控用户访问数据的权限。配置空间权限集空间权限集作为DataArts Studio工作空间

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理
通过CDM节点批量创建分表迁移作业 - 数据治理中心 DataArts Studio

在这种情况下，通过CDM进行数据集成时，需要针对每张表创建一个数据迁移作业。您可以参考本教程，通过数据开发模块的For Each节点和CDM节点，配合作业参数，实现批量创建分表迁移作业。本教程中，源端MySQL数据库中存在三张分表，分别是mail01、mail02和mail03，且表结构一致，数据内容不同。目的端为MRS

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
同步IAM用户到数据源 - 数据治理中心 DataArts Studio

默认情况下，用户通过DataArts Studio数据连接访问数据源（此处指MRS/DWS数据源）时，使用数据连接中的账号密码进行认证。为实现不同用户访问数据源时，能够根据其自身用户信息管控用户访问数据的权限，需要先将IAM上的用户信息同步到数据源上，然后不同用户在数据源上才能有

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理
示例场景说明 - 数据治理中心 DataArts Studio

统一统计口径，提供高质量数据报告数据质量监控告警统计每天收入统计某月收入统计不同支付类型收入占比流程简介本入门指导将参考如表1所示的流程，实现示例场景的数据治理。表1 DataArts Studio数据治理流程主流程说明子任务操作指导步骤1：流程设计在使用DataArts

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
数据架构示例 - 数据治理中心 DataArts Studio

数据架构示例 DataArts Studio数据架构以关系建模、维度建模理论支撑，实现规范化、可视化、标准化数据模型开发，定位于数据治理流程设计落地阶段，输出成果用于指导开发人员实践落地数据治理方法论。本章节操作场景如下：对MRS Hive数据湖中的出租车出行数据进行数据模型设计。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 使用教程
基本概念 - 数据治理中心 DataArts Studio

节点节点用于定义对数据执行的操作。例如，使用“MRS Spark”节点可以实现在MRS中执行预先定义的Spark作业。解决方案解决方案定位于为用户提供便捷的、系统的方式管理作业，更好地实现业务需求和目标。每个解决方案可以包含一个或多个业务相关的作业，一个作业可以被多个解决方案复用。

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
脚本及作业中引用参数使用介绍 - 数据治理中心 DataArts Studio

SQL脚本支持在脚本编辑器中直接输入参数（Flink SQL不支持），通过作业调度时可通过节点属性进行赋值，如2所示。 Shell脚本可以在编辑器上方配置参数和交互式参数以实现参数传递功能。 Python脚本支持参数传递功能。 SQL脚本支持在脚本编辑器中直接输入参数（Flink SQL不支持），脚本独立执行时可通过编辑器下方配置，如图5所示。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

的、具备高可靠性、高性能、可灵活扩展伸缩的、支持实时数据读写的分布式存储系统。使用MRS HBase可实现海量数据存储，并实现毫秒级数据查询。选择MRS HBase可以实现物流数据毫秒级实时入库更新，并支持百万级时序数据查询分析。 MapReduce服务（MRS Hive） H

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心

总条数： 299

上一页
1
...
5
6
7
...
15
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MRS Spark SQL - 数据治理中心 DataArts Studio

同Region不同租户通过对等连接连通网络 - 数据治理中心 DataArts Studio

同Region不同租户通过企业路由器连通网络 - 数据治理中心 DataArts Studio

DLI Flink Job - 数据治理中心 DataArts Studio

数据开发概述 - 数据治理中心 DataArts Studio

约束与限制 - 数据治理中心 DataArts Studio

文件增量迁移 - 数据治理中心 DataArts Studio

配置PostgreSQL/SQL Server源端参数 - 数据治理中心 DataArts Studio

配置Oracle源端参数 - 数据治理中心 DataArts Studio

文件增量迁移 - 数据治理中心 DataArts Studio

通过云专线连通网络 - 数据治理中心 DataArts Studio

身份认证与访问控制 - 数据治理中心 DataArts Studio

权限治理使用流程 - 数据治理中心 DataArts Studio

通过CDM节点批量创建分表迁移作业 - 数据治理中心 DataArts Studio

同步IAM用户到数据源 - 数据治理中心 DataArts Studio

示例场景说明 - 数据治理中心 DataArts Studio

数据架构示例 - 数据治理中心 DataArts Studio

基本概念 - 数据治理中心 DataArts Studio

脚本及作业中引用参数使用介绍 - 数据治理中心 DataArts Studio

DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线