搜索_华为云

创建数据集成作业 - 数据治理中心 DataArts Studio

中，并标准化为点数据集和边数据集。 MySQL到MRS Hive迁移作业：正式业务流程中，需要将MySQL中的原始样例数据需要导入MRS Hive中，并标准化为点数据集和边数据集。创建集群批量数据迁移集群提供数据上云和数据入湖的集成能力，全向导式配置和管理，支持单表、整库、增量、周期性数据集成。DataArts

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 图数据自动化构建与分析
新建表/文件迁移作业 - 数据治理中心 DataArts Studio

约束限制记录脏数据功能依赖于OBS服务。作业导入时，JSON文件大小不超过1MB。单文件传输大小不超过1TB。配置源端和目的端参数时，字段名不可包含&和%。前提条件已新建连接，详情请参见创建CDM与数据源之间的连接。 CDM集群与待迁移数据源可以正常通信。操作步骤进入

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
基线运维概述 - 数据治理中心 DataArts Studio

基线运维概述基线运维功能当前需申请白名单后才能使用。如需使用该特性，请联系客服或技术支持人员。当前仅北京四、华南广州和上海一局点给用户开放使用。基线运维功能支持用户通过配置基线任务，实现对任务运行状态及资源使用情况的监控；通过配置运维基线，保障复杂依赖场景下重要数据在预期时

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 基线运维
DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

检测网络连通性：数据连接和资源组配置完成后需要测试整个迁移任务的网络连通性，可通过以下方式进行数据源和资源组之间的连通性测试。单击展开“源端配置”触发连通性测试，会对整个迁移任务的连通性做校验。单击源端和目的端数据源和资源组中的“测试”按钮进行检测。网络连通性检测异常可先参考数据源和资源组网络不通如何排查？章节进行排查。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
通过CDM节点批量创建分表迁移作业 - 数据治理中心 DataArts Studio

个数据迁移作业。您可以参考本教程，通过数据开发模块的For Each节点和CDM节点，配合作业参数，实现批量创建分表迁移作业。本教程中，源端MySQL数据库中存在三张分表，分别是mail01、mail02和mail03，且表结构一致，数据内容不同。目的端为MRS Hive服务。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
产品功能 - 数据治理中心 DataArts Studio

器学习等多种任务类型，通过任务间依赖完成复杂数据分析处理。支持导入和导出作业。资源管理支持统一管理在脚本开发和作业开发使用到的file、jar、archive类型的资源。作业调度支持单次调度、周期调度和事件驱动调度，周期调度支持分钟、小时、天、周、月多种调度周期。作业

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
开发Pipeline作业 - 数据治理中心 DataArts Studio

开发Pipeline作业对已新建的作业进行开发和配置。开发Pipeline模式的批处理作业和实时处理作业，请您参考编排作业节点、配置作业基本信息、配置作业参数和调测并保存作业章节。前提条件已创建作业，详情请参见新建作业。当前用户已锁定该作业，否则需要通过“抢锁”锁定作业

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
参考：作业分片维度 - 数据治理中心 DataArts Studio

文档数据库服务（DDS）不支持分片。 MongoDB 不支持分片。 Cassandra 支持按Cassandra的token range分片。消息系统数据接入服务（DIS）支持按topic分片。 Apache Kafka 支持按topic分片。 DMS Kafka 支持按topic分片。 MRS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
时间宏变量使用解析 - 数据治理中心 DataArts Studio

时间宏变量使用解析在创建表/文件迁移作业时，CDM支持在源端和目的端的以下参数中配置时间宏变量：源端的源目录或文件源端的表名 “通配符”过滤类型中的目录过滤器和文件过滤器 “时间过滤”中的起始时间和终止时间分区过滤条件和Where子句目的端的写入目录目的端的表名支持通过宏

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
时间宏变量使用解析 - 数据治理中心 DataArts Studio

时间宏变量使用解析在创建表/文件迁移作业时，CDM支持在源端和目的端的以下参数中配置时间宏变量：源端的源目录或文件源端的表名 “通配符”过滤类型中的目录过滤器和文件过滤器 “时间过滤”中的起始时间和终止时间分区过滤条件和Where子句目的端的写入目录目的端的表名支持通过宏

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
审批中心 - 数据治理中心 DataArts Studio

对于简单模式工作空间，当前支持开发者在提交脚本和作业时，由指定审核人进行审批。审批中心可以对单据审批进行统一管理，对审批人进行工作空间级的配置和维护。约束与限制仅当前工作空间的管理员或者拥有DAYU Administrator、Tenant Administrator权限的用户，可新建、修改和删除审批人。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
作业开发流程 - 数据治理中心 DataArts Studio

通过任务间依赖完成复杂数据分析处理。支持多种作业调度方式。支持导入和导出作业。支持作业状态运维监控和作业结果通知。提供编辑锁定能力，支持多人协同开发场景。支持作业的版本管理能力，支持生成保存版本和提交版本。保存版本时，一分钟内多次保存只记录一次版本。对于中间数据比较

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
管理员操作 - 数据治理中心 DataArts Studio

由于企业模式下需要区分开发环境和生产环境，因此您需要分别准备对应生产环境和开发环境的两套数据湖服务，用于隔离开发和生产环境：对于集群化的数据源（例如MRS、DWS、RDS、MySQL、Oracle、DIS、ECS），DataArts Studio通过管理中心的创建数据连接区分开发环境和生产环境的数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > （可选）升级企业模式工作空间 > 企业模式角色操作
创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

创建CDM与数据源之间的连接操作场景用户在创建数据迁移的任务前，需要先创建连接，让CDM集群能够读写数据源。一个迁移任务，需要建立两个连接，源连接和目的连接。不同的迁移方式（表或者文件迁移），哪些数据源支持导出（即作为源连接），哪些数据源支持导入（即作为目的连接），详情请参见支持的数据源。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
基线实例 - 数据治理中心 DataArts Studio

用户可以查看基线实例的更多详细信息，例如查看基线实例的详情和相关事件。单击基线名称后面“操作”列的“详情”，进入“基线实例详情”的界面，可以查看基线实例的基本信息、保障作业、关键路径作业及甘特图、基线作业修改前后的版本对比、和相关事件。单击基线名称后面“操作”列的“相关事件”，进

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 基线运维
实时报警平台搭建 - 数据治理中心 DataArts Studio

方案设计操作流程如下：实时数据导入：通过数据接入服务（DIS）将数据中心的告警数据实时导入到数据湖探索（DLI）。数据清洗和预处理：DLI对告警数据进行数据清洗和预处理。发送告警消息：当告警级别超过指定值时向用户发送短信。数据导出和存储：清洗过的数据进入DIS通道，DIS根据导入时间将告警数据按日期存放到OBS。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
构造请求 - 数据治理中心 DataArts Studio

X-Project-Id 子项目ID。请参考项目ID和账号ID章节获取项目ID。调用在子项目中的服务接口，并使用AK/SK认证时必选。 e9993fc787d94b6c886cbaa340f9c0f4 X-Domain-ID 账号ID。请参考项目ID和账号ID章节获取账号ID。调用全局服务接口，并使用AK/SK认证时必选。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 如何调用API
创建作业 - 数据治理中心 DataArts Studio

emptyRunningJob 否 String 取值为0和1。1表示空跑。0表示取消空跑。不设置该参数时，默认为0。 targetStatus 否 String 在开启审批开关后，需要填写该字段。表示创建作业的目标状态，有三种状态：SAVED、SUBMITTED和PRODUCTION，分别表示作业创建后是保存态，提交态，生产态。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
创建DataArts Studio数据连接 - 数据治理中心 DataArts Studio

修改工作空间的企业项目。如果使用企业模式，您还需要注意以下事项：由于企业模式下需要区分开发环境和生产环境，因此您需要分别准备对应生产环境和开发环境的两套数据湖服务，用于隔离开发和生产环境：对于集群化的数据源（例如MRS、DWS、RDS、MySQL、Oracle、DIS、EC

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心
约束与限制 - 数据治理中心 DataArts Studio

不支持Oracle实时增量数据同步。分布式缓存服务（DCS）和Redis数据源约束第三方云的Redis服务无法支持作为源端。如果是用户在本地数据中心或ECS上自行搭建的Redis支持作为源端或目的端。仅支持Hash和String两种数据格式。文档数据库服务（DDS）和MongoDB数据源约束从Mon

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）

总条数： 193

上一页
1
2
3
4
5
...
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建数据集成作业 - 数据治理中心 DataArts Studio

新建表/文件迁移作业 - 数据治理中心 DataArts Studio

基线运维概述 - 数据治理中心 DataArts Studio

DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

通过CDM节点批量创建分表迁移作业 - 数据治理中心 DataArts Studio

产品功能 - 数据治理中心 DataArts Studio

开发Pipeline作业 - 数据治理中心 DataArts Studio

参考：作业分片维度 - 数据治理中心 DataArts Studio

时间宏变量使用解析 - 数据治理中心 DataArts Studio

时间宏变量使用解析 - 数据治理中心 DataArts Studio

审批中心 - 数据治理中心 DataArts Studio

作业开发流程 - 数据治理中心 DataArts Studio

管理员操作 - 数据治理中心 DataArts Studio

创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

基线实例 - 数据治理中心 DataArts Studio

实时报警平台搭建 - 数据治理中心 DataArts Studio

构造请求 - 数据治理中心 DataArts Studio

创建作业 - 数据治理中心 DataArts Studio

创建DataArts Studio数据连接 - 数据治理中心 DataArts Studio

约束与限制 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线