搜索_华为云

区域和可用区如何选择？ - 数据治理中心 DataArts Studio

Studio实例或增量包时，是否将资源放在同一可用区内，主要取决于您对容灾能力和网络时延的要求。如果您的应用需要较高的容灾能力，建议您将资源部署在同一区域的不同可用区内。如果您的应用要求实例之间的网络延时较低，则建议您将资源创建在同一可用区内。实例可以转移到另一个区域/可用区吗？

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 咨询与计费
购买并管理专享版集群 - 数据治理中心 DataArts Studio

安全组类似防火墙，控制谁能访问实例的指定端口，以及控制实例的通信数据流向指定的目的地址。安全组入方向规则建议按需开放地址与端口，这样可以最大程度保护实例的网络安全。专享版实例绑定的安全组有如下要求：入方向：如果需要从公网调用API，或从其他安全组内资源调用API，则需要为专享版实例绑定的安全组的入方向放

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API
导入导出 - 数据治理中心 DataArts Studio

Studio实例的数据架构中已创建的表导出到Excel文件中。导出后的文件可用于导入到关系模型中。导出模型的操作请参见导出表或DDL。打开下载的模板，请根据业务需求填写好模板中的相关参数并保存，模板中的“填写说明”Sheet页供参考。模板中的参数，其中名称前带“*”的参数为必填参数，名称前未带“*”的参数为可选参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 通用操作
数据库、数据仓库、数据湖与华为智能数据湖方案是什么，有哪些区别和联系？ - 数据治理中心 DataArts Studio

数据库是“按照数据结构来组织、存储和管理数据的仓库”。广义上的数据库，在20世纪60年代已经在计算机中应用了。但这个阶段的数据库结构主要是层次或网状的，且数据和程序之间具备非常强的依赖性，应用较为有限。现在通常所说的数据库指的是关系型数据库。关系数据库是指采用了关系模型来组织数据的数据库，其以行和列的形式存储数

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 咨询与计费
MRS Spark SQL - 数据治理中心 DataArts Studio

挂起当前作业执行计划：当前作业实例的状态为运行异常，该节点的后续节点以及依赖于当前作业的后续作业实例都会处于等待运行状态。是否空跑否如果勾选了空跑，该节点不会实际执行，将直接返回成功。任务组否选择任务组。任务组配置好后，可以更细粒度的进行当前任务组中的作业节点的并发数控制，比如作业中包含多个节点、补数据、重跑等场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
CDM迁移近一个月的数据 - 数据治理中心 DataArts Studio

包，可以跳过这部分内容。如果您需要再创建新的CDM集群，请参考购买批量数据迁移增量包章节，完成购买数据集成增量包的操作。集群规格选择“cdm.xlarge”。集群所属的VPC与MRS所属的VPC一致，同时也要与云专线连通的VPC的一致。其它参数可以自定义，或者保持默认。创建CDH

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖
通过数据开发使用参数传递灵活调度CDM作业 - 数据治理中心 DataArts Studio

作业）。实时处理作业：处理实时的连续数据，主要用于实时性要求高的场景。实时作业是由一个或多个节点组成的业务关系，每个节点可单独被配置调度策略，而且节点启动的任务可以永不下线。在实时作业里，带箭头的连线仅代表业务上的关系，而非任务执行流程，更不是数据流。实时处理作业可以配置节点

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
管理文件水印 - 数据治理中心 DataArts Studio

尽量选取数据取值比较多样的列嵌入水印，如果该列的值是可枚举穷尽的，则有可能因为特征不够导致提取失败。常见的适合嵌入水印的列如地址、姓名、UUID、金额、总数等。数值整型字段嵌入水印可能会出现数据被修改的情况，请选择可以接受值发生改变的字段插入水印。结构化数据文件的水印提取与数据水印的水印溯源

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护
创建作业 - 数据治理中心 DataArts Studio

是 List<String> 依赖的作业名称列表，必须依赖已存在的作业。 dependPeriod 否 String 依赖周期: SAME_PERIOD :依赖被依赖作业的同周期任务的执行结果。 PRE_PERIOD :依赖被依赖作业的前一周期任务的执行结果。默认值 : SAME_PERIOD

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
执行Python脚本报错：Agent need to be updated？ - 数据治理中心 DataArts Studio

执行Python脚本报错：Agent need to be updated？问题原因创建的主机连接的CDM集群版本可能有点低。解决方案创建的主机连接需要使用2.8.6版本及以上的CDM集群。父主题：数据开发

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
作业任务参数说明 - 数据治理中心 DataArts Studio

作业分组：CDM支持对作业进行分组，分组后的作业可以按组显示、按组批量删除作业、按组批量启动作业、按组导出等。是否定时执行：可选择作业是否定时自动启动。抽取并发数：可设置同时执行的抽取任务数。是否写入脏数据：如果需要将作业执行过程中处理失败的数据、或者被清洗过滤掉的数据写入OBS中，以便后面

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构
开发一个Python作业 - 数据治理中心 DataArts Studio

hell、Python脚本的调度频率很高，ECS主机会将Agent的内网IP加入黑名单。为了保障作业的正常调度，强烈建议您使用ECS主机的root用户将绑定Agent（即CDM集群）的内网IP加到/etc/hosts.allow文件里面。 CDM集群的内网IP获取方式请参见查看并修改CDM集群配置。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
MySQL数据迁移到DWS - 数据治理中心 DataArts Studio

输入便于记忆和区分的连接名称。 dwslink 数据库服务器 DWS数据库的IP地址或域名。 192.168.0.3 端口 DWS数据库的端口。 8000 数据库名称 DWS数据库的名称。 db_demo 用户名拥有DWS数据库的读、写和删除权限的用户。 dbadmin 密码用户的密码。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 使用教程
EL表达式使用实例 - 数据治理中心 DataArts Studio

表达式的如下应用：如何在数据开发模块的SQL脚本中使用变量？作业如何传递参数给SQL脚本变量？在参数中如何使用EL表达式？背景信息使用数据开发模块的作业编排和作业调度功能，每日通过统计交易明细表，生成日交易统计报表。本示例涉及的数据表如下所示： trade_log：记录每一笔交易数据。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > EL表达式参考
步骤1：流程设计 - 数据治理中心 DataArts Studio

- 数据的迁移周期：天、小时、分钟还是实时迁移天 - 数据源与目的数据源之间的网络带宽 100MB - 数据源和集成工具之间的网络连通性描述本示例不涉及 - 数据库类迁移，调研表的个数，最大表的规模本示例不涉及，本示例需要从OBS文件迁移到数据库了解数据库迁移的作业规模，了解最大表的迁移时间是否可接受

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
通过CDM节点批量创建分表迁移作业 - 数据治理中心 DataArts Studio

名称连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。 mysql_link 数据库服务器配置为要连接的数据库的IP地址或域名。单击输入框后的“选择”，可获取用户的MySQL数据库实例列表。 192.168.0.1 端口配置为要连接的数据库的端口。 3306

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
Hive连接 - 数据治理中心 DataArts Studio

模式，只能使用STANDALONE模式。说明：STANDALONE模式主要是用来解决版本冲突问题的运行模式。当同一种数据连接的源端或者目的端连接器的版本不一致时，存在jar包冲突的情况，这时需要将源端或目的端放在STANDALONE进程里，防止冲突导致迁移失败。 linkConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
Shell/Python节点执行失败，后台报错session is down - 数据治理中心 DataArts Studio

请求消息的时间间隔，默认是0，不发送请求。然而ClientAliveInterval 300表示五分钟发送一次，然后客户端响应，这样就保持长连接了。ClientAliveCountMax的默认值3。ClientAliveCountMax表示服务器发出请求后客户端没有响应的次数达到

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
补数据场景使用介绍 - 数据治理中心 DataArts Studio

只有数据开发作业配置了周期调度，才支持使用补数据功能。使用案例案例场景在某企业的产品数据表中，有一个记录产品销售额的源数据表A，现在需要把产品销售额的历史数据导入的目的表B里面，需要您配置补数据作业的相关操作。需要导入的列表情况如表1所示。表1 需要导入的列表情况源数据表名目的表名 A B 配置方法

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
步骤2：数据准备 - 数据治理中心 DataArts Studio

页面提示完成用户的创建。 MRS 3.1.0及之后版本集群，所创建的用户至少需具备Manager_viewer的角色权限才能在管理中心创建连接；如果需要对应组件的进行库、表、数据的操作，还需要添加对应组件的用户组权限。 MRS 3.1.0版本之前的集群，所创建的用户需要具备Man

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程

总条数： 169

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

区域和可用区如何选择？ - 数据治理中心 DataArts Studio

购买并管理专享版集群 - 数据治理中心 DataArts Studio

导入导出 - 数据治理中心 DataArts Studio

数据库、数据仓库、数据湖与华为智能数据湖方案是什么，有哪些区别和联系？ - 数据治理中心 DataArts Studio

MRS Spark SQL - 数据治理中心 DataArts Studio

CDM迁移近一个月的数据 - 数据治理中心 DataArts Studio

通过数据开发使用参数传递灵活调度CDM作业 - 数据治理中心 DataArts Studio

管理文件水印 - 数据治理中心 DataArts Studio

创建作业 - 数据治理中心 DataArts Studio

执行Python脚本报错：Agent need to be updated？ - 数据治理中心 DataArts Studio

作业任务参数说明 - 数据治理中心 DataArts Studio

开发一个Python作业 - 数据治理中心 DataArts Studio

MySQL数据迁移到DWS - 数据治理中心 DataArts Studio

EL表达式使用实例 - 数据治理中心 DataArts Studio

步骤1：流程设计 - 数据治理中心 DataArts Studio

通过CDM节点批量创建分表迁移作业 - 数据治理中心 DataArts Studio

Hive连接 - 数据治理中心 DataArts Studio

Shell/Python节点执行失败，后台报错session is down - 数据治理中心 DataArts Studio

补数据场景使用介绍 - 数据治理中心 DataArts Studio

步骤2：数据准备 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线