搜索_华为云

自然周期调度之同周期依赖原理 - 数据治理中心 DataArts Studio

如果在配置作业依赖关系时勾选“最近”依赖的按钮，小时作业只依赖所选作业最近的一个运行实例，比如A在3:00开始调度，A依赖B最近的2:45调度的一个运行实例。如果作业A在零点进行调度，所依赖作业B可以是昨天的分钟任务。小时依赖小时规则：每个自然小时周期内的实例产生依赖，区间边界是自然小时[00:00

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践 > 周期调度依赖策略
开发一个DWS SQL作业 - 数据治理中心 DataArts Studio

入SQL语句，通过SQL语句来实现统计前一天的销售额。图1 开发脚本关键说明：图1中的脚本开发区为临时调试区，关闭脚本页签后，开发区的内容将丢失。您可以通过“提交”来保存并提交脚本版本。数据连接：创建DWS的数据连接中已创建的连接。开发DWS SQL作业 DWS SQL脚本开发完成后，我们为DWS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
配置OBS源端参数 - 数据治理中心 DataArts Studio

压缩格式选择对应压缩格式的源文件：无：表示传输所有格式的文件。 GZIP：表示只传输GZIP格式的文件。 ZIP：表示只传输ZIP格式的文件。 TAR.GZ：表示只传输TAR.GZ格式的文件。无压缩文件后缀压缩格式非无时，显示该参数。该参数需要解压缩的文件后缀名。当一批文件

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
关系数据库增量迁移 - 数据治理中心 DataArts Studio

Where子句配置定时任务：重复周期为1天，每天的凌晨0点自动执行作业。这样就可以每天0点导出前一天产生的所有数据。Where子句支持配置多种时间宏变量，结合CDM定时任务的重复周期：分钟、小时、天、周、月，可以实现自动导出任意指定日期内的数据。父主题：增量迁移原理介绍

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践 > 增量迁移原理介绍
关系数据库增量迁移 - 数据治理中心 DataArts Studio

Where子句配置定时任务：重复周期为1天，每天的凌晨0点自动执行作业。这样就可以每天0点导出前一天产生的所有数据。Where子句支持配置多种时间宏变量，结合CDM定时任务的重复周期：分钟、小时、天、周、月，可以实现自动导出任意指定日期内的数据。父主题：增量迁移原理介绍

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导 > 增量迁移原理介绍
导入导出 - 数据治理中心 DataArts Studio

Studio实例的数据架构中已创建的表导出到Excel文件中。导出后的文件可用于导入到关系模型中。导出模型的操作请参见导出表或DDL。打开下载的模板，请根据业务需求填写好模板中的相关参数并保存，模板中的“填写说明”Sheet页供参考。模板中的参数，其中名称前带“*”的参数为必填参数，名称前未带“*”的参数为可选参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 通用操作
上传增量数据 - 数据治理中心 DataArts Studio

这样CDM每天凌晨自动执行全量迁移，但因为“重复文件处理方式”选择了“跳过重复文件”，相同名称且相同大小的文件不迁移，所以只会上传每天新增的文件。单击“保存”，完成CDM的增量同步配置。父主题：使用CDM上传数据到OBS

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 贸易数据极简上云与统计分析 > 使用CDM上传数据到OBS
（可选）获取认证信息 - 数据治理中心 DataArts Studio

获取项目ID和账号ID 项目ID表示租户的资源，账号ID对应当前账号，IAM用户ID对应当前用户。用户可在对应页面下查看不同Region对应的项目ID、账号ID和用户ID。注册并登录管理控制台。在用户名的下拉列表中单击“我的凭证”。在“API凭证”页面，查看账号名和账号ID、

帮助中心 > 数据治理中心 DataArts Studio > 准备工作
跨空间进行作业调度 - 数据治理中心 DataArts Studio

以使用其他作业节点替代Subjob节点。作业的调度方式设置为“事件驱动调度”，连接名称和Topic选择为工作空间B中的Kafka连接和Topic，需要与工作空间A中job1作业中Kafka Client节点所选择的Kafka连接和Topic相对应，用于通过Kafka消息触发作业运行。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
步骤6：数据开发处理 - 数据治理中心 DataArts Studio

SDI贴源层的原始数据表。历史数据清洗，使用数据开发的MRS Hive SQL脚本将源数据表清洗之后导入DWI层的标准出行数据表。将基础数据插入维度表中。将DWI层的标准出行数据导入DWR层的事实表中。数据汇总，通过Hive SQL将出租车行程订单事实表中的数据进行汇总统计并写入汇总表。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
步骤3：数据开发处理 - 数据治理中心 DataArts Studio

本步骤通过电影信息和评分信息的原始数据，分析评分最高的Top10电影和最活跃的Top10电影，然后通过作业定期调度执行并将结果每日导出到表中，以支撑信息分析。创建DWS SQL脚本top_rating_movie（用于存放评分最高的Top10电影）评分最高Top10电影的计算方法是：

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 初级版：基于DWS的电影评分数据集成与开发流程
源端为FTP/SFTP - 数据治理中心 DataArts Studio

CDM会将CSV文件的第一行数据作为标题行，不写入目的端的表。 fromJobConfig.fromCompression 否枚举压缩格式，当文件格式为“CSV_FILE”或“JSON”时此参数有效。选择对应压缩格式的源文件： NONE：表示传输所有格式的文件。 GZIP：表示只传输GZIP格式的文件。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
数据血缘方案简介 - 数据治理中心 DataArts Studio

可追溯性：数据的血缘关系，体现了数据的生命周期，体现了数据从产生到消亡的整个过程，具备可追溯性。层次性：数据的血缘关系是有层次的。对数据的分类、归纳、总结等对数据进行的描述信息又形成了新的数据，不同程度的描述信息形成了数据的层次。 DataArts Studio生成的血缘关系图如图1所示，为数据表对象，为

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系
如何选择增量包 - 数据治理中心 DataArts Studio

技术资产数量增量包用于扩充技术资产数量配额。不同版本的DataArts Studio实例，默认提供了不同的技术资产数量规格限制。该规格是以数据目录中表和OBS文件的数量之和计算的。您可以在新版本模式的DataArts Studio实例卡片上通过“更多 > 配额使用量”查看该配额情况。当您的技术资产数量接近或达

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
配置输出处理算子 - 数据治理中心 DataArts Studio

输出处理算子负责对API工作流的执行结果进行错误码映射、结果集映射和格式转换，以确定最终返回的数据格式。表1 输出处理算子参数是否必选说明错误码映射否针对数据服务返回的错误码，支持映射为自定义信息。例如，将“DLM.0”错误码映射为“OK”。结果集映射是针对工作流中查询到的所有普通

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API
查询SQL获取max值传递给CDM作业 - 数据治理中心 DataArts Studio

通过查询SQL语句，将获取到的最大时间的max值传递给CDM作业。在CDM作业的高级属性里面，通过where子句判断最大时间范围，获取所需要的迁移数据，从而完成数据迁移任务，最终完成增量迁移任务。约束条件已完成新建数据连接的操作。已完成新建数据库的操作。使用案例创建SQL脚本

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
常用EL表达式样例合集 - 数据治理中心 DataArts Studio

注意此方法只能直接获取当前作业里配置的参数值，并不能获取到父作业传递过来的参数值，也不能获取到工作空间里面配置的全局变量，作用域仅为本作业。这种情况下建议使用表达式${job_param_name}，既可以获取到父作业传递过来的参数值，也可以获取到全局配置的变量。获取参数test的值： #{Job

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > EL表达式参考
数据库部署在其他云 - 数据治理中心 DataArts Studio

络来实现。购买和配置云专线DC的相关操作，可以参考通过云专线实现云下IDC访问云上VPC。其中在创建虚拟网关时，虚拟私有云选择步骤2所创建的中转VPC，本端子网除了需要添加中转VPC的子网之外，还需要添加实时资源组的VPC网段。购买和配置虚拟专用网络VPN的相关操作，可以参考

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通
日期和时间模式 - 数据治理中心 DataArts Studio

日期和时间模式 EL表达式中的日期和时间可以按用户指定的格式进行显示，日期和时间格式由日期和时间模式字符串指定。日期和时间模式字符串由A到Z、a到z的非引号字母组成，字母的含义如表1所示。表1 字母含义字母描述示例 G 纪元标记 AD y 年 2001 M 年中的月份 July

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > EL表达式参考
新建离线处理集成作业 - 数据治理中心 DataArts Studio

离线处理：对已收集的大量数据进行批量处理和分析，这些任务通常是在计算资源和存储资源方面经过优化，以确保高效的数据处理和分析。这些任务通常是定时（例如每天、每周）执行，主要处理大量历史数据，用于批量分析和数据仓库。实时处理：对源源不断产生的新数据进行实时处理和分析，以满足业务对数据的即时性需

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）

总条数： 1238

上一页
1
...
8
9
10
...
62
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

自然周期调度之同周期依赖原理 - 数据治理中心 DataArts Studio

开发一个DWS SQL作业 - 数据治理中心 DataArts Studio

配置OBS源端参数 - 数据治理中心 DataArts Studio

关系数据库增量迁移 - 数据治理中心 DataArts Studio

关系数据库增量迁移 - 数据治理中心 DataArts Studio

导入导出 - 数据治理中心 DataArts Studio

上传增量数据 - 数据治理中心 DataArts Studio

（可选）获取认证信息 - 数据治理中心 DataArts Studio

跨空间进行作业调度 - 数据治理中心 DataArts Studio

步骤6：数据开发处理 - 数据治理中心 DataArts Studio

步骤3：数据开发处理 - 数据治理中心 DataArts Studio

源端为FTP/SFTP - 数据治理中心 DataArts Studio

数据血缘方案简介 - 数据治理中心 DataArts Studio

如何选择增量包 - 数据治理中心 DataArts Studio

配置输出处理算子 - 数据治理中心 DataArts Studio

查询SQL获取max值传递给CDM作业 - 数据治理中心 DataArts Studio

常用EL表达式样例合集 - 数据治理中心 DataArts Studio

数据库部署在其他云 - 数据治理中心 DataArts Studio

日期和时间模式 - 数据治理中心 DataArts Studio

新建离线处理集成作业 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线