搜索_华为云

离线处理集成作业开发 - 数据治理中心 DataArts Studio

离线处理集成作业开发离线处理集成作业概述支持的数据源新建离线处理集成作业配置离线处理集成作业配置作业源端参数配置作业目的端参数字段转换器配置指导新增字段操作指导父主题：数据开发

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
事务模式迁移 - 数据治理中心 DataArts Studio

败时，将数据回滚到作业开始之前的状态，自动清理目的表中的数据。参数位置：创建表/文件迁移的作业时，如果目的端为关系型数据库，在目的端作业配置的高级属性中，可以通过“先导入阶段表”参数选择是否启用事务模式。参数原理：如果启用，在作业执行时CDM会自动创建临时表，先将数据导入到该

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
自然周期调度之上一周期依赖原理 - 数据治理中心 DataArts Studio

自然周期调度之上一周期依赖原理自然周期调度的概念自然周期调度作业的调度周期包括分钟、小时、天、周、月这五种周期，不同调度周期的作业，其允许配置的依赖作业调度周期总结如图1所示。图1 上一周期作业依赖关系全景图即作业A的调度依赖于作业B的上一调度周期，包含以下场景：分钟依赖分钟

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践 > 周期调度依赖策略
事务模式迁移 - 数据治理中心 DataArts Studio

败时，将数据回滚到作业开始之前的状态，自动清理目的表中的数据。参数位置：创建表/文件迁移的作业时，如果目的端为关系型数据库，在目的端作业配置的高级属性中，可以通过“先导入阶段表”参数选择是否启用事务模式。参数原理：如果启用，在作业执行时CDM会自动创建临时表，先将数据导入到该

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 关键操作指导
贸易数据上云场景介绍 - 数据治理中心 DataArts Studio

究、国际贸易促进等方面。在这之前，H公司采用其自建的大数据集群，并安排专人维护，每年固定购买电信联通双线专用带宽，在机房、电力、专网、服务器、运维方面进行高额投入，但其在面对客户不断变化的业务诉求时，因为人员投入不足，大数据集群能力不匹配，而无法聚焦业务创新，使得存量100T的数据只有4%的利用率。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 贸易数据极简上云与统计分析
步骤5：数据架构设计 - 数据治理中心 DataArts Studio

添加审核人管理配置中心数据架构中提供了丰富的自定义选项，统一通过配置中心提供，您可以根据自己的业务需要进行自定义配置。在数据架构控制台，单击左侧菜单栏的“配置中心”，进入配置中心页面。进入“功能配置”页签，如下图所示，设置“模型设计业务流程步骤”。图2 功能配置单击“确定”完成配置。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
新建数据标准 - 数据治理中心 DataArts Studio

个数据标准。在新建数据标准页面中，请参考表2配置参数。在新建数据标准页面中，仅显示在“配置中心 > 标准模板管理”中已勾选的参数和已添加的自定义参数。表2中所示为选中数据标准模板中的所有参数并添加了一个自定义参数的场景。有关配置数据标准模板的详细信息，请参见标准模板管理。图3

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 标准设计
数据架构支持哪些数据建模方法？ - 数据治理中心 DataArts Studio

存放，例如：所选的数据仓库是DWS或DLI。维度建模维度建模是从分析决策的需求出发构建模型，它主要是为分析需求服务，因此它重点关注用户如何更快速地完成需求分析，同时具有较好的大规模复杂查询的响应性能。多维模型是由数字型度量值组成的一张事实表连接到一组包含描述属性的多张维度表，事实表与维度表通过主/外键实现关联。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据架构
查询SQL获取max值传递给CDM作业 - 数据治理中心 DataArts Studio

Each循环执行的节点，让CDM子作业循环执行，并配置节点属性参数。配置MRS Spark SQL节点的属性参数，并关联已创建的脚本maxtime。图3 配置MRS Spark SQL节点属性参数配置For Each节点的属性参数，并关联已创建的CDM子作业。图4 配置For Each节点参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
责任共担 - 数据治理中心 DataArts Studio

、PaaS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API网关和高级安全服务，各项云服务，租户数据，以及身份账号和密钥管理等方面的安全配置。《华为云安全白皮书》详细介绍华为云安全性的构建思

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍 > 安全
天任务依赖分钟任务 - 数据治理中心 DataArts Studio

Spark作业算子，配置算子相关参数，配置指导请参见MRS Spark。配置调度周期。调度周期设置为天。图3 配置调度周期（天）配置天任务依赖分钟任务的依赖关系。勾选上“最近”后，天任务作业只会依赖距离其定时运行时间最近的一个分钟任务作业实例。图4 配置依赖属性作业配置完成后，保存并提交版本。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
约束与限制 - 数据治理中心 DataArts Studio

议拆分到不同目录并创建多个任务。用户在CDM上配置的连接和作业支持导出到本地保存，考虑到密码的安全性，CDM不会将对应数据源的连接密码导出。因此在将作业配置重新导入到CDM前，需要手工编辑导出的JSON文件补充密码或在导入窗口配置密码。不支持集群自动升级到新版本，需要用户通过

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成
编排API简介 - 数据治理中心 DataArts Studio

多个分支满足条件时仅执行第一个满足条件的分支。条件分支算子和表达式的配置方法，详见配置条件分支算子。并行处理非必选并行处理算子可以同时执行多个分支逻辑，分支间互不影响。并行处理算子的配置方法，详见配置并行处理算子。输出处理必选输出处理算子负责对API工作流的执行结

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API
时间宏变量使用解析 - 数据治理中心 DataArts Studio

返回当前整小时的时间戳。 1508115600000 路径和表名的时间宏变量如图1所示，如果将：源端的“表名”配置为“CDM_/${dateformat(yyyy-MM-dd)}”。目的端的“写入目录”配置为“/opt/ttxx/${timestamp()}”。经过宏定义转换，这个作业表示：将Oracle数据库的“SQOOP

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成
时间宏变量使用解析 - 数据治理中心 DataArts Studio

返回当前整小时的时间戳。 1508115600000 路径和表名的时间宏变量如图1所示，如果将：源端的“表名”配置为“CDM_/${dateformat(yyyy-MM-dd)}”。目的端的“写入目录”配置为“/opt/ttxx/${timestamp()}”。经过宏定义转换，这个作业表示：将Oracle数据库的“SQOOP

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
开发SQL脚本 - 数据治理中心 DataArts Studio

多等的问题。表3 转储配置参数是否必选说明数据格式是目前支持导出CSV和JSON格式的结果文件。资源队列否选择执行导出操作的DLI队列。当脚本为DLI SQL时，配置该参数。压缩格式否选择压缩格式。当脚本为DLI SQL时，配置该参数。 none bzip2

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
查看数据血缘 - 数据治理中心 DataArts Studio

查看数据血缘首先在数据目录组件完成元数据采集任务，当数据开发作业满足自动血缘解析要求或已手动配置血缘，然后成功完成作业调度后，则可以在数据目录模块可视化查看数据血缘关系。约束限制数据血缘关系更新依赖于作业调度，数据血缘关系是基于最新的作业调度实例产生的。对于同一版本的数据

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考 > 节点数据血缘
数据开发调用数据质量算子并且作业运行的时候需要传入质量参数 - 数据治理中心 DataArts Studio

在“质量作业”页面单击“新建”，进入“基本配置”页面，配置质量作业的基本信息。单击“下一步”进入“规则配置”页面，配置质量作业的相关规则。在“计算范围”的“条件扫描”里面配置数据质量作业参数，如下图所示。图1 设置数据质量参数单击“下一步”，依次配置告警、订阅、调度等信息。配置质量作业的详细操作请参见新建质量作业。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
Shell - 数据治理中心 DataArts Studio

选择执行Shell脚本的主机。须知： Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本的调度频率合理配置MaxSessions的值。连接主机的用户需要具有

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
CDM迁移近一个月的数据 - 数据治理中心 DataArts Studio

文件格式：同源端相同，选择“二进制格式”。其它可选参数保持默认即可。单击“下一步”进行任务配置，其中抽取并发数默认为3，适当增加可以增加迁移速率，本例中设置为8，其它参数保持默认即可。重复上述步骤创建其它迁移目录的作业，参数配置都相同。2个CDM集群的作业个数平均分配，并发执行。作业执行完成后，

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖

总条数： 1223

上一页
1
...
50
51
52
...
62
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

离线处理集成作业开发 - 数据治理中心 DataArts Studio

事务模式迁移 - 数据治理中心 DataArts Studio

自然周期调度之上一周期依赖原理 - 数据治理中心 DataArts Studio

事务模式迁移 - 数据治理中心 DataArts Studio

贸易数据上云场景介绍 - 数据治理中心 DataArts Studio

步骤5：数据架构设计 - 数据治理中心 DataArts Studio

新建数据标准 - 数据治理中心 DataArts Studio

数据架构支持哪些数据建模方法？ - 数据治理中心 DataArts Studio

查询SQL获取max值传递给CDM作业 - 数据治理中心 DataArts Studio

责任共担 - 数据治理中心 DataArts Studio

天任务依赖分钟任务 - 数据治理中心 DataArts Studio

约束与限制 - 数据治理中心 DataArts Studio

编排API简介 - 数据治理中心 DataArts Studio

时间宏变量使用解析 - 数据治理中心 DataArts Studio

时间宏变量使用解析 - 数据治理中心 DataArts Studio

开发SQL脚本 - 数据治理中心 DataArts Studio

查看数据血缘 - 数据治理中心 DataArts Studio

数据开发调用数据质量算子并且作业运行的时候需要传入质量参数 - 数据治理中心 DataArts Studio

Shell - 数据治理中心 DataArts Studio

CDM迁移近一个月的数据 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线