搜索_华为云

自然周期调度之上一周期依赖原理 - 数据治理中心 DataArts Studio

边界是自然小时[00:00,00:59]，依赖策略是调度周期长的作业，往前推一个调度周期找依赖实例。 A依赖B，在同自然小时内，无论A、B设置在什么时间点执行，A永远在B的前一周期完成后执行。举例：A在每小时5分0秒执行，B在12分执行，A会在每小时5分时依赖B上一小时生成的实例。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践 > 周期调度依赖策略
Oracle数据源如何开通归档日志、查询权限和日志解析权限？ - 数据治理中心 DataArts Studio

TABLE "schema_name"."table_name" ADD SUPPLEMENTAL LOG DATA (ALL) COLUMNS; 设置成功后通过以下SQL可以查询到ALL_COLUMN_LOGGING说明该表已经开通补充日志。 SELECT 'KEY', LOG_GROUP_TYPE

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 实时处理集成作业开发 > 常见问题
审批中心 - 数据治理中心 DataArts Studio

单击“审批人管理”，进入管理控制台，选择“工作空间”进入。单击当前工作空间进入空间信息界面。配置“空间成员”信息。单击“添加”进入添加成员界面。搜索“成员账号”并设置管理员角色。单击“确定”。配置好的审批人信息会自动显示出来便于查看。审批管理单据提交人可在审批中心页面，查看自己提交的申请及审批进度。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
（可选）获取认证信息 - 数据治理中心 DataArts Studio

（可选）获取认证信息 DataArts Studio使用过程中，例如在数据集成创建OBS连接、API调用或问题定位时，您可能需要获取访问密钥、项目ID、终端节点等信息，获取方式如下。获取访问密钥您可以通过如下方式获取访问密钥。登录控制台，在用户名下拉列表中选择“我的凭证”。

帮助中心 > 数据治理中心 DataArts Studio > 准备工作
自然周期调度之同周期依赖原理 - 数据治理中心 DataArts Studio

小时依赖小时规则：每个自然小时周期内的实例产生依赖，区间边界是自然小时[00:00,00:59]。举例1：A依赖B，在同自然小时内，无论A、B设置在什么时间点执行，A永远在B之后执行。图7 小时依赖小时举例一举例2：A依赖B，A在每小时5分0秒执行，B在12分执行，A会等B执行完成后执行。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践 > 周期调度依赖策略
源端为SQLServer，目的端为Hudi - 数据治理中心 DataArts Studio

“Hudi全局配置”优先级低于单表“表属性编辑”中的配置，存在相同配置项时会被覆盖。源表与目标表映射：图3 配置源表与目标表映射 Hudi表必须设置“同步主键”，在源端为非主键表时，必须在字段映射阶段手动勾选主键。表属性编辑：单击操作列“表属性编辑”可配置Hudi表属性，包含表类型，分区类型及表自定义属性。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 实时处理集成作业开发 > 配置源端和目标端参数
导出导入脚本 - 数据治理中心 DataArts Studio

导出导入脚本导出脚本您可以在脚本目录中导出一个或多个脚本文件，导出的为开发态最新的已保存内容。参考访问DataArts Studio实例控制台，登录DataArts Studio管理控制台。在DataArts Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > （可选）管理脚本
新建数据质量规则 - 数据治理中心 DataArts Studio

入参数。输出结果说明：对SQL获得结果的每一列进行说明，与关系定义的输出结果顺序一一对应，列说明之间用英文逗号进行分隔。例如当定义关系设置为：select max(${Column1}),min(${Column2}) from ${Schema_Table1}，则输出结果说

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
Kafka连接参数说明 - 数据治理中心 DataArts Studio

于不再需要的属性，可单击属性后的“删除”按钮进行删除。 Apache Kafka Apache Kafka连接适用于用户在本地数据中心或ECS上自建的第三方Kafka，其中本地数据中心的Kafka需通过专线连接。连接Apache Hadoop上的Kafka数据源时，相关参数如表2所示。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建连接 > 配置连接参数
配置权限集 - 数据治理中心 DataArts Studio

在“权限集”页面单击“新建”，创建权限集。图1 创建权限集新建权限集配置请参考表1，参数配置完成单击“确定”即可。表1 参数设置参数名参数设置 *权限集名称标识权限集，实例下唯一。建议名称中包含含义，避免无意义的描述，以便于快速识别所需权限集。 *父权限集选择对应的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > 数据权限访问控制
导出导入作业 - 数据治理中心 DataArts Studio

导出导入作业导出作业，均是导出开发态的最新的已保存内容。导入作业，会覆盖开发态的内容并自动提交一个新版本。数据开发在跨时区导出导入作业时，需要手动修改expressionTimeZone字段为目标时区。导出作业参考访问DataArts Studio实例控制台，登录DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
源端为对象存储 - 数据治理中心 DataArts Studio

waitTime 否 String 选择开启作业标识文件的功能时，如果源路径下不存在启动作业的标识文件，作业挂机等待的时长，当超时后任务会失败。等待时间设置为0时，当源端路径下不存在标识文件，任务会立即失败。单位：秒。 fromJobConfig.filterType 否枚举选择过滤器类型：

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
DLI连接参数说明 - 数据治理中心 DataArts Studio

DLI连接参数说明连接数据湖探索（DLI）服务时，相关参数如表1所示。作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。迁移数据到DLI时，DLI要在OBS的dli-trans*内部临时桶生成数据文件，因此在需要赋予

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建连接 > 配置连接参数
源端为FTP/SFTP - 数据治理中心 DataArts Studio

waitTime 否 String 选择开启作业标识文件的功能时，如果源路径下不存在启动作业的标识文件，作业挂机等待的时长，当超时后任务会失败。等待时间设置为0时，当源端路径下不存在标识文件，任务会立即失败。单位：秒。 fromJobConfig.filterType 否枚举选择过滤器类型：

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
数据开发配置数据搬迁 - 数据治理中心 DataArts Studio

数据开发配置数据搬迁当前管理中心支持直接搬迁数据开发组件中已提交版本的脚本和作业数据，但导出作业时默认只导出作业，不包含其依赖的脚本和资源。您可以通过管理中心配置数据搬迁进行搬迁，也可以参考本章节通过数据开发的导入导出功能进行搬迁。数据开发数据搬迁依赖于数据开发的脚本、作业、环境变量、资源导入导出功能。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
数据开发 - 数据治理中心 DataArts Studio

information”，如何处理？使用python调用执行脚本的api报错：The request parameter invalid，如何处理？在ECS上调试好的shell脚本，在DLF中shell脚本执行异常，如何处理？ Spark Python脚本如何引用Python脚本？ DataArts

帮助中心 > 数据治理中心 DataArts Studio > 常见问题
购买数据服务专享集群增量包 - 数据治理中心 DataArts Studio

虚拟私有云 DataArts Studio实例中的数据服务专享版集群所属的VPC、子网、安全组。在相同VPC、子网、安全组中的云服务资源（如ECS），可以使用数据服务专享版实例的私有地址调用API。建议将专享版集群和您的其他关联业务配置一个相同的VPC、子网、安全组，确保网络安全的同时，方便网络配置。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
新建作业 - 数据治理中心 DataArts Studio

新建作业作业由一个或多个节点组成，共同执行以完成对数据的一系列操作。开发作业前请先新建作业。前提条件作业在每个工作空间的最大配额为10000，作业目录最多5000个，目录层级最多为10层。请确保当前数量未达到最大配额。新建普通目录如果已存在可用的目录，则可以跳过当前操作。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
创建企业模式工作空间 - 数据治理中心 DataArts Studio

环境。配置两套数据湖服务，进行开发与生产环境隔离。对于集群化的数据源（例如MRS、DWS、RDS、MySQL、Oracle、DIS、ECS等），DataArts Studio通过管理中心的创建数据连接区分开发环境和生产环境的数据湖服务，在开发和生产流程中自动切换对应的数据湖。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > （可选）升级企业模式工作空间
步骤2：数据开发处理 - 数据治理中心 DataArts Studio

步骤2：数据开发处理本步骤通过BI报表原始数据，分析10大用户关注最多的产品和10大用户评价最差的商品，然后通过作业定期调度执行并将结果每日导出到表中，以支撑信息分析。分析10大用户关注最多的产品在DataArts Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程

总条数： 963

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

自然周期调度之上一周期依赖原理 - 数据治理中心 DataArts Studio

Oracle数据源如何开通归档日志、查询权限和日志解析权限？ - 数据治理中心 DataArts Studio

审批中心 - 数据治理中心 DataArts Studio

（可选）获取认证信息 - 数据治理中心 DataArts Studio

自然周期调度之同周期依赖原理 - 数据治理中心 DataArts Studio

源端为SQLServer，目的端为Hudi - 数据治理中心 DataArts Studio

导出导入脚本 - 数据治理中心 DataArts Studio

新建数据质量规则 - 数据治理中心 DataArts Studio

Kafka连接参数说明 - 数据治理中心 DataArts Studio

配置权限集 - 数据治理中心 DataArts Studio

导出导入作业 - 数据治理中心 DataArts Studio

源端为对象存储 - 数据治理中心 DataArts Studio

DLI连接参数说明 - 数据治理中心 DataArts Studio

源端为FTP/SFTP - 数据治理中心 DataArts Studio

数据开发配置数据搬迁 - 数据治理中心 DataArts Studio

数据开发 - 数据治理中心 DataArts Studio

购买数据服务专享集群增量包 - 数据治理中心 DataArts Studio

新建作业 - 数据治理中心 DataArts Studio

创建企业模式工作空间 - 数据治理中心 DataArts Studio

步骤2：数据开发处理 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线