搜索_华为云

新冠疫情数据治理思考 - 数据治理中心 DataArts Studio

统一数据标准，轻松融合数据；建立跨平台的数据提取和数据追溯，实现开放共享，打通信息孤岛；保护隐私数据，构建可信数据。以“健康码”为依托的各类政务小程序，正在加速提升市民信息化应用能力，基于数据治理、数据共享，很可能在不久以后，我们就可以实现“一码走天下”。将线上疫情应急治理体

 帮助中心 > 数据治理中心 DataArts Studio > 数据治理方法论
跨空间进行作业调度 - 数据治理中心 DataArts Studio

据开发作业job1。分别选择Dummy节点和DIS Client节点，选中连线图标并拖动，编排如图2所示的作业。 Dummy节点不执行任何操作，本例选择Dummy节点仅为演示操作，实际使用中您可以用其他作业节点替代。 DIS Client节点用于发送消息。您需要选择DIS所属Re

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
DataArts Studio数据开发作业告警最佳实践 - 数据治理中心 DataArts Studio

前提条件已完成数据开发作业的开发和调度配置。配置作业节点失败重试您可以通过关键业务作业中的节点配置，逐一开启节点失败重试；也可以通过批量作业配置，统一开启各作业中的节点失败重启。本章节以批量作业配置为例，为您介绍如果配置作业节点失败重试。参考访问DataArts Studio实例控制台，登录DataArts

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
通过数据开发使用参数传递灵活调度CDM作业 - 数据治理中心 DataArts Studio

高的场景。实时作业是由一个或多个节点组成的业务关系，每个节点可单独被配置调度策略，而且节点启动的任务可以永不下线。在实时作业里，带箭头的连线仅代表业务上的关系，而非任务执行流程，更不是数据流。实时处理作业可以配置节点级别的调度任务，即每一个节点可以独立调度，具体请参见配置作业调度任务（实时作业）。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
如何选择版本 - 数据治理中心 DataArts Studio

[2] 作业节点调度次数/天：该规格是以每天执行的数据开发作业、质量作业、对账作业、业务场景和元数据采集作业的调度次数之和计算的，可以通过“作业节点调度次数/天增量包”进行扩容，如何购买请参考购买作业节点调度次数/天增量包。其中数据开发作业的每天调度次数，是以节点（包含Dumm

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
发布API - 数据治理中心 DataArts Studio

发布API 功能介绍发布API。API只有发布后，才能够被调用。API发布时，可以将API发送至指定网关。共享版，必须发送至API网关共享版。专享版，可以依据自身需要，选择将API发送至API网关专享版、ROMA-APIC、或不发布网关。发布请求的发起者若非审核人，需要API的审核人完成申请的审核。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > API管理接口
新建离线处理集成作业 - 数据治理中心 DataArts Studio

单击“新增”，可给作业重新添加一个标签。也可选择管理作业标签中已配置的标签。节点状态轮询时间（秒）设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试如果作业执行失败，可选择

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

需要解压缩的文件的后缀名。当一批文件中以该值为后缀时，才会执行解压缩操作，否则就保持原样传输。当输入"*"时或输入为空时，所有文件都会被解压。 tar.gz 文件分隔符多文件列表时指定的文件分隔符。 | 启动作业标识文件当源端路径下存在启动作业的标识文件时才启动任务，否则会挂起等待一段时间。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
批量配置作业 - 数据治理中心 DataArts Studio

参数说明节点状态轮询时间设置所选作业的所有节点轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。如果设置为保持不变，则各节点保持原来的节点轮询时间。节点执行的最长时间设置所选作业的所有节点执行超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
OBS连接 - 数据治理中心 DataArts Studio

String OBS桶类型。对象桶：OB。并行文件系统：PFS。说明：桶类型分为对象桶和并行文件系统，对象桶过滤文件会比较慢，建议客户使用并行文件桶。 linkConfig.server 是 String OBS服务器的终端节点（Endpoint）。 linkConfig.port

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
修改作业 - 数据治理中心 DataArts Studio

是 Location数据结构节点在作业画布上的位置，参考表7。 preNodeName 否 List<String> 本节点依赖的前面的节点名称列表。 conditions 否 List<Condition> 节点执行条件，如果配置此参数，本节点是否执行由condition的字

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
步骤6：数据开发处理 - 数据治理中心 DataArts Studio

码表维度数据填充节点：为MRS Hive SQL节点，用于将付款方式、费率代码和供应商的集成数据写入DWR层相应的维度表中。其中，“SQL脚本”请选择在脚本开发中创建的脚本demo_taxi_dim_data。图12 码表维度数据填充节点属性等待节点：不做任何事情，等待前面的节点运行结束。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
新建表/文件迁移作业 - 数据治理中心 DataArts Studio

新建表/文件迁移作业操作场景 CDM可以实现在同构、异构数据源之间进行表或文件级别的数据迁移，支持表/文件迁移的数据源请参见支持的数据源。约束限制记录脏数据功能依赖于OBS服务。作业导入时，JSON文件大小不超过1MB。单文件传输大小不超过1TB。配置源端和目的端参数时，字段名不可包含&和%。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
数据开发操作列表 - 数据治理中心 DataArts Studio

重跑实例 task retryTask/restart(api) 节点暂停 task pauseJob 节点恢复 task resumeJob 节点手工重试 task redoJobs 节点跳过 task skipJob 节点强制成功 task forceJobSuccess 新建脚本

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 审计日志 > 支持云审计的关键操作
OBS数据连接参数说明 - 数据治理中心 DataArts Studio

新增访问密钥”，如图1所示。图1 单击新增访问密钥单击“确定”，根据浏览器提示，保存密钥文件。密钥文件会直接保存到浏览器默认的下载文件夹中。打开名称为“credentials.csv”的文件，即可查看访问密钥（Access Key Id和Secret Access Key）。说明：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
查询SQL获取max值传递给CDM作业 - 数据治理中心 DataArts Studio

选择MRS Spark SQL节点和For Each循环执行的节点，让CDM子作业循环执行，并配置节点属性参数。配置MRS Spark SQL节点的属性参数，并关联已创建的脚本maxtime。图3 配置MRS Spark SQL节点属性参数配置For Each节点的属性参数，并关联已创建的CDM子作业。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
（可选）购买规格增量包 - 数据治理中心 DataArts Studio

配额使用量”查看使用量。当您的每日作业节点调度的已使用次数+运行中次数+本日将运行次数之和达到该规格时，建议购买作业节点调度次数/天增量包，以避免作业调度受限。技术资产数量增量包：不同版本的DataArts Studio实例，提供了不同的技术资产数量规格限制。该规格是以数据目录中表和OBS文件的数量计算

 帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 购买DataArts Studio实例
常用EL表达式样例合集 - 数据治理中心 DataArts Studio

getNodeOutput(String nodeName) 获取指定节点的输出。此方法只能获取前面依赖节点的输出。获取test节点输出。 #{Job.getNodeOutput("test")} 当前一节点执行无结果时，输出结果为“null”。当前一节点的输出结果是一个字段时，输出结果形如[["00

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > EL表达式参考
数据开发错误码 - 数据治理中心 DataArts Studio

The OBS file fails to be accessed. 读取OBS文件失败。请检查OBS文件。 400 DLF.1006 The job node is empty. 作业的节点为空。请检查节点。 400 DLF.1242 The OBS bucket does not

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 附录 > 错误码
查看数据血缘 - 数据治理中心 DataArts Studio

在数据资产搜索结果中，类型名称末尾带“_node”的数据资产为节点，单击某一节点名称，可以查看节点的详情。在节点（需是支持血缘的节点类型）详情页面，可以查看节点的血缘信息。单击血缘图中节点左右两端“+”、“-”图标，可以进一步展开查看血缘的上下链路。单击血缘图中的某一个节点，可以查看该节点的详情。进入“作业”页

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系

总条数： 742

上一页
1
...
8
9
10
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新冠疫情数据治理思考 - 数据治理中心 DataArts Studio

跨空间进行作业调度 - 数据治理中心 DataArts Studio

DataArts Studio数据开发作业告警最佳实践 - 数据治理中心 DataArts Studio

通过数据开发使用参数传递灵活调度CDM作业 - 数据治理中心 DataArts Studio

如何选择版本 - 数据治理中心 DataArts Studio

发布API - 数据治理中心 DataArts Studio

新建离线处理集成作业 - 数据治理中心 DataArts Studio

配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

批量配置作业 - 数据治理中心 DataArts Studio

OBS连接 - 数据治理中心 DataArts Studio

修改作业 - 数据治理中心 DataArts Studio

步骤6：数据开发处理 - 数据治理中心 DataArts Studio

新建表/文件迁移作业 - 数据治理中心 DataArts Studio

数据开发操作列表 - 数据治理中心 DataArts Studio

OBS数据连接参数说明 - 数据治理中心 DataArts Studio

查询SQL获取max值传递给CDM作业 - 数据治理中心 DataArts Studio

（可选）购买规格增量包 - 数据治理中心 DataArts Studio

常用EL表达式样例合集 - 数据治理中心 DataArts Studio

数据开发错误码 - 数据治理中心 DataArts Studio

查看数据血缘 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线