搜索_华为云

记录数据迁移入库时间 - 数据治理中心 DataArts Studio

单击“下一步”配置任务参数，一般情况下全部保持默认即可。单击“保存并运行”，回到作业管理的表/文件迁移界面，在作业管理界面可查看作业执行进度和结果。作业执行成功后，单击作业操作列的“历史记录”，可查看该作业的历史执行记录、读取和写入的统计数据。在历史记录界面单击“日志”，可查看作业的日志信息。前往目的端数据源查看数据迁移的入库时间。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 关键操作指导
新建数据分类 - 数据治理中心 DataArts Studio

分类类型选择“自定义”，呈现此参数，支持正则表达式。正则表达式内容识别：提供的数据识别方式之一，自定义正则表达式。列名识别：提供字段名精确匹配和模糊匹配方式，支持多个字段匹配。描述对当前规则进行简单描述。新建分组在DataArts Studio控制台首页，选择实例，单击“进入控制台”，选择对应工

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 配置数据安全策略（待下线）
数仓规划 - 数据治理中心 DataArts Studio

Integration，又称贴源数据层。SDI是源系统数据的简单落地。 DWI：Data Warehouse Integration，又称数据整合层。DWI整合多个源系统数据，对源系统进来的数据进行整合、清洗，并基于三范式进行关系建模。物理模型设计时的考虑事项如下：物理模型要确保业务需求及业务规则所要求的功能得到满足，性能得到保障。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计
计费说明 - 数据治理中心 DataArts Studio

据迁移CDM服务控制台购买的折扣套餐（按需资源包）。如果当前绑定区域有1个或多个对应实例规格的CDM集群，则扣费方式是先扣除已购买资源包内的时长额度，超出部分以按需计费的方式进行结算（资源包对应多个集群时，会出现每月订购周期内可使用时长不足的情况）。例如购买了1个月的套餐包（

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

启动作业标识文件为是时支持此参数。标识文件的类型。 MARK_DONE：只有在源端路径下存在标识文件的情况下才会执行迁移任务。 MARK_DOING：只有在源端路径下不存在标识文件的情况下才会执行迁移任务。 MARK_DONE 过滤类型传输满足过滤条件的文件。支持的过滤条件有：无，通配符及正则表达式。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发 > 配置作业源端参数
发布脚本任务 - 数据治理中心 DataArts Studio

个审批人，不能指定自己为审批人。单击“审批人管理”可以跳转到“空间管理”页面，单击“编辑”按钮可以维护审批人信息。可以进行批量发布。发布多个待发布项时，发布流程采用异步发布，可以看到发布任务的过程，最大的发布项个数为100。对于暂时不发布的发布项，开发者、部署者和管理员可以进行撤销，支持批量撤销。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发
文件增量迁移 - 数据治理中心 DataArts Studio

适用场景：源端数据源为文件类型（OBS/HDFS/FTP/SFTP）。这种增量迁移方式，只追加写入文件，不会更新或删除已存在的记录。关键配置：文件/路径过滤器+定时执行作业。前提条件：源端目录或文件名带有时间字段。增量导出指定时间以后的文件适用场景：源端数据源为文件类型（OBS/HDFS/FTP/S

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 关键操作指导 > 增量迁移原理介绍
环境变量、作业参数、脚本参数有什么区别和联系？ - 数据治理中心 DataArts Studio

SQL不支持），脚本独立执行时可通过编辑器下方配置，如图3所示；通过作业调度时可通过节点属性赋值，如图4所示。 Shell脚本可以配置参数和交互式参数以实现参数传递功能。 Python脚本可以配置参数和交互式参数以实现支持参数传递功能。图3 独立执行时的脚本参数图4 作业调度时的脚本参数

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
文件增量迁移 - 数据治理中心 DataArts Studio

适用场景：源端数据源为文件类型（OBS/HDFS/FTP/SFTP）。这种增量迁移方式，只追加写入文件，不会更新或删除已存在的记录。关键配置：文件/路径过滤器+定时执行作业。前提条件：源端目录或文件名带有时间字段。增量导出指定时间以后的文件适用场景：源端数据源为文件类型（OBS/HDFS/FTP/S

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践 > 增量迁移原理介绍
更新表模型 - 数据治理中心 DataArts Studio

dw_id 否 String 数据连接ID。 db_name 否 String 数据库名。 queue_name 否 String dli数据连接执行sql所需的队列，数据连接类型为DLI时必须。 schema 否 String DWS类型需要。 extend_info 否 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 关系建模接口
MRS Presto数据连接参数说明 - 数据治理中心 DataArts Studio

此外，还需确保该MRS集群与DataArts Studio工作空间所属的企业项目相同，如果不同，您需要修改工作空间的企业项目。说明：当同一Agent连接多个MRS集群时，如果其中一个MRS集群被删除或状态异常，会影响另外一个正常的MRS集群数据连接。因此建议一个Agent对应一个MRS集群数据连接。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
查询指定作业的实例列表 - 数据治理中心 DataArts Studio

manual-stop：取消 plan_time 是 Long 作业实例计划执行时间 start_time 是 Long 作业实例实际执行开始时间 end_time 否 Long 作业实例实际执行结束时间 execute_time 否 Long 执行耗时，单位：毫秒 instance_id 是 Long

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V2） > 作业开发API
发布作业任务 - 数据治理中心 DataArts Studio

个审批人，不能指定自己为审批人。单击“审批人管理”可以跳转到“空间管理”页面，单击“编辑”按钮可以维护审批人信息。可以进行批量发布。发布多个待发布项时，发布流程采用异步发布，可以看到发布任务的过程，最大的发布项个数为100。单击发布后，系统会提示您“发布成功后，立即对发布包中的作业启动调度”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
配置HBase/CloudTable源端参数 - 数据治理中心 DataArts Studio

的作业参数参数类型参数名说明取值样例基本参数表名导出数据的HBase表名。该参数支持配置为时间宏变量，且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配合，可以实现定期同步新增数据，详细说明请参见使用时间宏变量完成增量同步。说明：如果配置了时间宏变量，通过DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业 > 配置CDM作业源端参数
公共消息头 - 数据治理中心 DataArts Studio

workspace 工作空间id，获取方式请参见实例ID和工作空间ID。调用批量数据迁移或实时数据接入API时无需配置。调用数据开发API时，有多个DataArts Studio实例时必选。只有一个DataArts实例时可选。不填写则默认查询default工作空间数据，如需查询其他工作空间需要带上该消息头。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 附录
查询SQL获取max值传递给CDM作业 - 数据治理中心 DataArts Studio

创建一个Pipeline作业在数据开发主界面的左侧导航栏，选择“数据开发 > 作业开发”。选择MRS Spark SQL节点和For Each循环执行的节点，让CDM子作业循环执行，并配置节点属性参数。配置MRS Spark SQL节点的属性参数，并关联已创建的脚本maxtime。图3 配置MRS Spark

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
自动建表映射规则 - 数据治理中心 DataArts Studio

0-4294967295字节极大长度文本二进制字符串不支持特殊类型 SET SET是一个字符串对象，可以有零或多个值，其值来自表创建时规定的允许的一列值。指定包括多个SET成员的SET列值时各成员之间用逗号(‘,’)间隔开。这样SET成员值本身不能包含逗号。 - JSON - STRING

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 实时处理集成作业开发
前往监控 - 数据治理中心 DataArts Studio

在作业目录中选择需要的作业，右键单击作业名称，选择“前往监控”，进入作业监控界面。图1 前往监控在监控界面，可以查看该作业节点的日志信息、版本信息、对该作业执行调度、单击编辑或者作业名称进行作业开发界面修改作业信息等。图2 作业监控界面父主题：（可选）管理作业

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
查询作业列表 - 数据治理中心 DataArts Studio

分页返回结果，指定每页最大记录数。范围[1,1000] 默认值：10 jobName 否 String 作业名称 tags 否 String 作业标签列表，如果有多个标签，以英文逗号分隔。例如：tag1,tag2,tag3。请求参数表1 请求Header参数参数名是否必选参数类型说明 workspace

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
脚本开发流程 - 数据治理中心 DataArts Studio

支持单击右键，可快速复制脚本名称，同时可以快速的关闭已打开的脚本页签。在MRS API连接模式下，MRS Spark SQL和MRS Hive SQL脚本运行完以后，在执行结果中查看运行日志，增加一键跳转MRS Yarn查看日志的链接。企业模式下，开发脚本时，鼠标放置在上，单击“前往发布”跳转到任务发布页面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发

总条数： 664

上一页
1
...
27
28
29
...
34
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

记录数据迁移入库时间 - 数据治理中心 DataArts Studio

新建数据分类 - 数据治理中心 DataArts Studio

数仓规划 - 数据治理中心 DataArts Studio

计费说明 - 数据治理中心 DataArts Studio

配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

发布脚本任务 - 数据治理中心 DataArts Studio

文件增量迁移 - 数据治理中心 DataArts Studio

环境变量、作业参数、脚本参数有什么区别和联系？ - 数据治理中心 DataArts Studio

文件增量迁移 - 数据治理中心 DataArts Studio

更新表模型 - 数据治理中心 DataArts Studio

MRS Presto数据连接参数说明 - 数据治理中心 DataArts Studio

查询指定作业的实例列表 - 数据治理中心 DataArts Studio

发布作业任务 - 数据治理中心 DataArts Studio

配置HBase/CloudTable源端参数 - 数据治理中心 DataArts Studio

公共消息头 - 数据治理中心 DataArts Studio

查询SQL获取max值传递给CDM作业 - 数据治理中心 DataArts Studio

自动建表映射规则 - 数据治理中心 DataArts Studio

前往监控 - 数据治理中心 DataArts Studio

查询作业列表 - 数据治理中心 DataArts Studio

脚本开发流程 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线