搜索_华为云

在ECS上调试好的shell脚本，在DLF中shell脚本执行异常，如何处理？ - 数据治理中心 DataArts Studio

在ECS上调试好的shell脚本，在DLF中shell脚本执行异常，如何处理？问题描述在ECS上调试好的shell脚本，在DLF中shell脚本执行异常。脚本内容是通过gsql连接dws查询某库表数据行数的。 ECS调试结果： DLF脚本运行结果：解决方案添加如下两条命令：

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
报错“配置项[linkConfig.createBackendLinks]不存在”或“配置项 [throttlingConfig.concurrentSubJobs] 不存在怎么办”？ - 数据治理中心 DataArts Studio

concurrentSubJobs] 不存在怎么办”？问题描述创建数据连接时报错“配置项[linkConfig.createBackendLinks]不存在”或创建作业时报错“配置项 [throttlingConfig.concurrentSubJobs] 不存在”。原因分析

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成
性能调优 - 数据治理中心 DataArts Studio

作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。作业抽取并发数可参考集群最大抽取并发数配置，但不建议超过集群最大抽取并发数上限。目的端为DLI数据源时，抽取

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 优化迁移性能
设置CDM告警规则 - 数据治理中心 DataArts Studio

通过设置CDM集群告警规则，用户可自定义监控目标与通知策略，及时了解CDM集群运行状况，从而起到预警作用。设置CDM集群的告警规则包括设置告警规则名称、监控对象、监控指标、告警阈值、监控周期和是否发送通知等参数。本节介绍了设置CDM集群告警规则的具体方法。操作步骤进入CDM主界面，选择“集群管理”，选择集群操作列中的“更多

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 创建并管理CDM集群 > 管理并查看CDM监控指标
Hadoop类型的数据源进行数据迁移时，建议使用的组件版本有哪些？ - 数据治理中心 DataArts Studio

Hadoop类型的数据源进行数据迁移时，建议使用的组件版本有哪些？建议使用的组件版本既可以作为目的端使用，也可以作为源端使用。表1 建议使用的组件版本 Hadoop类型组件说明 MRS/Apache/FusionInsight HD Hive 暂不支持2.x版本，建议使用的版本：

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成
创建集群 - 数据治理中心 DataArts Studio

是 String 请求语言。表3 请求Body参数参数是否必选参数类型描述 cluster 是 cluster object 集群对象，请参见cluster参数说明。 auto_remind 否 Boolean 选择是否开启消息通知。开启后，支持配置20个手机号码或邮箱，

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
配置输出处理算子 - 数据治理中心 DataArts Studio

节点映射表达式写法固定为“${节点编码|payload}”，节点编码可通过在API编排的画布中，单击节点后在节点详情中查看，并支持通过复制。图1 查看节点编码例如节点编码为NormalApi_5a256，则节点映射表达式为“${NormalApi_5a256|payload}”，结果集名称定义为“销售记录”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API
创建CDM集群 - 数据治理中心 DataArts Studio

创建CDM集群 CDM采用独立集群的方式为用户提供安全可靠的数据迁移服务，各集群之间相互隔离，不可相互访问。 CDM集群可用于如下场景：用于创建并运行数据迁移作业。作为管理中心组件连接数据湖时的Agent代理。前提条件已申请VPC、子网和安全组。CDM集群连接云上其它服务

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 创建并管理CDM集群
自动建表原理介绍 - 数据治理中心 DataArts Studio

自动建表原理介绍 CDM将根据源端的字段类型进行默认规则转换成目的端字段类型，并在目的端建数据表。自动建表时的字段类型映射 CDM在数据仓库服务（Data Warehouse Service，简称DWS）中自动建表时，DWS的表与源表的字段类型映射关系如图1所示。例如使用CDM

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 关键操作指导
源端为FTP/SFTP - 数据治理中心 DataArts Studio

BINARY_FILE：二进制格式，不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。当选择“BINARY_FILE”时，目的端也必须为文件系统。 fromJobConfig.lineSeparator 否 String 文件中的换行符，默认自

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
数据血缘方案简介 - 数据治理中心 DataArts Studio

息又形成了新的数据，不同程度的描述信息形成了数据的层次。 DataArts Studio生成的血缘关系图如图1所示，为数据表对象，为作业节点对象，通过对象和箭头的编排表示血缘信息。从血缘关系图中可以看到，wk_02表数据是由wk_01表数据经过hive_1作业节点加工而生成的，w

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系
导入连接（待下线） - 数据治理中心 DataArts Studio

D。请求参数参数说明：参数名是否必选参数类型说明 path 是 String 有OBS场景：连接定义文件在OBS上的路径，连接定义文件的格式参考导出连接的响应消息。无OBS场景：连接定义文件在本地的路径。 params 否 List<Params> 连接参数，默认值为空。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 连接管理API（待下线）
MD5校验文件一致性 - 数据治理中心 DataArts Studio

移有MD5值的文件至目的端，没有MD5值或者MD5不匹配的数据文件将迁移失败，MD5文件自身不被迁移。若未配置“MD5文件名后缀”，则迁移所有文件。写入时该功能目前只支持目的端为OBS。可校验写入OBS的文件，是否与CDM抽取的文件一致。该功能由目的端作业参数“校验MD5

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 关键操作指导
MD5校验文件一致性 - 数据治理中心 DataArts Studio

移有MD5值的文件至目的端，没有MD5值或者MD5不匹配的数据文件将迁移失败，MD5文件自身不被迁移。若未配置“MD5文件名后缀”，则迁移所有文件。写入时该功能目前只支持目的端为OBS。可校验写入OBS的文件，是否与CDM抽取的文件一致。该功能由目的端作业参数“校验MD5

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
脚本开发流程 - 数据治理中心 DataArts Studio

本。保存版本时，一分钟内多次保存只记录一次版本。对于中间数据比较重要时，可以通过“新增版本”按钮手动增加保存版本。支持单击右键，可快速复制脚本名称，同时可以快速的关闭已打开的脚本页签。在MRS API连接模式下，MRS Spark SQL和MRS Hive SQL脚本运行完

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发
OCR - 数据治理中心 DataArts Studio

128个字符。图片路径是需要识别的图片在OBS上的路径。识别类型是可识别的图片类型, 当前仅支持通用文字识别。可支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。识别结果存储目录是指定识别结果存储的OBS目录。表2 高级参数参数是否必选说明节点执行的最长时间

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
Import GES - 数据治理中心 DataArts Studio

Hive中的点表和边表，并填写元数据输出的OBS路径，单击生成元数据，系统会自动生成xml格式的元数据文件并回填到OBS路径。其中MRS Hive中的点表和边表，即为按GES图数据格式要求标准化后的边数据集和点数据集，需要与“边数据集”和“点数据集”参数所选的OBS桶中边数据集和点数据集保持一致。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
管理集群标签 - 数据治理中心 DataArts Studio

管理集群标签操作场景 CDM集群已经创建成功后，支持新增、修改及删除CDM集群的标签。使用标签可以标识多种云资源，后续在TMS标签系统或者CDM集群管理列表中可筛选出同一标签的云资源。一个CDM集群最多可新增10个标签。前提条件已创建CDM集群。操作步骤登录CDM管理

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 创建并管理CDM集群
查看API访问日志 - 数据治理中心 DataArts Studio

查看API访问日志操作场景支持专享版用户API调用日志的查询，包括请求路径，请求参数，请求响应结果等。当前数据服务日志仅支持专享版。配置云日志基础服务为了能够在云日志服务上面看到数据服务API的日志，需要配置云日志服务。关于云日志服务的详细配置和操作方法，请参见《云日志服务用户指南》。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务
配置Kafka/DMS Kafka源端参数 - 数据治理中心 DataArts Studio

使用配置文件 “数据格式”选择为“CDC场景”时配置，用于配置OBS文件。否 OBS链接选择OBS连接器信息。 obs_link OBS桶选择OBS桶。 obs_test 配置文件选择OBS的配置文件。 /obs/config.csv 最大消息数/poll 可选参数，每次向Kafka请求数据限制最大请求记录数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业 > 配置CDM作业源端参数

总条数： 1418

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在ECS上调试好的shell脚本，在DLF中shell脚本执行异常，如何处理？ - 数据治理中心 DataArts Studio

报错“配置项[linkConfig.createBackendLinks]不存在”或“配置项 [throttlingConfig.concurrentSubJobs] 不存在怎么办”？ - 数据治理中心 DataArts Studio

性能调优 - 数据治理中心 DataArts Studio

设置CDM告警规则 - 数据治理中心 DataArts Studio

Hadoop类型的数据源进行数据迁移时，建议使用的组件版本有哪些？ - 数据治理中心 DataArts Studio

创建集群 - 数据治理中心 DataArts Studio

配置输出处理算子 - 数据治理中心 DataArts Studio

创建CDM集群 - 数据治理中心 DataArts Studio

自动建表原理介绍 - 数据治理中心 DataArts Studio

源端为FTP/SFTP - 数据治理中心 DataArts Studio

数据血缘方案简介 - 数据治理中心 DataArts Studio

导入连接（待下线） - 数据治理中心 DataArts Studio

MD5校验文件一致性 - 数据治理中心 DataArts Studio

MD5校验文件一致性 - 数据治理中心 DataArts Studio

脚本开发流程 - 数据治理中心 DataArts Studio

OCR - 数据治理中心 DataArts Studio

Import GES - 数据治理中心 DataArts Studio

管理集群标签 - 数据治理中心 DataArts Studio

查看API访问日志 - 数据治理中心 DataArts Studio

配置Kafka/DMS Kafka源端参数 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线