搜索_华为云

字段映射界面无法显示所有列怎么处理？ - 数据治理中心 DataArts Studio

造成目的端的数据不全。这个问题，可以通过以下方法解决：在CDM的字段映射界面增加字段。在CDM的作业管理界面直接编辑作业的JSON（修改“fromJobConfig.columns”、“toJobConfig.columnList”这2个参数）。导出作业的JSON文件到本

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
目的端为Elasticsearch/云搜索服务 - 数据治理中心 DataArts Studio

例如：“id&gid&name”。 toJobConfig.pipeLine 否 String 需要先在kibana中创建管道ID，这里才可以选择，该参数用于数据传到云搜索服务/Elasticsearch后，通过Elasticsearch的数据转换pipeline进行数据格式变换。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
MD5校验文件一致性 - 数据治理中心 DataArts Studio

该功能由目的端作业参数“校验MD5值”控制，读取文件后写入OBS时，通过HTTP Header将MD5值提供给OBS做写入校验，并将校验结果写入OBS桶（该桶可以不是存储迁移文件的桶）。如果源端没有MD5文件则不校验。迁移文件到文件系统时，目前只支持校验CDM抽取的文件是否与源文件一致（即只校验抽取的数据）。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
导入资源 - 数据治理中心 DataArts Studio

String 映射前数据。 new_value 否 String 映射后数据。 mapping_value 否 String 映射后数据, 可以为空，为空则使用new_value。响应参数状态码： 500 表5 响应Body参数参数参数类型描述 error_code String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据质量API > 导入导出接口
数据治理各模块域之间的关系 - 数据治理中心 DataArts Studio

数据质量管理是数据应用和运营过程中数据准确性、一致性、完整性、及时性、唯一性、有效性的重要保障，是数据业务价值创造的重要前提。数据目录管理模块完成元数据的采集和注册，为数据应用和数据消费提供了解数据的窗口。数据服务管控实现在数据服务开发过程中服务标准、规范、要求和管理的落实，数据服务打通数据应用和数据消费的物理通道。

帮助中心 > 数据治理中心 DataArts Studio > 数据治理方法论 > 数据治理框架
备份管理 - 数据治理中心 DataArts Studio

备份成功后，在以“备份日期”命名的文件夹内，自动生成backup.json文件，该文件按照节点类型存储了作业信息，支持恢复作业前进行修改。启动每日备份后，若想结束备份任务，您可以单击右边的“停止每日备份”。还原资产在DataArts Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度
支持的数据源（2.9.3.300） - 数据治理中心 DataArts Studio

ogstash导入数据到Elasticsearch。上表中非云服务的数据源，例如MySQL，既可以支持用户本地数据中心自建的MySQL，也可以是用户在ECS上自建的MySQL，还可以是第三方云的MySQL服务。整库迁移支持的数据源类型整库迁移适用于将本地数据中心或在ECS上

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
MongoDB同步到DWS作业配置 - 数据治理中心 DataArts Studio

字段名称限制：长度限制为255字节，不能包含null字符或. $。目的端数据库中的对象名需要满足约束：长度不超过63个字符，以字母或下划线开头，中间字符可以是字母、数字、下划线、$。使用限制通用：实时同步过程中，不支持IP、端口、账号、密码修改。 MongoDB实时数据同步不支持单副本的数据源。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
天任务依赖分钟任务 - 数据治理中心 DataArts Studio

天任务会在最后一个分钟任务实例执行完成后执行。操作步骤创建一个分钟任务作业。（开始时间00:00，结束时间23:59，时间间隔1分钟）在数据开发主界面的左侧导航栏，选择“数据开发 > 作业开发”。在作业目录中，右键单击目录名称，选择“新建作业”，创建一个批处理的Pipel

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

分区类型：无分区、时间分区、自定义分区。其中时间分区需要用户指定一个源端表名，选择一个时间转换格式。比如时间分区用户指定一个源端表名src_col_1，选择一个时间转换格式，日(yyyyMMdd)、月(yyyyMM)、年(yyyy)，自动建表时会在Hudi表默认创建一个cdc_partition_key的字

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
执行脚本 - 数据治理中心 DataArts Studio

Python和Impala SQL脚本。脚本每执行一次，生成一个脚本实例。执行脚本接口是一个异步命令，需要通过查询脚本实例执行结果获取执行状态和结果。 DLI SQL和Presto SQL不支持多语句场景。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。 URI

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 脚本开发API
配置HDFS目的端参数 - 数据治理中心 DataArts Studio

迁移到文件系统的场景。选择“是”时，如果源端数据表中的某一个字段内容包含字段分隔符或换行符，写入目的端时CDM会使用双引号（"）作为包围符将该字段内容括起来，作为一个整体存储，避免其中的字段分隔符误将一个字段分隔成两个，或者换行符误将字段换行。例如：数据库中某字段为hello,

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
配置Hive目的端参数 - 数据治理中心 DataArts Studio

表名输入或选择写入数据的目标表名。单击输入框后面的按钮可进入表的选择界面。该参数支持配置为时间宏变量，且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配合，可以实现定期同步新增数据，详细说明请参见使用时间宏变量完成增量同步。说明：如果配置了时间宏变量，通过DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
MRS Flink Job - 数据治理中心 DataArts Studio

Job节点的具体使用教程，请参见开发一个MRS Flink作业。参数用户可参考表1和表2配置MRS Flink节点的参数。表1 属性参数参数是否必选说明节点名称是节点名称，可以包含中文、英文字母、数字、“_”、“-”、“/”、“<”、“>”等各类特殊字符，长度为1～128个字符。作业类型

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
配置MRS Kafka目的端参数 - 数据治理中心 DataArts Studio

featureTag：将每一条数据都打tag标签。 startEndMark：默认是为false。设置为true时，写入消息前将会同步一个开始消息和结束的消息。 columnAsKey：指定写入数据key值，也可以通过指定字段值作为key，通过配置@{column1}--@{column2}。例如：目的端字段为i

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
作业任务参数调优 - 数据治理中心 DataArts Studio

统中最重要的两个部分：JobManager和TaskManager。作业任务配置中调整的处理器核数、并发数、执行内存参数等便是用来调整JobManager和TaskManager的，默认情况下单个作业使用2U8G资源，会对应创建出1个JobManager进程和1个TaskManager进程，且均使用1U4G资源。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
支持的数据源（2.10.0.300） - 数据治理中心 DataArts Studio

Hive，MRS HBase 消息系统：MRS Kafka - 上表中非云服务的数据源，例如MySQL，既可以支持用户本地数据中心自建的MySQL，也可以是用户在ECS上自建的MySQL，还可以是第三方云的MySQL服务。整库迁移支持的数据源类型整库迁移适用于将本地数据中心或在ECS上

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
SFTP/FTP数据连接参数说明 - 数据治理中心 DataArts Studio

数据连接的名称，只能包含字母、数字、下划线和中划线，且长度不超过100个字符。标签否标识数据连接的属性。设置标签后，便于统一管理。说明：标签的名称，只能包含中文、英文字母、数字和下划线，不能以下划线开头，且长度不能超过100个字符。适用组件是选择此连接适用的组件。勾选组件后，才能在相应组件内使用本连接。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
导出导入作业 - 数据治理中心 DataArts Studio

导出导入作业导出作业，均是导出开发态的最新的已保存内容。导入作业，会覆盖开发态的内容并自动提交一个新版本。数据开发在跨时区导出导入作业时，需要手动修改expressionTimeZone字段为目标时区。导出作业参考访问DataArts Studio实例控制台，登录DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
目的端为HBase/CloudTable - 数据治理中心 DataArts Studio

Boolean 选择是否开启HBase的预写日志机制（WAL，Write Ahead Log）。是：开启后如果出现HBase服务器宕机，则可以从WAL中回放执行之前没有完成的操作。否：关闭时能提升写入性能，但如果HBase服务器宕机可能会造成数据丢失。 toJobConfig.transType

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明

总条数： 905

上一页
1
...
41
42
43
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

字段映射界面无法显示所有列怎么处理？ - 数据治理中心 DataArts Studio

目的端为Elasticsearch/云搜索服务 - 数据治理中心 DataArts Studio

MD5校验文件一致性 - 数据治理中心 DataArts Studio

导入资源 - 数据治理中心 DataArts Studio

数据治理各模块域之间的关系 - 数据治理中心 DataArts Studio

备份管理 - 数据治理中心 DataArts Studio

支持的数据源（2.9.3.300） - 数据治理中心 DataArts Studio

MongoDB同步到DWS作业配置 - 数据治理中心 DataArts Studio

天任务依赖分钟任务 - 数据治理中心 DataArts Studio

MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

执行脚本 - 数据治理中心 DataArts Studio

配置HDFS目的端参数 - 数据治理中心 DataArts Studio

配置Hive目的端参数 - 数据治理中心 DataArts Studio

MRS Flink Job - 数据治理中心 DataArts Studio

配置MRS Kafka目的端参数 - 数据治理中心 DataArts Studio

作业任务参数调优 - 数据治理中心 DataArts Studio

支持的数据源（2.10.0.300） - 数据治理中心 DataArts Studio

SFTP/FTP数据连接参数说明 - 数据治理中心 DataArts Studio

导出导入作业 - 数据治理中心 DataArts Studio

目的端为HBase/CloudTable - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线