检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Hive数据库中使用varchar、char、date,长度超过限制后,FDI会自动进行截取,可能造成信息不完整。 父主题: 数据集成普通任务
原因分析 查看任务mapping配置,源端字段类型的长度超出目标端字段类型的长度限制,或者配置的映射字段中某个字段在源端的数据中不存在。 解决方案 检查字段映射配置的字段类型是否匹配、字段是否超出长度限制、字段是否存在,如果有不符合要求的请修改。 父主题: 数据集成任务
0-SNAPSHOT.jar & 以MQS数据源作为源端,MySQL作为目标端为例创建实时任务。 参考创建数据集成任务(普通任务)接入源端MQS数据源和目标端MySQL数据源,并创建实时任务。完成后运行任务,可以将源端MQS数据源中的数据,迁移到MySQL数据源的表中。 父主题: 数据集成开发指导
xml文件中添加一个配置项“dfs.client.use.datanode.hostname”,值设为“true”。 父主题: 数据集成普通任务
创建MQS到MySQL的数据集成任务。 在左侧的导航栏选择“数据集成 FDI > 任务管理”,单击“创建普通任务”。 在创建任务页面中填写数据集成任务的相关配置信息。 配置任务基本信息。 表3 任务基本信息 参数 配置说明 任务名称 填写任务的名称,自定义。 描述 填写任务的描述信息。 集成模式
源端API类型数据源自定义周期如何设置? 创建FDI普通任务时,当源端数据源选择API类型并且开启增量迁移时,支持自定义周期,自定义周期配置详细说明可参照以下示例: 当粒度单位为“小时”时,分别有以下四种配置场景。 以时间点2020-11-05 22:10为例,如下图。 周期指定
解决方案 建议使用CONVERT转换为统一编码,如:CONVERT (ID USING utf8 ) AS ID。 父主题: 数据集成任务
在数据库中执行以下命令设置分隔符: alter table 表名set serdeproperties('field.delim'='分隔符') 父主题: 数据集成任务
修复服务之后FDI支持自动修复任务。 支持任务调度、任务监控、任务中断续读。 可靠的数据传输通道 FDI可以持续监测数据通道中的数据,支持100个以上的线程并发执行。FDI实时监测消息队列把数据实时写入目标队列。 任务调度 FDI提供全面、灵活、高可用的任务调度服务,支持通过API或以
如下图。 解决方案 修改表字段类型,RowId一般是使用字母、数字生成的18位字符串,采集到目标端需要为字符类型。 父主题: 数据集成组合任务
OBS源端的CSV文件解析到关系型数据库时,列的值不对怎么办? 任务配置时源端OBS的元数据填写顺序必须与CSV文件中列的顺序一致,需修改任务配置,按照文件中列的顺序填写元数据。 父主题: 数据集成普通任务
DBMS_XSTREAM_ADM.START_OUTBOUND(server_name => 'dbzxout'); END; 父主题: 数据集成组合任务
该问题是debezium当前版本的一个BUG,需要用户升级MySQL。 对于组合任务,可以尝试通过修改配置的方法规避,首先删除此表的配置,启动任务后会跳过这些数据,等任务执行成功后,再将表配置回来重新采集。 父主题: 数据集成组合任务
创建负载通道(可选) ROMA Connect通过创建负载通道,可访问指定服务器中已部署的后端服务,并实现后端服务访问的负载均衡功能。ROMA Connect的负载通道可直接访问同一VPC内的弹性云服务器(ECS),也可以通过IP访问其他VPC内的ECS和私有服务器。 例如,VPC中包含6台ECS,ROMA
S获取多个文件默认按照时间降序排序,先解析最晚上传的文件,所以最早上传的文件最后解析,这样就会导致任务执行结束后,数据库中的值还是最早上传的文件中的值。 父主题: 数据集成普通任务
段大小写一致。若不一致,MRS Hive和MRS HBase将会运行异常,MongoDB数据库不受影响,运行正常。 父主题: 数据集成普通任务
Connect可以使用OBS作为数据集成任务的源端和目标端,也可以在数据集成任务运行过程中,把转换异常的数据存储到OBS中。 分布式缓存服务 分布式缓存服务(Distributed Cache Service,简称DCS)为您提供即开即用、安全可靠、弹性扩容、便捷管理的在线分布式缓存能力,兼容Red
etime,目标端字段为date,数据可以集成到目标端,但是数据类型不匹配的字段值会为NULL,其他字段正常集成。 父主题: 数据集成普通任务
延时 “延时”处理器用于创建指定时间的延迟。其典型使用场景是若某步骤为耗时任务,且后续步骤依赖于该步骤的执行结果时,可在两步骤之间添加“延时”处理器,以保证后续步骤可正常执行。 配置参数 参数 说明 延迟时间(ms) 延迟的时长,单位为ms。 父主题: 处理器
Kafka Kafka是一个分布式流处理平台,最初由LinkedIn开发。它是一个高吞吐量、低延迟的平台,可以处理大量的实时数据流。Kafka主要由三个部分组成:生产者、消费者和代理服务器。生产者将数据发布到Kafka集群,消费者从Kafka集群订阅数据并进行处理,代理服务器则是