检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
和开发环境的两套数据湖服务,用于隔离开发和生产环境: 对于集群化的数据源(例如MRS、DWS、RDS、MySQL、Oracle、DIS、ECS),DataArts Studio通过管理中心的创建数据连接区分开发环境和生产环境的数据湖服务,在开发和生产流程中自动切换对应的数据湖。因
DALONE模式。 选择STANDALONE模式时,CDM支持在多个MRS集群的HDFS之间迁移数据。 若在一个CDM中同时连接两个及以上开启Kerberos认证且realm相同的集群,只能使用EMBEDDED运行模式连接其中一个集群,其余需使用STANDALONE。 linkConfig
不能以下划线开头,且长度不能超过100个字符。 适用组件 是 选择此连接适用的组件。勾选组件后,才能在相应组件内使用本连接。 说明: 当开启数据集成作业特性后,可勾选数据集成组件,勾选后在数据开发组件创建集成作业时支持选择本数据连接。 离线处理集成作业功能当前需申请白名单后才能
示严重,FATAL表示致命。 alarm_condition String 统一告警条件。 alarm_notify Boolean 是否开启通知告警。 alarm_notify_type String 告警通知类型,TRIGGER_ALARM表示触发告警,RUN_SUCCESS
否 Boolean 是否开启识别规则。 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 rule_id String 识别规则id。 rule_name String 识别规则名称。 enabled Boolean 识别规则是否开启。 状态码: 400 表5
单次Commit的分区数量 > 50,推荐值30。 compaction.async.enabled boolean true 是否开启compaction,默认为true,即默认开启hudi的compaction操作。compaction操作一定程度会影响实时任务的写入性能,为了保证Migrat
或为空时,所有文件都会被解压。 * 启动作业标识文件 选择是否开启作业标识文件的功能。当源端路径下存在启动作业的标识文件时才启动作业,否则会挂起等待一段时间,等待时长在下方“等待时间”中配置。 否 标识文件名 选择开启作业标识文件的功能时,需要指定启动作业的标识文件名。指定文件后
secrecy_level_num Long 密级层级。 name String 规则名称。 guid String guid。 enable Boolean 规则是否开启。 method String 规则方式, REGULAR, NONE, DEFAULT content_expression String
创建作业的任务配置中,如果已经将作业分配到了不同的分组中,则这里可以按分组显示作业、按分组批量启动作业、按分组导出作业等操作。 按组批量启动作业会运行组内所有作业。如果开启了用户隔离功能,即使华为账号下的其他IAM用户无法查看到组内作业,按组批量启动作业依然会将组内作业运行,因此在用户隔离场景不建议使用按组批量启动作业功能。
如果通过DataArts Studio数据开发调度CDM迁移作业,CDM迁移作业处也配置了定时任务,则两种调度均会生效。为了业务运行逻辑统一和避免调度冲突,推荐您启用数据开发调度即可,无需配置CDM定时任务。 配置作业调度任务(批处理作业) 配置批处理作业的作业调度任务,支持单次调度、周期调度、事件驱动调度三种方式。操作方法如下:
DALONE模式。 选择STANDALONE模式时,CDM支持在多个MRS集群的HDFS之间迁移数据。 若在一个CDM中同时连接两个及以上开启Kerberos认证且realm相同的集群,只能使用EMBEDDED运行模式连接其中一个集群,其余需使用STANDALONE。 linkConfig
ka-connector:DMSKafka连接。 update-date Long 更新连接的时间。 enabled Boolean 是否激活连接,默认为“true”。 update-user String 更新连接的用户。 表5 link-config-values 参数 参数类型
会失败,可能会导致告警通知发送失败。 抄送人 是 通知方式选择“按责任人”时才需配置。 最多只能选择10个抄送人。 开关 是 是否开启通知,默认开启。 单击“确定”,为作业配置通知。 数据开发模块的通知管理功能是通过消息通知服务来发送消息,消息通知服务的使用可能会产生费用,具体请咨询消息通知服务。
登录DORIS集群的MRS FusionInsight Manager。2.选择“集群 > 服务 > Doris > 配置。3.如果集群开启了Kerberos认证,则在此处填写https_port的值,否则填写http_port的值。 *数据库 选择待嵌入水印的数据库和数据表。
配置规则策略,各配置参数说明请参见表1。 图3 规则策略配置参数 表1 规则策略配置参数 参数名 参数说明 实时检测作业上移敏感信息 是否开启在数据集成(离线作业)进行表数据迁移时的表敏感数据实时检测。 敏感信息拦截策略 在数据集成(离线作业)作业中,如果识别到了敏感信息的拦截策略:
使用教程 创建MRS Hive连接器 创建MySQL连接器 MySQL数据迁移到MRS Hive分区表 MySQL数据迁移到OBS MySQL数据迁移到DWS MySQL整库迁移到RDS服务 Oracle数据迁移到云搜索服务 Oracle数据迁移到DWS OBS数据迁移到云搜索服务
节点名称,可以包含中文、英文字母、数字、“_”、“-”、“/”、“<”、“>”等各类特殊字符,长度为1~128个字符。 集群或数据连接 是 选择集群或数据连接。 集群方式不支持开启安全模式的CloudSearch集群,请使用数据连接方式。 CloudSearch集群 是 选择“集群”时,才需要配置。 选择CloudS
日志提示解析日期格式失败时怎么处理? 问题描述 在使用CDM迁移其他数据源到云搜索服务(Cloud Search Service)的时候,作业执行失败,日志提示“Unparseable date”,如图1所示。 图1 日志提示信息 原因分析 云搜索服务对于时间类型有一个特殊处理:
前缀,作业将自动移除前缀并传入底层Kafka客户端,具体参数可参考Apache Kafka官方文档中的配置说明。 高级配置 支持在作业“任务配置”中添加自定义属性来开启部分高级功能,参数详情可参考MySQL->Kafka高级参数一览表。 图8 添加自定义属性 表7 MySQL > Kafka高级参数一览表
见主机连接参数说明。 连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本