检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
已获取Oracle数据库的IP、数据库名、用户名和密码。 如果Oracle数据库是在本地数据中心或第三方云上,需要确保Oracle可通过公网IP访问,或者已经建立好了企业内部数据中心到华为云的VPN通道或专线。 已在CDM集群的“作业管理 > 连接管理 > 驱动管理”页面,上传了Oracle数据库驱动。 创建CDM集群并绑定EIP
用,否则配置无效。 支持设置脚本责任人 单击编辑器右侧的“脚本基本信息”,可设置脚本的责任人和描述信息。 脚本内容大小不能超过16MB。 企业模式下,支持从脚本开发界面快速前往发布。标放置在上,单击“前往发布”,进入待发布任务界面。 在编辑器上方,单击“运行”。Python语句运
VPC,本端子网除了需要添加中转VPC的子网之外,还需要添加实时资源组的VPC网段。 购买和配置虚拟专用网络VPN的相关操作,可以参考通过企业版站点入云VPN实现数据中心和VPC互通。其中在创建VPN网关时,虚拟私有云选择步骤2所创建的中转VPC,本端子网除了需要添加中转VPC的
MySQL数据迁移到DWS 操作场景 CDM支持表到表的迁移,本章节以MySQL-->DWS为例,介绍如何通过CDM将表数据迁移到表中。流程如下: 创建CDM集群并绑定EIP 创建MySQL连接 创建DWS连接 创建迁移作业 前提条件 已获取DWS数据库的IP地址、端口、数据库名
SQLServer同步到MRS Hudi作业配置 支持的源端和目的端数据库版本 表1 支持的数据库版本 源端数据库 目的端数据库 SQLServer数据库(企业版2016、2017、2019、2022版本,标准版2016 SP2及以上版本、2017、2019、2022版本) MRS集群(3.2.0-LTS
业中同名参数替换。 支持设置脚本责任人 单击编辑器右侧的“脚本基本信息”,可设置脚本的责任人和描述信息。 脚本内容大小不能超过16MB。 企业模式下,支持从脚本开发界面快速前往发布。标放置在上,单击“前往发布”,进入待发布任务界面。 在编辑器上方,单击“运行”。Shell语句运行
数据安全组件不支持连接串模式的DWS连接。 DWS集群名 是 “手动”选择为“集群名模式”时需要配置本参数。 选择DWS集群,系统会显示所有项目ID和企业项目相同的DWS集群。 IP或域名 是 “手动”选择为“连接串模式”时需要配置本参数。 “IP或域名”如果手动填写,必须写内网IP,端口必
本地MySQL数据库可通过公网访问。如果MySQL服务器是在本地数据中心或第三方云上,需要确保MySQL可以通过公网IP访问,或者是已经建立好了企业内部数据中心到云服务平台的VPN通道或专线。 已获取本地MySQL数据库和RDS上MySQL数据库的IP地址、数据库名称、用户名和密码。 已在CDM集群的“作业管理
运行异常”的实例。 重跑 重新运行状态为“成功”或“取消”的实例。 详细操作请参见重跑作业实例。 说明: 手动调度的作业任务不支持重跑。 企业模式下,开发者不能对作业实例进行重跑。 手工确认执行场景下,重跑实例时,作业实例运行状态显示为“待确认执行”,可以进行手动确认执行,单击“
置安全组规则请参见如何配置安全组规则章节。 此外,还需确保该MRS集群与DataArts Studio工作空间所属的企业项目相同,如果不同,您需要修改工作空间的企业项目。 表1 MRS Hive连接参数 参数名 说明 取值样例 名称 连接的名称,根据连接的数据源类型,用户可自定义便于记忆、区分的连接名。
在映射区域的右上角,单击按钮,可以删除指定的映射,单击可以收起映射区域。 完成表的配置后,单击“发布”,选择审核人,再单击“确认提交”提交审核。 企业模式下,进行发布时,可以选择发布表到生产环境或开发环境。默认发布到生产环境,不勾选则无法发布。 选择审核人时,系统支持选择多个审核人,全部
补数据作业除了支持作业参数,脚本参数或者全局环境变量也支持。 约束条件 只有数据开发作业配置了周期调度,才支持使用补数据功能。 使用案例 案例场景 在某企业的产品数据表中,有一个记录产品销售额的源数据表A,现在需要把产品销售额的历史数据导入的目的表B里面,需要您配置补数据作业的相关操作。 需要导入的列表情况如表1所示。
主题域:主题域是根据数据的性质对数据进行划分,性质相同的数据划分为一类,其划分后得出的各数据集合叫做主题域,主题域是信息需求范围的上层级数据集合。 业务对象:业务对象是指企业运作和管理中不可缺少的重要人、事、物等信息。 您也可以根据您的实际情况,参考主题流程配置对主题层级进行自定义配置。 约束与限制 单工作空间允许创建的主题个数最多5000个。
补数据作业除了支持作业参数,脚本参数或者全局环境变量也支持。 约束条件 只有数据开发作业配置了周期调度,才支持使用补数据功能。 使用案例 案例场景 在某企业的产品数据表中,有一个记录产品销售额的源数据表A,现在需要把产品销售额的历史数据导入的目的表B里面,需要您配置补数据作业的相关操作。 需要导入的列表情况如表1所示。
name 否 String 脏数据OBS路径。 description 否 String 工作空间描述。 eps_id 是 String 企业项目ID,获取方法请参见项目ID和账号ID。可通过查询同实例下其他工作空间获取,或在console界面获取。 job_log_location_name
指定虚拟私有云ID,用于集群网络配置。 name 否 String 集群名称。 sys_tags 否 Array of sys_tags objects 企业项目信息,请参见sys_tags参数说明。 isAutoOff 否 Boolean 选择是否启用自动关机功能,自动关机功能和定时开关机功能
bad_record_location_name String 脏数据OBS路径。 description String 工作空间描述。 eps_id String 企业项目ID,获取方法请参见项目ID和账号ID。 job_log_location_name String 作业日志OBS路径。 name String
bad_record_location_name String 脏数据OBS路径。 description String 工作空间描述。 eps_id String 企业项目ID,获取方法请参见项目ID和账号ID。 job_log_location_name String 作业日志OBS路径。 name String
访客:访客可以查看工作空间内的数据,但无法操作业务。建议将只查看空间内容、不进行操作的用户设置为访客。 部署者:企业模式独有,具备工作空间内任务包发布的相关操作权限。在企业模式中,开发者提交脚本或作业版本后,系统会对应产生发布任务。开发者确认发包后,需要部署者审批通过,才能将修改后的作业同步到生产环境。
单次调度模式不支持启动调度。 运行单个对账作业 系统支持运行单个对账作业。 选择“数据质量监控 > 对账作业”,选择要运行的对账作业。 单击“操作”列的“运行”。 企业模式下,选择运行环境,系统支持可选择“开发环境”或“生产环境”。 单击“确定”。 导出对账作业 系统支持批量导出对账作业,一次最多可导出2