检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
CDM迁移近一个月的数据 备HBase集群中约10TB数据,最近一个月新增的数据量约60TB,总共约70TB。H公司安装的云专线为20GE端口,支持CDM超大规格的集群(cdm.xlarge),综合考虑迁移时间、成本、性能等,这里使用2个CDM超大规格集群并行迁移。CDM集群规格如表1所示。
在映射区域的右上角,单击按钮,可以删除指定的映射,单击可以收起映射区域。 完成表的配置后,单击“发布”,选择审核人,再单击“确认提交”提交审核。 企业模式下,进行发布时,可以选择发布表到生产环境或开发环境。默认发布到生产环境,不勾选则无法发布。 选择审核人时,系统支持选择多个审核人,全部
bad_record_location_name String 脏数据OBS路径。 description String 工作空间描述。 eps_id String 企业项目ID,获取方法请参见项目ID和账号ID。 job_log_location_name String 作业日志OBS路径。 name String
bad_record_location_name String 脏数据OBS路径。 description String 工作空间描述。 eps_id String 企业项目ID,获取方法请参见项目ID和账号ID。 job_log_location_name String 作业日志OBS路径。 name String
补数据作业除了支持作业参数,脚本参数或者全局环境变量也支持。 约束条件 只有数据开发作业配置了周期调度,才支持使用补数据功能。 使用案例 案例场景 在某企业的产品数据表中,有一个记录产品销售额的源数据表A,现在需要把产品销售额的历史数据导入的目的表B里面,需要您配置补数据作业的相关操作。 需要导入的列表情况如表1所示。
主题域:主题域是根据数据的性质对数据进行划分,性质相同的数据划分为一类,其划分后得出的各数据集合叫做主题域,主题域是信息需求范围的上层级数据集合。 业务对象:业务对象是指企业运作和管理中不可缺少的重要人、事、物等信息。 您也可以根据您的实际情况,参考主题流程配置对主题层级进行自定义配置。 约束与限制 单工作空间允许创建的主题个数最多500个。
发布后,所选范围内的用户均可以在服务目录中看到此API。 当前工作空间可见 当前项目可见 当前租户可见 访问日志 勾选,则此API的查询结果将会产生记录并被保留7天,可以在“运营管理 > 访问日志”处通过选择“请求日期”的方式查看对应日期的日志。 最低保留期限 API发布状态预留的最低期限,单位为小时,0表示不设限制。
图1 选择连接器类型 连接H公司本地的Apache Hadoop HDFS文件系统时,连接类型选择“Apache HDFS”,然后单击“下一步”。 图2 创建HDFS连接 名称:用户自定义连接名称,例如“hdfs_link”。 URI:配置为H公司HDFS文件系统的Namenode
与数据标准关联用于生成值域校验质量监控。 新建数据标准并发布:用于描述公司层面需共同遵守的属性层数据含义和业务规则。其描述了公司层面对某个数据的共同理解,这些理解一旦确定下来,就应作为企业层面的标准在企业内被共同遵守。 模型设计:应用关系建模和维度建模的方法,进行分层建模。 数
计费项子类 计费项说明 计费模式 计费说明 DataArts Studio基础包 新版本模式: 初级版 专家版 企业版 旧版本模式: 初级版 基础版 高级版 专业版 企业版 DataArts Studio基础包对应DataArts Studio实例,如果需要使用DataArts S
内网域名ID。 private_zone_name String 内网域名名称。 enterprise_project_id String 企业项目ID。 create_time Long 创建时间。 create_user String 创建人。 current_namespace_publish_api_num
String 子网id,可在当前虚拟私有云列表中获取。 instance_name 是 String 实例名。 eps_id 是 String 企业项目ID,获取方法请参见项目ID和账号ID。 is_auto_renew 是 Integer 是否续订。 promotion_info 否
维度建模”,进入维度建模页面。 单击“维度表”页签,进入维度表页面。 在维度表列表中,勾选需要同步的维度表,单击列表左上方的“同步”按钮,系统弹出“批量同步”对话框。 企业模式下,进行同步时,可以选择同步到生产环境或开发环境。默认同步到生产环境,不勾选则无法同步。 图1 同步维度表 确认无误后,单击“确认提交”,完成后界面将显示同步结果。
虚拟私有云id,可在当前虚拟私有云列表中获取。 security_group_id String 安全组id,可在当前安全组列表中获取。 eps_id String 企业项目ID,获取方法请参见项目ID和账号ID。 effective_time Number 生效时间点,包周期实例有效。 expire_days
d的关系。 逻辑属性映射:为来源于当前映射的属性,依次选择一个含义相同的源属性。 单击“发布”,选择审核人,再单击“确认提交”提交审核。 企业模式下,进行发布时,可以选择发布到生产环境或开发环境。默认发布到生产环境,不勾选则无法发布。 选择审核人时,系统支持选择多个审核人,全部审
内网域名ID。 private_zone_name String 内网域名名称。 enterprise_project_id String 企业项目ID。 create_time Long 创建时间。 create_user String 创建人。 current_namespace_publish_api_num
通过数据治理,华为可以做到3天月度财务报告出初稿、5天月度财务报告出终稿、11天年度财务报告完成初稿,要把一家业务遍及170多个国家和地区的全球化公司的“总账”算清楚可真不容易。要做到财报的高效、准确、完整,离不开高度集成的全球结账管理系统,更离不开数据治理,通过交易核算自动化、ERP优
内网域名ID。 private_zone_name String 内网域名名称。 enterprise_project_id String 企业项目ID。 create_time Long 创建时间。 create_user String 创建人。 current_namespace_publish_api_num
Project Name 项目ID CDM所属的项目ID。 1551c7f6c808414d8e9f3c514a170f2e 账号名 用户所属的企业账户名称。 Account Name 用户名 使用云服务的用户名,该用户需要拥有CDM的操作权限。 Username 密码 用户密码。 password
应的服务Admin权限。 也可精确到具体服务的操作、资源以及请求条件等。根据作业中的节点类型,以对应服务API接口为粒度进行权限拆分,满足企业对权限最小化的安全管控要求。参见表2进行配置。例如包含Import GES节点的作业,您只需要创建自定义策略,并勾选ges:graph:g