检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
最小数据单元。您可以将数据标准关联到各个业务上的数据库中。其中,标识符、数据类型、表示格式、值域是数据交换的基础,它们用于描述表的字段元信息,规范字段所存储的数据信息。 数据标准 关系建模 支持逻辑模型设计、物理模型设计、逆向数据库、关联质量规则、导入导出模型、查看表。 关系建模
是否使用正则表达式分隔字段。 是 正则表达式 文件格式为CSV格式且使用正则表达式分隔字段为是时支持此参数。 分隔字段的正则表达式。 ^(\d.*\d) (\w*) \[(.*)\] ([\w\.]*) (\w.*).* 字段分隔符 文件格式为CSV格式且使用正则表达式分隔字段为否时支持此参数。
在作业的执行结果中,每条规则对应一个子作业。为便于结果查看和日志定位,建议您补充子作业信息。 描述 为更好的识别子作业,此处加以描述信息。描述信息长度不能超过1024个字符。 来源对象/目的对象 规则类型 来源对象的“规则类型”包括“表级规则”,“字段级规则”和“自定义规则”。字段级规则可针对表中的具体字段配置监控
参数类型 描述 target_field_id String 目标字段ID,当前表的某个字段,ID字符串。 target_field_name String 目标字段编码。 field_ids String 来源字段ID,多个ID以逗号分隔。 transform_expression
说明: 开启路由前建议先建好目的端索引,可提高查询效率。 否 路由字段 “开启路由”参数选择为“是”时配置,用于配置目的端路由字段。目的端索引存在但是获取不到字段信息时,支持手动填写字段。路由字段允许为空,为空时写入Elasticsearch不指定routing值。 value1
Service,简称GES)是针对以“关系”为基础的“图”结构数据,进行查询、分析的服务,并广泛应用于社交关系分析、营销推荐、舆情及社会化聆听、信息传播、防欺诈等具有丰富关系数据的场景。 在DataArts Studio中,您可以将原始数据表按照GES数据导入要求处理为标准点数据集和边数据集,并通
IP地址:资源组网段 执行完上述步骤后,MRS类型数据源还需要进行以下操作打通网络。 RDS(MySQL)、DMS Kafka、Oracle、RDS(PostgreSQL)、 RDS(SQL Server)、 MongoDB、DWS数据源,无需执行此操作。 表2 MRS类型数据源打通网络
处理方式。操作符左边为绑定字段,右边为绑定参数。当前支持的操作符及含义如下: 表2 支持的操作符 操作符 描述 = 检查两个操作数的值是否相等。 如果绑定字段和绑定参数相等则条件为真。 <> 检查两个操作数的值是否相等。 如果绑定字段和绑定参数不相等则条件为真。 > 检查左操作数的值是否大于右操作数的值。
DimensionLogicTableAttributeVO objects 字段属性。 dw_type String 数据连接类型,对应表所在的数仓类型,取值可以为DWS、MRS_HIVE、POSTGRESQL、MRS_SPARK、CLICKHOUSE、MYSQL、ORACLE和DORIS等。 dw_name
关联到各个业务上的数据库中。其中,标识符、数据类型、表示格式、值域是数据交换的基础,它们用于描述表的字段元信息,规范字段所存储的数据信息。 本章节介绍如何创建数据标准,创建好的数据标准,可用于在关系建模中新建业务表时与业务表中的字段相关联,从而约束业务表中的字段遵从指定的数据标准。
必须指定Elasticsearch文档字段列表。 当前未指定Elasticsearch文档字段列表,请指定后再重试。 Cdm.1513 字段列表中必须包含字段类型定义。 请确认字段列表中是否包含字段类型定义,修改正确后再重试。 Cdm.1514 字段列表中必须包含主键字段。 当前未设置主键字段,请设置主键字段后再重试。
DLI队列。该参数仅DLI连接类型有效。 Schema DWS和POSTGRESQL的模式。该参数仅支持DWS和POSTGRESQL连接类型。 描述 描述信息。支持的长度为0~600个字符。 通过逆向数据库导入逻辑实体 通过逆向数据库,您可以从其他数据源中将一个或多个已创建的数据库表导入到逻辑实体目录中,使其变成逻辑实体。
修改数据标准 功能介绍 修改数据标准。 调用方法 请参见如何调用API。 URI PUT /v2/{project_id}/design/standards/{id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参见项目ID和账号ID。
描述 target_field_id 否 String 目标字段ID,当前表的某个字段,ID字符串。 target_field_name 是 String 目标字段编码。 field_ids 否 String 来源字段ID,多个ID以逗号分隔。 transform_expression
”的形式。 STRING 高级属性 键分隔符 用来分隔关系型数据库的表和列名。 _ 值分隔符 以STRING方式存储时,列之间的分隔符。 ; 字段相同 “值存储类型”参数值为“HASH”显示该参数。 哈希键内有相同的字段。 是 父主题: 配置CDM作业源端参数
-1,DAY)}' 抽取分区字段 “使用SQL语句”选择“否”时,显示该参数,表示抽取数据时使用该字段进行数据切分,CDM依据此字段将作业分割为多个任务并发执行。一般使用数据均匀分布的字段,例如以自然增长的序号字段作为分区字段。 单击输入框后面的按钮可进入字段选择界面,用户也可以直接输入抽取分区字段名。
队列权限可以为当前工作空间分配可使用的MRS Yarn和DLI队列资源,并为用户组/用户配置对应的队列权限策略。 当为工作空间分配队列资源后,在数据开发组件在为作业节点配置队列资源时,可选择的队列为当前空间下已分配的队列资源。 当为用户组/用户配置队列权限策略后,授权对象将按照策略内容被授予相应权限。 配置空间资源权限策略
的入库时间字段。 是 入库时间字段名称 “使用入库时间字段”设置为“是”时,呈现此参数。 用于记录写入Hudi的时间。 说明: 对于已存在目的端表中带有入库时间字段的,可以直接使用已有的timestamp类型字段。 对于自动建表的场景,该字段会被拼接到建表语句中,类型为times
Date类型值是否保留一位进度。 目的端为Hudi、Hive时显示该参数。 否 抽取分片字段 “按表分区抽取”选择“否”时,显示该参数,表示抽取数据时使用该字段进行数据切分,CDM依据此字段将作业分割为多个任务并发执行。一般使用数据均匀分布的字段,例如以自然增长的序号字段作为分片字段。 单击输入框后面
200034,2021/1/4,1,buy 100011,200035,2021/1/4,1,like 数据说明如下: 表4 行为数据说明 字段名称 字段类型 字段说明 字段取值 user_id int 用户编号 脱敏 product_id int 商品编号 脱敏 time string 行为时间