检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
新建数据表 您可以通过可视化模式、DDL模式或SQL脚本方式新建数据表。 (推荐)可视化模式:您可以直接在DataArts Studio数据开发模块通过No Code方式,新建数据表。 (推荐)DDL模式:您可以在DataArts Studio数据开发模块,通过选择DDL方式,使用SQL语句新建数据表。
新建码表 码表,也称lookup表、数据字典表,一般由中英文名称编码组成,由可枚举数据构成,存储枚举数据名称与编码的映射关系。码表的作用主要有: 在数据清洗中用于标准化业务数据以及补充映射字段。 在质量监控中用于监控业务数据的值域范围。 在维度建模中可以引申为枚举维度。 新建码表并发布
状态码:403 表9 响应Body参数 参数 参数类型 描述 data Object 返回的数据信息。 请求示例 上传主题excel,通过form表单提交,file为具体excel文件。 POST https://{endpoint}/v2/{project_id}/design/catalogs/action
码表和数据标准有什么关系? 问题描述 码表和数据标准的关系是什么。 解决方案 码表由多条表字段的名称+编码+数据类型组成,码表的表字段可以关联到数据标准上,数据标准会应用到某张模型表的字段上。 父主题: 数据架构
状态码:403 表9 响应Body参数 参数 参数类型 描述 data Object 返回的数据信息。 请求示例 上传模型excel,通过form表单提交,file为具体文件。 POST https://{endpoint}/v2/{project_id}/design/models/action
单击“事实表”页签,进入事实表页面。 在事实表列表中,单击需要关联质量规则的事实表名称。 在事实表的详情页的表字段列表中,单击,配置单个表字段关联质量规则。 图11 事实表单个字段关联质量规则 配置完成后,单击“确定”,完成事实表字段关联质量规则。 图12 添加事实表质量规则 事实表字段批量关联质量规则 在数据架构控制台,选择“模型设计
在维度表列表中,单击需要关联质量规则的维度表名称。 在维度表的详情页的表字段列表中,查找字段并单击,配置单个表字段关联质量规则。 图4 维度表单个字段关联质量规则 配置完成后,单击“确定”,完成维度表字段关联质量规则。 更新已有规则:若勾选此项,新添加的规则会覆盖旧规则。 添加规则
审批单处理 功能介绍 审批驳回/通过,单个或多个action-id=reject/resolve。 调用方法 请参见如何调用API。 URI PUT /v2/{project_id}/design/approvals/action 表1 路径参数 参数 是否必选 参数类型 描述 project_id
撤回审批单 功能介绍 撤回审批单。 调用方法 请参见如何调用API。 URI PUT /v2/{project_id}/design/approvals 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参见项目ID和账号ID。
获取审批单 功能介绍 获取审批单。 调用方法 请参见如何调用API。 URI GET /v2/{project_id}/design/approvals 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参见项目ID和账号ID。
数据指标应用 创建完数据指标的相关数据后,请前往数据架构模块,进行数据集市建设,新建数据集市层并发布汇总表。汇总表能够引用指标管理里的指标,发布后进行指标结果物化。 本示例中,先创建汇总表所需的主题,汇总表依赖于主题架构,然后创建汇总表,汇总表名称为地区坪效比汇总表。 创建主题详细信息请参见数据架构的主题设计。
EL表达式参考 表达式概述 基础操作符 日期和时间模式 Env内嵌对象 Job内嵌对象 StringUtil内嵌对象 DateUtil内嵌对象 JSONUtil内嵌对象 Loop内嵌对象 OBSUtil内嵌对象 常用EL表达式样例合集 EL表达式使用实例 父主题: 数据开发
集群名称。 jobName 是 String 作业名称。 通过DataArts Studio管理控制台 > 数据集成,在批量数据迁移集群列表单击对应的集群管理,进入后在作业管理中获取作业名称。 表20 DISTransferTask节点属性说明 参数名 是否必选 参数类型 说明 streamName
权限列表 工作空间成员共有管理员、开发者、部署者、运维者和访客五种预置角色,并支持自定义角色。 管理员:工作空间管理员,拥有工作空间内所有的业务操作权限。建议将项目负责人、开发责任人、运维管理员设置为管理员角色。 开发者:开发者拥有工作空间内创建、管理工作项的业务操作权限。建议将任务开发、任务处理的用户设置为开发者。
基础操作符 EL表达式支持大部分Java提供的算术和逻辑操作符。 操作符列表 表1 基础操作符 操作符 描述 . 访问一个Bean属性或者一个映射条目 [] 访问一个数组或者链表的元素 () 组织一个子表达式以改变优先级 + 加 - 减或负 * 乘 / 或 div 除 % 或 mod
集群名称。 jobName 是 String 作业名称。 通过DataArts Studio管理控制台 > 数据集成,在批量数据迁移集群列表单击对应的集群管理,进入后在作业管理中获取作业名称。 表21 DISTransferTask节点属性说明 参数名 是否必选 参数类型 说明 streamName
集群名称。 jobName 是 String 作业名称。 通过DataArts Studio管理控制台 > 数据集成,在批量数据迁移集群列表单击对应的集群管理,进入后在作业管理中获取作业名称。 表21 DISTransferTask节点属性说明 参数名 是否必选 参数类型 说明 streamName
图片路径 是 需要识别的图片在OBS上的路径。 识别类型 是 可识别的图片类型, 当前仅支持通用文字识别。可支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。 识别结果存储目录 是 指定识别结果存储的OBS目录。 表2 高级参数 参数 是否必选 说明 节点执行的最长时间 是
关系建模和维度建模的区别? 问题描述 关系建模和维度建模的区别是什么。 解决方案 关系建模为事务性模型,对应三范式建模。 维度建模为分析性模型,主要包括事实表、维度表的设计,多用于实现多角度、多层次的数据查询和分析。 DataArts Studio是基于数据湖的数据运营平台,维度建模使用的场景比较多。
CDM迁移近一个月的数据 备HBase集群中约10TB数据,最近一个月新增的数据量约60TB,总共约70TB。H公司安装的云专线为20GE端口,支持CDM超大规格的集群(cdm.xlarge),综合考虑迁移时间、成本、性能等,这里使用2个CDM超大规格集群并行迁移。CDM集群规格如表1所示。