检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
写log文件时是否开启liststatus优化。涉及到大表和分区数据量多的作业,在启动时list会非常耗时,可能导致作业启动超时,建议关闭。 hoodie.index.liststatus.optimized boolean false - 定位数据时是否开启liststatus优化。涉及到大表和分区数据量多的作
field_id。 field_names Array of strings 字段名称信息,格式:表名称.字段名称。 cal_exp String 计算表达式,形如'${table_id.column_id} > 1',其中table_id表示引用字段所属表ID,column_id表示引用字段ID。
Oracle同步到DWS作业配置 支持的源端和目的端数据库版本 表1 支持的数据库版本 源端数据库 目的端数据库 Oracle数据库(10、11、12、19版本) DWS集群(8.1.3、8.2.0版本) 数据库账号权限要求 在使用Migration进行同步时,源端和目的端所使用
PostgreSQL同步到DWS作业配置 支持的源端和目的端数据库版本 表1 支持的数据库版本 源端数据库 目的端数据库 PostgreSQL数据库(PostgreSQL 9.4、9.5、9.6、10、11、12、13、14版本) DWS集群(8.1.3、8.2.0版本) 数据库账号权限要求
field_id。 field_names Array of strings 字段名称信息,格式:表名称.字段名称。 cal_exp String 计算表达式,形如'${table_id.column_id} > 1',其中table_id表示引用字段所属表ID,column_id表示引用字段ID。
“IP或域名”如果手动填写,必须写内网IP,端口必须为对资源组网段放开的端口(如需设置请参见设置安全组规则),否则可能导致网络连接不通。 如果为RDS或GaussDB等云上数据源,可以通过管理控制台获取访问地址: 根据注册的账号登录对应云服务的管理控制台。 从左侧列表选择实例管理。 单击某一个实例名称,进入实
order_paras Array of DatasourceOrderPara objects 排序参数。 total_size_sql String 总条数计算脚本SQL。 表8 ApiRequestPara 参数 参数类型 描述 name String 参数名称。 mapping String 映射字段。
Studio数据质量组件的操作权限,其余组件仅有查看权限但无法编辑。 用户登录并验证权限 以创建IAM用户并加入用户组章节中新建的IAM账号登录华为云控制台,切换至授权区域。 在“服务列表”中选择数据治理中心,进入DataArts Studio实例卡片。从实例卡片进入控制台首页后,确认能否正常查看工作空间列表情况。
DataArts Studio实例(指DataArts Studio实例中的CDM集群)与DWS集群同区域情况下,同虚拟私有云、同子网、同安全组的不同实例默认网络互通;如果同虚拟私有云但是子网或安全组不同,还需配置路由规则及安全组规则,配置路由规则请参见如何配置路由规则章节,配置安全组规则请参见如何配置安全组规则章节。
本入门示例以某电商商城的BI报表数据为例,分析用户和商品的各种数据特征。 为方便演示,本示例提供了用于模拟原始数据的部分数据。为了方便将源数据集成到云上,我们需要先将样例数据存储为CSV文件,将CSV文件上传至OBS服务中。 创建CSV文件(UTF-8无bom格式),文件名称为对应的数据表
strings 复合指标名称信息。 cal_fn_ids Array of strings 引用函数ID,ID字符串。 cal_exp String 计算表达式,复合指标类型为“表达式”时必填。形如${index_id} + ${compound#index_id},其中index_id代表
Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能,可以帮助您安全的控制华为云资源的访问。 通过IAM,您可以在华为云账号中给员工创建IAM用户,并授权来控制他们对华为云资源的访问范围。例如您的员工中有负责软件开发的人员,您希望他们拥有DataArts Studi
开发批处理单任务SQL作业 对已新建的作业进行开发和配置。 开发单任务模式的批处理作业,请您参考开发SQL脚本、配置作业参数、质量监控、数据表、调测并保存作业和下载或转储脚本执行结果章节。 前提条件 已创建作业,详情请参见新建作业。 当前用户已锁定该作业,否则需要通过“抢锁”锁定
strings 复合指标名称信息。 cal_fn_ids Array of strings 引用函数ID,ID字符串。 cal_exp String 计算表达式,复合指标类型为“表达式”时必填。形如${index_id} + ${compound#index_id},其中index_id代表
原子指标英文名。 description String 描述。 create_by String 创建人。 cal_exp String 计算表达式,形如'sum(${fact_column_id})',其中fact_column_id表示引用事实表中的字段ID。 cal_fn_ids
Array of DatasourceOrderPara objects 排序参数。 total_size_sql 否 String 总条数计算脚本SQL。 表6 RequestPara 参数 是否必选 参数类型 描述 name 否 String 参数名。 position 否 String
guid String 资产同步后的guid,只读。 definition String 指标定义。 expression String 计算公式。 remark String 备注。 approval_info ApprovalVO object 审批信息,只读参数。业务对象最
调度周期需要合理设置,单个作业最多允许5个实例并行执行,如果作业实际执行时间大于作业配置的调度周期,会导致后面批次的作业实例堆积,从而出现计划时间和开始时间相差大。例如CDM、ETL作业的调度周期至少应在5分钟以上,并根据作业表的数据量、源端表更新频次等调整。 如果通过DataArts Studio数
Array of DatasourceOrderPara objects 排序参数。 total_size_sql 否 String 总条数计算脚本SQL。 表6 RequestPara 参数 是否必选 参数类型 描述 name 否 String 参数名。 position 否 String