检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
新建DataArts Studio与DWS数据湖的连接 本章节以新建DWS连接为例,介绍如何建立DataArts Studio与数据仓库底座之间的数据连接。 前提条件 在创建数据连接前,请确保您已创建所要连接的数据湖(如DataArts Studio所支持的数据库、云服务等)。
enabled(启用AQE用于连接操作,可以通过根据正在处理的数据动态选择最佳连接算法来提高性能。) spark.sql.adaptive.skewedJoin.enabled(启用AQE用于倾斜的连接操作,可以通过自动检测倾斜的数据并相应地优化连接算法来提高性能) spark.sql.mergeSmallFiles
数据连接类型:MapReduce服务(MRS Hive)。 数据连接名称:mrs_hive_link。 标签:可选参数。您可以输入新的标签名称,也可以在下拉列表中选择已有的标签。 适用组件:保持默认即可。 连接方式:选择“通过代理连接”。 手动:选择“集群名”模式,“IP”和“端口”不需要手动填写。
enabled(启用AQE用于连接操作,可以通过根据正在处理的数据动态选择最佳连接算法来提高性能。) spark.sql.adaptive.skewedJoin.enabled(启用AQE用于倾斜的连接操作,可以通过自动检测倾斜的数据并相应地优化连接算法来提高性能) spark.sql.mergeSmallFiles
参数类型 描述 id String 编码,ID字符串。 tag_id String 标签ID,ID字符串。 tag_name String 标签名称。 biz_id String 实体ID,ID字符串。 biz_type String 业务实体类型。 枚举值: AGGREGATION_LOGIC_TABLE:
导入数据到HDFS时,支持设置压缩格式。 参见配置HDFS目的端参数。 MRS HBase CloudTable 支持导入数据到HBase,创建新HBase表时支持设置压缩算法。 参见配置HBase/CloudTable目的端参数。 MRS Hive 支持快速导入数据到MRS的Hive。 参见配置Hive目的端参数。
参数类型 描述 id String 编码,ID字符串。 tag_id String 标签ID,ID字符串。 tag_name String 标签名称。 biz_id String 实体ID,ID字符串。 biz_type String 业务实体类型。 枚举值: AGGREGATION_LOGIC_TABLE:
属性描述。 descriptionEn String 属性英文描述。 label String 属性标签。 disabled Boolean 是否禁用。 id String 数据标准ID,ID字符串。 actived Boolean 是否显示,系统默认项必然显示不允许修改。true表示使
column_name 否 String 敏感字段。 algorithm_name 否 String 算法名称。 algorithm_type 否 String 算法类型。 en_name 否 String 算法名称。 algorithm_parameters 否 String 参数。 failure_policy
Studio数据目录模块中通过标签搜索相关的数据资产。 在新建表或编辑表时,进入“表字段”标签页,在字段所在行的“标签”列,单击按钮可以添加标签,在弹出框中,您可以输入新的标签名称后按回车,也可以在下拉列表中选择已有标签。 关联质量规则 完成表的新建后,您可以在表中为字段关联质量规则,完成关联后,当表发布成功后,就会在DataArts
Studio数据目录模块中通过标签搜索相关的数据资产。 在新建表或编辑表时,进入“表字段”标签页,在字段所在行的“标签”列,单击按钮可以添加标签,在弹出框中,您可以输入新的标签名称后按回车,也可以在下拉列表中选择已有标签。 关联质量规则 完成表的新建后,您可以在表中为字段关联质量规则,完成关联后,当表发布成功后,就会在DataArts
属性描述。 descriptionEn String 属性英文描述。 label String 属性标签。 disabled Boolean 是否禁用。 id String 数据标准ID,ID字符串。 actived Boolean 是否显示,系统默认项必然显示不允许修改。true表示使