数据治理中心 DATAARTS STUDIO-新建数据表:参数说明

时间:2024-12-04 08:59:39

参数说明

表5 DLI 数据表

参数

是否必选

说明

基本属性

表名

数据表的名称。只能包含英文小写字母、数字、“_”,不能为纯数字,不能以“_”开头,且长度为1~63个字符。

别名

数据表的别名,只能包含中文字符、英文字母、数字、“_”,不能为纯数字,不能以“_”开头,且长度为1~63个字符。

数据连接类型

数据表所属的数据连接类型。系统默认。

数据连接

数据表所属的数据连接。系统默认。

数据库

数据表所属的数据库。系统默认。

数据位置

选择数据存储的位置:

  • OBS
  • DLI

数据格式

选择数据的格式。“数据位置”“OBS”时,配置该参数。

  • parquet:支持读取不压缩、snappy压缩、gzip压缩的parquet数据。
  • csv:支持读取不压缩、gzip压缩的csv数据。
  • orc:支持读取不压缩、snappy压缩的orc数据。
  • json:支持读取不压缩、gzip压缩的json数据。

路径

选择数据存储的OBS路径。“数据位置”“OBS”时,配置该参数。

如果OBS路径不存在或者OBS桶不存在,系统支持可以自动创建OBS目录。

说明:

如果OBS桶创建超过上限,系统会自动提示“创建obs目录失败,错误原因:[Create OBS Bucket failed:TooManyBuckets:You have attempted to create more buckets than allowed]”。

表描述

数据表的描述信息。

表结构

列类型

选择列类型。包含分区列和普通列。系统默认普通列。

列名

填写列名,列名不能重复。

类型

选择数据类型,具体说明请参见 数据湖探索 SQL语法参考》数据类型

列描述

填写列的描述信息。

操作

单击,增加列。

单击,删除列。

表6 DWS数据表

参数

是否必选

说明

基本属性

表名

数据表的名称。只能包含英文字母、数字、“_”,不能为纯数字,不能以“_”开头,且长度为1~63个字符。

别名

数据表的别名,只能包含中文字符、英文字母、数字、“_”,不能为纯数字,不能以“_”开头,且长度为1~63个字符。

数据连接类型

数据表所属的数据连接类型。系统默认。

数据连接

数据表所属的数据连接。系统默认。

数据库

数据表所属的数据库。系统默认。

模式

选择数据库的模式。

表描述

数据表的描述信息。

高级选项

提供以下高级选项:

  • 选择数据表的存储方式
    • 行存模式
    • 列存模式
  • 选择数据表的压缩级别
    • 行存模式:压缩级别的有效值为YES/NO。
    • 列存模式:压缩级别的有效值为YES/NO/LOW/MIDDLE/HIGH,还可以配置列存模式同一压缩级别下不同的压缩水平0-3(数值越大,表示同一压缩级别下压缩比越大)。

表结构

列名

填写列名,列名不能重复。

数据分类

选择数据类型的类别:

  • 数值类型
  • 货币类型
  • 布尔类型
  • 二进制类型
  • 字符类型
  • 时间类型
  • 几何类型
  • 网络地址类型
  • 位串类型
  • 文本搜索类型
  • UUID类型
  • JSON类型
  • 对象标识符类型

类型

选择数据类型,具体说明请参见 数据仓库 服务开发指南》数据类型

列描述

填写列的描述信息。

是否建ES索引

单击复选框时,表示需要建立ES索引。建立ES索引时,请同时在“CloudSearch集群名”中选择建立好的 CSS 集群。如何创建 CS S集群,请参见 云搜索服务 用户指南》创建集群

ES索引数据类型

选择ES索引的数据类型:

  • text
  • keyword
  • date
  • long
  • integer
  • short
  • byte
  • double
  • boolean
  • binary

操作

单击,增加列。

单击,删除列。

表7 MRS Hive数据表

参数

是否必选

说明

基本属性

表名

数据表的名称。只能包含英文小写字母、数字、“_”,不能为纯数字,不能以“_”开头,且长度为1~63个字符。

别名

数据表的别名,只能包含中文字符、英文字母、数字、“_”,不能为纯数字,不能以“_”开头,且长度为1~63个字符。

数据连接类型

数据表所属的数据连接类型。系统默认。

数据连接

选择数据表所属的数据连接。系统默认。

数据库

选择数据表所属的数据库。系统默认。

表描述

数据表的描述信息。

表结构

列名

填写列名,列名不能重复。

数据分类

选择数据类型的类别:

  • 原始类型
  • ARRAY
  • MAP
  • STRUCT
  • UNION

类型

选择数据类型,具体说明请参见LanguageManual DDL

列描述

填写列的描述信息。

操作

单击,增加列。

单击,删除列。

表8 MRS Spark数据表

参数

是否必选

说明

基本属性

表名

数据表的名称。只能包含英文小写字母、数字、“_”,不能为纯数字,不能以“_”开头,且长度为1~63个字符。

别名

数据表的别名,只能包含中文字符、英文字母、数字、“_”,不能为纯数字,不能以“_”开头,且长度为1~63个字符。

数据连接类型

数据表所属的数据连接类型。系统默认。

数据连接

选择数据表所属的数据连接。系统默认。

数据库

选择数据表所属的数据库。系统默认。

表描述

数据表的描述信息。

表结构

列名

填写列名,列名不能重复。

数据分类

选择数据类型的类别:

  • 原始类型
  • ARRAY
  • MAP
  • STRUCT
  • UNION

类型

选择数据类型,具体说明请参见LanguageManual DDL

列描述

填写列的描述信息。

操作

单击,增加列。

单击,删除列。

support.huaweicloud.com/usermanual-dataartsstudio/dataartsstudio_01_0416.html