搜索_华为云

DESCRIBE - 数据湖探索 DLI
DESCRIBE - 数据湖探索 DLI

分区列 numFiles 表的最新版本中的文件个数 sizeInBytes 表的最新快照的大小（以字节为单位） properties 为此表设置的所有属性 minReaderVersion 可以读取该表的最低Reader版本 minWriterVersion 可以写入该表的最低Writer版本

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
DataGen源表 - 数据湖探索 DLI
DataGen源表 - 数据湖探索 DLI

创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。语法格式 create table dataGenSource( attr_name attr_type

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
SHOW PARTITIONS - 数据湖探索 DLI
SHOW PARTITIONS - 数据湖探索 DLI

PARTITIONS [catalog_name.][db_name.]table_name [PARTITION (partitionSpecs)]; 描述这个表达式用于列出指定的的所有分区。示例 SHOW PARTITIONS test PARTITION(hr = '12'

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

登录数据湖探索管理控制台，选择“SQL作业”，在要修改的作业所在行的“操作”列，单击“编辑”进入SQL编辑器界面。在SQL编辑器界面，单击“设置”，在“配置项”尝试添加以下几个Spark参数进行解决。参数项如下，冒号前是配置项，冒号后是配置项的值。 spark.sql.enableToString:false

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

storage_path 指定目录的完整FS绝对路径 space_consumed 返回文件/目录在集群中占用的实际空间，即它考虑了为集群设置的复制因子 quota 名称配额（名称配额是对当前目录树中的文件和目录名称数量的硬性限制） space_quota 空间配额（空间配额是对

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
管理Spark作业模板 - 数据湖探索 DLI

可直接将配置完成的作业信息设置为模板。在DLI管理控制台的左侧导航栏中，单击“作业模板”>“Spark模板”，页面跳转至Spark作业页面。参考创建Spark作业配置作业参数。作业编辑完成后，单击“设为模板”。输入模板名称和描述信息。设置模板的分组信息。便于模板的统一管理。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
FileSytem结果表 - 数据湖探索 DLI

timestamp(3), time。为了避免数据丢失或者数据被覆盖，开启作业异常自动重启，需要配置为“从checkpoint恢复”。 checkpoint间隔设置需在输出文件实时性、文件大小和恢复时长之间进行权衡，比如10分钟。使用HDFS时需要绑定相应的跨源，并填写相应的主机信息。使用hdfs

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

ink Jar写入数据到OBS开发指南。 Flink 1.15 Jar 程序，采用反向类加载机制（child-first），可通过优化参数设置某些依赖包由父类加载器加载：parent.first.classloader.jars=test1.jar,test2.jar Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
Spark SQL常用配置项说明 - 数据湖探索 DLI

false 当前配置设置为“false”时，DLI在覆盖写之前，会删除所有符合条件的分区。例如，分区表中有一个“2021-01”的分区，当使用INSERT OVERWRITE语句向表中写入“2021-02”这个分区的数据时，会把“2021-01”的分区数据也覆盖掉。当前配置设置为“tru

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
CREATE FUNCTION语句 - 数据湖探索 DLI

如果该函数已经存在，则不会进行任何操作。 LANGUAGE JAVA|SCALA Language tag 用于指定 Flink runtime 如何执行这个函数。目前，只支持 JAVA, SCALA，且函数的默认语言为 JAVA。示例创建一个名为STRINGBACK的函数。 create

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义
禁止或恢复表的生命周期 - 数据湖探索 DLI

表生命周期功能支持Hive、DataSource语法创建表、多版本表，暂不支持跨源表、Carbon表。生命周期单位为天，取值为正整数。生命周期只能在表级别设置，不能在分区级设置。为分区表指定的生命周期，适用于该表所有的分区。语法格式该语法在表级别禁止或恢复表的生命周期 1 ALTER TABLE table_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
CONVERT TO DELTA - 数据湖探索 DLI
CONVERT TO DELTA - 数据湖探索 DLI

转换过程会收集统计信息，以提升转换后的 Delta 表的查询性能。如果提供表名，则元存储也将更新，以反映该表现在是 Delta 表。注意事项分区表转换需要设置参数spark.sql.forcePartitionPredicatesOnPartitionedTable.enabled为false。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
修改表生命周期的时间 - 数据湖探索 DLI

表生命周期功能支持Hive、DataSource语法创建表、多版本表，暂不支持跨源表、Carbon表。生命周期单位为天，取值为正整数。生命周期只能在表级别设置，不能在分区级设置。为分区表指定的生命周期，适用于该表所有的分区。语法格式 ALTER TABLE table_name SET TBLPROPERTIES("dli

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在“程序包管理”页面，单击右上角的“创建”创建程序包。在“创建程序包”对话框，配置以下参数。包类型：选择“JAR”。 OBS路径：程序包所在的OBS路径。分组设置和组名称根据情况选择设置，方便后续识别和管理程序包。单击“确定”，完成创建程序包。创建UDAF函数。登录登录DLI管理控制台，创建SQL队列和数据库。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
创建DLI表关联Oracle - 数据湖探索 DLI

/driver/ojdbc6.jar' ); 关键字表1 CREATE TABLE关键字说明参数描述 url Oracle的连接地址。 Oracle url支持以下格式：格式一：jdbc:oracle:thin:@host:port:SID，其中SID是oracle数据库的唯一标识符。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接Oracle表
使用Hive语法创建OBS表 - 数据湖探索 DLI

3及以上版本支持使用Hive语法的CTAS语句创建分区表。关于创建表时设置多字符的分隔符：只有指定ROW FORMAT SERDE为org.apache.hadoop.hive.contrib.serde2.MultiDelimitSerDe时，字段分隔符才支持设置为多字符。只有Hive OBS表支持在建表时指定多字符的分隔符，Hive

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
Hudi数据表Clean规范 - 数据湖探索 DLI

具体可以按照下面的计算公式来保留2个小时的历史版本数据：版本数设置为3600*2/版本interval时间，版本interval时间来自于flink作业的checkpoint周期，或者上游批量写入的周期。 COW表如果业务没有历史版本数据保留的特殊要求，保留版本数设置为1。 COW表的每个版本都是表的全量

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Flink作业性能调优 - 数据湖探索 DLI

key不均衡场景下，group聚合计算存在单点或者数据倾斜问题，此时，可以通过将聚合计算拆分成Local-Global进行优化。配置方式为设置调优参数: table.optimizer.aggphase-strategy=TWO_PHASE count distinct优化在count

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
删除表后再重新创建同名的表，需要对操作该表的用户和项目重新赋权吗？ - 数据湖探索 DLI

表管理”。单击需要设置权限的表所在的数据库名，进入该数据库的“表管理”页面。单击所选表“操作”栏中的“权限管理”，将显示该表对应的权限信息。单击表权限管理页面右上角的“授权”按钮。在弹出的“授权”对话框中选择相应的权限。单击“确定”，完成表权限设置。父主题： DLI数据库和表类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

说明获取方式 DLI AKSK AK/SK认证就是使用AK/SK对请求进行签名，从而通过身份认证。获取AK/SK DLI Endpoint地址地区与终端节点，即云服务在不同Region有不同的访问域名。获取EndPoint DLI所在的项目ID 项目编号，用于资源隔离。获取项目ID

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据

总条数： 576

上一页
1
...
22
23
24
...
29
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DESCRIBE - 数据湖探索 DLI

DataGen源表 - 数据湖探索 DLI

SHOW PARTITIONS - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

管理Spark作业模板 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

CREATE FUNCTION语句 - 数据湖探索 DLI

禁止或恢复表的生命周期 - 数据湖探索 DLI

CONVERT TO DELTA - 数据湖探索 DLI

修改表生命周期的时间 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

创建DLI表关联Oracle - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

删除表后再重新创建同名的表，需要对操作该表的用户和项目重新赋权吗？ - 数据湖探索 DLI

配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线