搜索_华为云

SHALLOW CLONE - 数据湖探索 DLI
SHALLOW CLONE - 数据湖探索 DLI

SHALLOW CLONE 命令功能 SHALLOW CLONE 命令在特定版本创建现有Delta表的浅拷贝。被克隆的信息包括：schema、分区信息、数据文件路径等。对克隆表所做的任何更改都只会影响克隆本身，而不会影响源表，只要它们不触及源数据。注意克隆表可能仍会指向源表的数据文件，当源表

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

Flink Jar作业只能运行在预先创建的独享队列上。如果“所属队列”下拉框中无可用的独享队列，请先创建一个独享队列并将该队列绑定到当前用户选择Flink Jar作业运行的队列应用程序用户自定义的程序包自定义的程序包主类指定加载的Jar包类名，如FlinkDisToDisExample。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
ADD CONSTRAINT - 数据湖探索 DLI
ADD CONSTRAINT - 数据湖探索 DLI

CONSTRAINT 命令功能 ADD CONSTRAINT 命令添加 CHECK 约束。在将约束添加到表中之前会验证所有现有行是否满足约束。注意事项在将约束添加到表中之前会验证所有现有行是否满足约束，如果有行不满足约束，约束将添加失败，添加前需先清理不满足约束的数据。命令格式 ALTER

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
cume - 数据湖探索 DLI
cume - 数据湖探索 DLI

partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。返回值说明返回DOUBLE类型的值。 a为NULL，则返回NULL。示例代码为便于理解函数的使用方法，本文为您提供源数据，基于源数据提供

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
VACUUM - 数据湖探索 DLI
VACUUM - 数据湖探索 DLI

VACUUM 命令功能 VACUUM命令用于删除表目录中不由 Delta 管理的所有文件，并删除不再处于表事务日志最新状态且超过保留期阈值的数据文件。默认阈值为 7 天。注意事项 RETAIN num HOURS表示保留期阈值，建议设置为至少 7 天。如果对 Delta 表运

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
Delta清理和优化 - 数据湖探索 DLI

序可以重新组织存储中的数据，当您的数据被适当地排序时，可以跳过更多的文件，读取更少的数据，从而运行得更快。要对Z-Order数据进行排序，请在ZORDER BY中指定要对其进行排序的列。 OPTIMIZE delta_table0 ZORDER BY (price);

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
查看多版本备份数据 - 数据湖探索 DLI

在DLI数据多版本功能开启后，您可以通过SHOW HISTORY命令查看表的备份数据。开启和关闭多版本语法请参考开启或关闭数据多版本。 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建表SQL语法可以参考使用Hive语法创建OBS表。语法格式查看某个非分区表的备份数据信息 SHOW HISTORY

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
清理多版本数据 - 数据湖探索 DLI

overwrite或者truncate语句时触发，所以当表的多版本数据在保留周期时间外但是后续该表不会再执行insert overwrite或者truncate语句时，多版本保留周期外的数据不会自动清理。可以通过本章节介绍的SQL命令手动进行多版本数据清理。语法格式清理多版本保留周期外数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
隐式连接 - 数据湖探索 DLI
隐式连接 - 数据湖探索 DLI

WHERE：隐式连接利用WHERE条件实现类似JOIN...ON...的连接，返回匹配的记录。语法格式中仅给出等式条件下的WHERE条件过滤，同时也支持不等式WHERE条件过滤。注意事项所要进行JOIN连接的表必须是已经存在的表，否则会出错。隐式JOIN的命令中不含有JOIN...ON...关键词，而

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
表别名 - 数据湖探索 DLI
表别名 - 数据湖探索 DLI

否添加此关键字不会影响命令执行结果。注意事项所要查询的表必须是已经存在的，否则会出错。别名的命名必须在别名的使用之前，否则会出错。此外，建议不要重名。示例给表simple_table起为n的别名，并利用n.name访问simple_table中的name字段。 1 SELECT

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 别名SELECT
find - 数据湖探索 DLI
find - 数据湖探索 DLI

tr1在以逗号（,）分隔的字符串str2中的位置，从1开始计数。命令格式 find_in_set(string <str1>, string <str2>) 参数说明表1 参数说明参数是否必选参数类型说明 str1 是 STRING 待查找的字符串。 str2 是 STRING

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
恢复多版本备份数据 - 数据湖探索 DLI

column 分区列名。 value 分区列名对应的值。 version_id 指定版本号恢复备份数据。具体的版本号可以通过SHOW HISTORY命令获取，详情请参考查看多版本备份数据。注意事项 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建表SQL语法可以参考使用Hive语法创建OBS表。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
重命名分区（只支持OBS表） - 数据湖探索 DLI

partition_specs 分区字段。注意事项该命令仅支持操作OBS表，不支持对DLI表进行操作。所要重命名分区的表和分区必须已存在，否则会出错。新分区名不能与其他分区重名，否则将出错。若分区表是按照多个字段进行分区的，重命名分区时需要指定所有的分区字段，指定字段的顺序可任意。 “partition_specs”中的参数默认带有“(

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

安装Kyuubi 访问Apache Kyuubi的下载Kyuubi安装包。了解更多Kyuubi安装操作。解压下载的Kyuubi安装包。 tar -xzf kyuubi-{version}-bin.tar.gz 配置环境变量（可选）：将Kyuubi的bin目录添加到PATH环境变量中，确

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

操作步骤从Kafka实例的基本信息页面下载SSL证书，解压后将其中的clinet.jks文件上传到OBS。图3 下载SSL证书在DLI控制台，打开“数据管理 > 程序包管理”，单击“创建”，创建clinet.jks对应的程序包。主要参数的填写说明：包类型：File OBS路径：clinet

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Beeline是数据分析师和数据工程师的重要工具之一，适用于大规模数据处理的场景。Beeline提供了的SQL引擎，使得用户可以使用SQL的语言来执行数据查询、数据分析和管理任务。 Kyuubi是一个分布式 SQL 查询引擎，它提供了标准的SQL接口，使用户能够方便地访问和分析存储在大数据平台中的数据。通

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
修改弹性资源池的主机信息 - 数据湖探索 DLI

修改弹性资源池的主机信息操作场景主机信息用于配置主机的IP与域名的映射关系，在作业配置时只需使用配置的域名即可访问对应的主机。在跨源连接创建完成后，支持修改主机信息。常见的访问MRS的HBase集群时需要配置实例的主机名（即域名）与主机对应的IP地址。约束限制已获取MR

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
添加分区（只支持OBS表） - 数据湖探索 DLI

NED BY指定的列）必须已存在，而所要添加的分区不能重复添加，否则将出错。已添加的分区可通过IF NOT EXISTS避免报错。若分区表是按照多个字段进行分区的，添加分区时需要指定所有的分区字段，指定字段的顺序可任意。 “partition_specs”中的参数默认带有“( )”。例如：PARTITION

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

Livy工具配置文件上传指定的DLI Livy工具jar资源包到OBS桶路径下。登录OBS控制台，在指定的OBS桶下创建一个存放Livy工具jar包的资源目录。例如：“obs://bucket/livy/jars/”。进入3.a中DLI Livy工具所在ECS服务器的安装目录，获取以下jar包，将获取的jar包上传到1

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

有BERNOULLI和SYSTEM两种采样方法。这两种采样方法都不允许限制结果集返回的行数。 BERNOULLI 每一行都将基于指定的采样率选择到采样表中。当使用Bernoulli方法对表进行采样时，将扫描表的所有物理块并跳过某些行（基于采样百分比和运行时计算的随机值之间的比较）。结果中包含一行的概率与任何其

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法

总条数： 464

上一页
1
...
6
7
8
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SHALLOW CLONE - 数据湖探索 DLI

使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

ADD CONSTRAINT - 数据湖探索 DLI

cume - 数据湖探索 DLI

VACUUM - 数据湖探索 DLI

Delta清理和优化 - 数据湖探索 DLI

查看多版本备份数据 - 数据湖探索 DLI

清理多版本数据 - 数据湖探索 DLI

隐式连接 - 数据湖探索 DLI

表别名 - 数据湖探索 DLI

find - 数据湖探索 DLI

恢复多版本备份数据 - 数据湖探索 DLI

重命名分区（只支持OBS表） - 数据湖探索 DLI

配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

修改弹性资源池的主机信息 - 数据湖探索 DLI

添加分区（只支持OBS表） - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线