搜索_华为云

实时任务接入 - 数据湖探索 DLI

= 'hudi', //指定写入的是Hudi表 'path' = 'obs://bucket/path/hudi_sink_table',

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
禁止或恢复表的生命周期 - 数据湖探索 DLI

TBLPROPERTIES：表的属性，增加表的生命周期功能。参数说明表1 禁止或恢复生命周期参数说明参数名称是否必选参数说明 table_name 是待禁止或恢复生命周期的表的名称。 pt_spec 否待禁止或恢复生命周期的表的分区信息。格式为partition_col1=col1_value1

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
GROUP BY - 数据湖探索 DLI
GROUP BY - 数据湖探索 DLI

BY将SELECT语句的输出行划分成包含匹配值的分组。简单的GROUP BY可以包含由输入列组成的任何表达式，也可以是按位置选择输出列的序号。以下查询是等效的： SELECT count(*), nationkey FROM customer GROUP BY 2; SELECT count(*)

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
JOINS - 数据湖探索 DLI
JOINS - 数据湖探索 DLI

CROSS JOIN返回两个关系的笛卡尔积。可以使用CROSS JOIN语法指定，也可以在FROM子句中指定多个relation。以下的query是等价的： SELECT * FROM nation CROSS JOIN region; SELECT * FROM nation, region;

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
Print结果表 - 数据湖探索 DLI
Print结果表 - 数据湖探索 DLI

'standard-error' = '' ); 参数说明表1 参数说明参数是否必选默认参数数据类型说明 connector 是无 String 固定为：print。 print-identifier 否无 String 配置一个标识符作为输出数据的前缀。 standard-error

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
INSERT - 数据湖探索 DLI
INSERT - 数据湖探索 DLI

into时，会往表中追加数据，而使用insert overwrite时，如果表属性“auto.purge”被设置为“true”，直接删除原表数据，再写入新的数据。如果对象表是分区表时，insert overwrite会删除对应分区的数据而非所有数据。 insert into后面的table关键字为可选，以兼容hive语法。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DML 语法
Bitwise函数 - 数据湖探索 DLI
Bitwise函数 - 数据湖探索 DLI

描述：返回value的算术右移值，当shift小于64位时，返回结果与bitwise_right_shift一样，当移动位数达到或者超过64位时，value是正数时返回0，负数时返回-1： SELECT bitwise_right_shift_arithmetic( 12, 64); -- 0

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scala样例代码开发说明前提条件在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。构造依赖信息，创建SparkSession

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
Data masking函数 - 数据湖探索 DLI

(1 row)) mask_hash(string|char|varchar str) →varchar 描述：返回基于str的散列值。散列是一致的，可以用于跨表连接被屏蔽的值。对于非字符串类型，返回NULL。 select mask_hash('panda');

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
复杂数据类型 - 数据湖探索 DLI

<value>[, ...]) 具体使用示例详见：ARRAY示例。 MAP 一组无序的键/值对，使用给定的Key和Value对生成MAP。键的类型必须是原生数据类型，值的类型可以是原生数据类型或复杂数据类型。同一个MAP键的类型必须相同，值的类型也必须相同。 map(K <key1>, V <value1>

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
窗口关联 - 数据湖探索 DLI
窗口关联 - 数据湖探索 DLI

-------------+-------------------------+ ANTI 反窗口连接（Anti Window Join）是内窗口连接（Inner Window Join）的相反操作：它包含了每个公共窗口内所有未关联上的行。 Flink SQL> SELECT *

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
创建SQL作业模板 - 数据湖探索 DLI

输入模板名称、语句和描述信息，详细参数介绍请参见表1。图1 创建模板表1 参数说明参数名称描述名称模板名称。模板名称只能包含数字、英文字母和下划线，但不能是纯数字，不能以下划线开头，且不能为空。输入长度不能超过50个字符。语句需要保存为模板的SQL语句。描述该模板的相应描述。分组设置

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

源端作业配置，具体参考如下：表2 源端作业配置参数名参数值源连接名称选择1.a中已创建的数据源名称。使用SQL语句 “使用SQL语句”选择“是”时，您可以在这里输入自定义的SQL语句，CDM将根据该语句导出数据。本示例当前选择为“否”。模式或表空间 “使用SQL语句”选择“否”

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
弹性资源池计费 - 数据湖探索 DLI

弹性资源池计费弹性资源池计费模式弹性资源池为DLI作业运行提供计算资源。弹性资源池支持三种计费模式：包年包月：是预付费模式，按订单的购买周期计费。拥有专属的计算资源，空闲（无作业运行）时不会释放，使用体验更佳，价格比按需计费模式更优惠。适用于可预估资源使用周期的场景，例如

 帮助中心 > 数据湖探索 DLI > 计费说明
Flink Opensource SQL如何解析复杂嵌套 JSON？ - 数据湖探索 DLI

map：map['key'] - array：array[index] - row：row.key array 的起始下标从 1 开始，即 array[1] 是 array 的第一个元素。 array 的元素必须同类型，row 的元素可以不同类型。父主题： Flink SQL作业类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
类型转换函数 - 数据湖探索 DLI

TYPEOF(input) | TYPEOF(input, force_serializable) 返回输入表达式的数据类型的字符串表示形式。默认情况下返回的字符串是一个摘要字符串，可能会为了可读性而省略某些细节。如果 force_serializable 设置为 TRUE，则字符串表示可以保留在目录中的完整数据类型。请注意，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
开启或关闭数据多版本 - 数据湖探索 DLI

TBLPROPERTIES：取消表属性，关闭多版本功能。参数说明表1 参数描述参数描述 db_name Database名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以下划线开头。 table_name 表名称。注意事项 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 修改表
Spark SQL常用配置项说明 - 数据湖探索 DLI

当子查询中数据不重复的情况下，执行关联子查询，不需要对子查询的结果去重。当子查询中数据重复的情况下，执行关联子查询，会提示异常，必须对子查询的结果做去重处理，比如max(),min()。该参数设置为false：不管子查询中数据重复与否，执行关联子查询时，都需要对子查询的结果去重，比如max()

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

源端作业配置，具体参考如下：表2 源端作业配置参数名参数值源连接名称选择1.a中已创建的数据源名称。使用SQL语句 “使用SQL语句”选择“是”时，您可以在这里输入自定义的SQL语句，CDM将根据该语句导出数据。本示例当前选择为“否”。模式或表空间选择RDS MySQL待迁移

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。 CSS非安全集群开发说明代码实现详解 import相关依赖包 1 2 3 from __future__ import print_function from pyspark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS

总条数： 551

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

实时任务接入 - 数据湖探索 DLI

禁止或恢复表的生命周期 - 数据湖探索 DLI

GROUP BY - 数据湖探索 DLI

JOINS - 数据湖探索 DLI

Print结果表 - 数据湖探索 DLI

INSERT - 数据湖探索 DLI

Bitwise函数 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Data masking函数 - 数据湖探索 DLI

复杂数据类型 - 数据湖探索 DLI

窗口关联 - 数据湖探索 DLI

创建SQL作业模板 - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

弹性资源池计费 - 数据湖探索 DLI

Flink Opensource SQL如何解析复杂嵌套 JSON？ - 数据湖探索 DLI

类型转换函数 - 数据湖探索 DLI

开启或关闭数据多版本 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线