搜索_华为云

Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

SDK使用说明。资源相关介绍上传资源包、查询所有资源包、查询制定资源包、删除资源包的Python SDK使用说明。 SQL作业相关介绍数据库相关、表相关、作业相关的Python SDK使用说明。 Spark作业相关介绍提交Spark作业、取消Spark作业、删除Spark作业等Python

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
lastday - 数据湖探索 DLI
lastday - 数据湖探索 DLI

lastday函数用于返回date所在月的最后一天，截取到天，时分秒部分为00:00:00。相似函数：last_day，last_day函数用于返回date所在月份的最后一天。返回值格式为：yyyy-mm-dd。命令格式 lastday(string date) 参数说明表1 参数说明参数是否必选

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
Flink Jar作业开发基础样例 - 数据湖探索 DLI

整个Flink环境。通过将非Connector的Flink依赖项（以flink-开头）和第三方库（如Hadoop、Hive、Hudi、Mysql-cdc）的作用域设置为provided，可以确保这些依赖项不会被包含在Jar作业中，从而实现最小化提交，避免依赖包与flink内核中依赖包冲突：

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
恢复多版本备份数据 - 数据湖探索 DLI

VERSION：指定版本号。具体的版本号可以通过SHOW HISTORY命令获取，详情请参考查看多版本备份数据。参数说明表1 参数说明参数描述 db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。 column 分区列名。 value

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

TABLES的输出schema从database: string变成了namespace: string。 Spark2.4.x：SHOW TABLES的输出schema是database: string。 Spark3.3.x： SHOW TABLES的输出schema从database: string变成了namespace:

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

heckpoint文件恢复内部状态和消费位点，保证数据不丢失及聚合算子等内部状态的精确一致语义。同时，为了保证数据不重复，建议使用带主键数据库或者文件系统作为目标数据源，否则下游处理业务需要加上去重逻辑（最新成功Checkpoint记录位点到异常时间段内的数据会重复消费）。图1

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
在Spark SQL作业中使用UDF - 数据湖探索 DLI

单击“确定”，完成创建程序包。创建UDF函数。登录DLI管理控制台，单击“SQL编辑器”，执行引擎选择“spark”，选择已创建的SQL队列和数据库。图11 选择队列和数据库在SQL编辑区域输入下列命令创建UDF函数，单击“执行”提交创建。 CREATE FUNCTION TestSumUDF AS

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
使用DLI分析账单消费数据 - 数据湖探索 DLI

在数据湖探索服务中创建表。登录DLI控制台，左侧导航栏单击“SQL编辑器”，执行引擎选择“spark”，选择执行的队列和数据库。本次演示队列和数据库选择“default”。下载的文件中包含时间用量等，按表头意义在DLI上创建表，具体可以参考如下示例，其中amount列为费用。

帮助中心 > 数据湖探索 DLI > 最佳实践
基本语句 - 数据湖探索 DLI
基本语句 - 数据湖探索 DLI

col_name_list]] [LIMIT number]; 关键字表1 SELECT关键字说明参数描述 ALL ALL关键字用于返回数据库所有匹配的行，包括重复的行。ALL关键字的后面只能跟*，否则执行语句会出错。 ALL是SQL语句的默认行为，通常不会被明确写出，如果不指定

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT
设置多版本备份数据保留周期 - 数据湖探索 DLI

TBLPROPERTIES：TBLPROPERTIES子句给表添加key/value的属性。参数说明表1 参数说明参数描述 db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。 days 多版本中备份数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
Doris结果表 - 数据湖探索 DLI
Doris结果表 - 数据湖探索 DLI

'fenodes' = 'FE_IP:PORT,FE_IP:PORT,FE_IP:PORT', 'table.identifier' = 'database.table', 'username' = 'dorisUsername', 'password' = 'dorisPassword'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
Connector列表 - 数据湖探索 DLI
Connector列表 - 数据湖探索 DLI

DataGen Doris DWS Elasticsearch 对象存储OBS Hbase Hive Hudi JDBC Kafka MySql CDC Print Redis Upsert Kafka 父主题： Flink Opensource SQL1.15语法参考

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

rownum <=1 | rownum < 2) [AND conditions] 参数说明： ROW_NUMBER()：为每一行分配一个唯一且连续的序号，从1开始。 PARTITION BY window_start, window_end [, col_key1...]：指定分区

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
查看多版本备份数据 - 数据湖探索 DLI

HISTORY FOR TABLE：查看备份数据。 PARTITION：指定分区列。参数说明表1 参数说明参数描述 db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。 column 分区列名。 value

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
string_split - 数据湖探索 DLI
string_split - 数据湖探索 DLI

说明 target STRING 待处理的目标字符串。说明：如果target为NULL，则返回一个空行。如果target包含两个或多个连续出现的分隔符时，则返回长度为零的空子字符串。如果target未包含指定分隔符，则返回目标字符串。 separator VARCHAR 指定的分隔符，当前仅支持单字符分隔。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数 > 表值函数
string_split - 数据湖探索 DLI
string_split - 数据湖探索 DLI

说明 target STRING 待处理的目标字符串。说明：如果target为NULL，则返回一个空行。如果target包含两个或多个连续出现的分隔符时，则返回长度为零的空子字符串。如果target未包含指定分隔符，则返回目标字符串。 separator VARCHAR 指定的分隔符，当前仅支持单字符分隔。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数 > 表值函数
查询资源实例列表 - 数据湖探索 DLI

dli_elastic_resource_pool：弹性资源池 dli_enhanced_datasource：增强型跨源连接 dli_database：数据库 dli_package_resource：资源包（不支持指定有Module ID的内置资源包） dli_flink_job：Flink作业

 帮助中心 > 数据湖探索 DLI > API参考 > 资源标签相关API
查询所有作业 - 数据湖探索 DLI

Integer 当前作业返回的结果总条数或insert作业插入的总条数。 database_name 否 String 记录其操作的表所在的数据库名称。类型为Import和Export作业才有“database_name”属性。 table_name 否 String 记录其操作的

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
创建Bucket索引表调优 - 数据湖探索 DLI

num.buckets=5 Flink index.type=BUCKET hoodie.bucket.index.num.buckets=5 判断使用分区表还是非分区表根据表的使用场景一般将表分为事实表和维度表：事实表通常整表数据规模较大，以新增数据为主，更新数据占比小，且更新数

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
数学运算函数 - 数据湖探索 DLI

double、real和float值存在一定的精度差。且我们不建议直接使用等号“=”对两个double类型数据进行比较。用户可以使用两个double类型相减，而后取绝对值的方式判断。当绝对值足够小时，认为两个double数值相等，例如: abs(0.9999999999 - 1.0000000000) < 0.000000001

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数

总条数： 687

上一页
1
...
16
17
18
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Python SDK概述 - 数据湖探索 DLI

lastday - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

恢复多版本备份数据 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

基本语句 - 数据湖探索 DLI

设置多版本备份数据保留周期 - 数据湖探索 DLI

Doris结果表 - 数据湖探索 DLI

Connector列表 - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

查看多版本备份数据 - 数据湖探索 DLI

string_split - 数据湖探索 DLI

string_split - 数据湖探索 DLI

查询资源实例列表 - 数据湖探索 DLI

查询所有作业 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

数学运算函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线