搜索_华为云

Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

当发生故障时，Debezium应用只能保证at-least-once的投递语义。即在非正常情况下，Debezium可能会投递重复的变更事件到Kafka中，当Flink从Kafka中消费的时候就会得到重复的事件。这可能会导致Flink query的运行得到错误的结果或者非预期的异常。解决方案：将作业参数 table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
在Spark SQL作业中使用UDF - 数据湖探索 DLI

上传Jar包到OBS OBS控制台将生成的UDF函数Jar包文件上传到OBS目录下。 5 创建DLI的UDF函数 DLI控制台在DLI控制台的SQL作业管理界面创建使用的UDF函数。 6 验证和使用DLI的UDF函数 DLI控制台在DLI作业中使用创建的UDF函数。操作步骤新建M

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
（推荐）DLI SDK V3 - 数据湖探索 DLI

（推荐）DLI SDK V3 写作说明本文介绍了DLI服务提供的V3版本的SDK，列举了最新版本SDK的获取地址。 SDK列表表1提供了DLI云服务支持的SDK列表，您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。表1 SDK列表编程语言 Github地址

 帮助中心 > 数据湖探索 DLI > SDK参考
Flink作业相关API - 数据湖探索 DLI

批量运行作业查询作业列表查询作业详情查询作业执行计划批量停止作业删除作业批量删除作业导出Flink作业导入Flink作业生成Flink SQL作业的静态流图

 帮助中心 > 数据湖探索 DLI > API参考
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

为每个Reader设置不同的Server ID 每个用于读取Binlog的MySQL客户端都应该有一个唯一的Server ID，确保MySQL服务器能够区分不同的客户端并维护各自的Binlog读取位置。如果不同的作业共享相同的Server ID，可能会导致从错误的Binlog位置读取数据，从而引发数据不一致的问题。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Hudi表索引设计规范 - 数据湖探索 DLI

基于简化使用的角度，针对大数据量的表，可以通过采用Bucket索引来避免状态后端的复杂调优。如果Bucket索引+分区表的模式无法平衡Bueckt桶过大的问题，还是可以继续采用Flink状态索引，按照规范去优化对应的配置参数即可。建议基于Flink的流式写入的表，在数据量超

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

上传Jar包到OBS OBS控制台将生成的UDTF函数Jar包文件上传到OBS目录下。 5 创建DLI的UDTF函数 DLI控制台在DLI控制台的SQL作业管理界面创建使用的UDTF函数。 6 验证和使用DLI的UDTF函数 DLI控制台在DLI作业中使用创建的UDTF函数。操作步骤

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

SETS 的 GROUP BY 子句可以生成一个等效于由多个简单 GROUP BY 子句的 UNION ALL 生成的结果集，并且其效率比 GROUP BY 要高。 ROLLUP与CUBE按一定的规则产生多种分组，然后按各种分组统计数据。 CUBE生成的结果集显示了所选列中值的所有组合的聚合。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

SETS 的 GROUP BY 子句可以生成一个等效于由多个简单 GROUP BY 子句的 UNION ALL 生成的结果集，并且其效率比 GROUP BY 要高。 ROLLUP与CUBE按一定的规则产生多种分组，然后按各种分组统计数据。 CUBE生成的结果集显示了所选列中值的所有组合的聚合。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
算术函数 - 数据湖探索 DLI
算术函数 - 数据湖探索 DLI

SQRT(numeric) 返回 numeric 的平方根。 LN(numeric) 返回 numeric 的自然对数（以 e 为底）。 LOG10(numeric) 返回以 10 为底的 numeric 的对数。 LOG2(numeric) 返回以 2 为底的 numeric 的对数。 LOG(numeric2)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
创建队列 - 数据湖探索 DLI
创建队列 - 数据湖探索 DLI

String 标签的键。说明：标签的键的最大长度为128个字符，标签的键可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格，不能以_sys_开头。 value 是 String 标签的值。说明：标签值的最大长度为255个字符，标签的值可以包含任意语种字母、数字、空格和_

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
Elasticsearch结果表 - 数据湖探索 DLI

key-delimiter”参数指定的键分隔符按照DDL中定义的顺序连接所有主键字段，从而为每一行生成一个文档ID字符串。某些类型（例如BYTES、ROW、ARRAY和MAP等）由于没有对应的字符串表示形式，所以不允许其作为主键字段。如果未指定主键，Elasticsearch将自动生成随机的文档ID。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
在Flink SQL作业中创建表使用EL表达式，作业运行提示DLI.0005错误怎么办？ - 数据湖探索 DLI

contain alphabet characters, numbers and _. 解决方案需要将SQL中表名的“#”字符改成“$”即可。DLI中使用EL表达式的格式为：${expr}。修改前： t_user_message_input_#{date_format(date_sub(current_date()

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

上传Jar包到OBS OBS控制台将生成的UDAF函数Jar包文件上传到OBS目录下。 5 创建DLI程序包 DLI控制台选择刚上传到OBS的UDAF函数的Jar文件，由DLI进行纳管。 6 创建DLI的UDAF函数 DLI控制台在DLI控制台的SQL作业管理界面创建使用的UDAF函数。 7 验证和使用DLI的UDAF函数

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
原生数据类型 - 数据湖探索 DLI

计算值默认值为0。由于浮点类型的数据在计算机中的存储方式的限制，在比较两个浮点类型的数据是否相等时，因存在精度问题，不能直接采用“a==b”的方式进行比较，建议使用“(a-b)的绝对值<=EPSILON”这种方式进行比较，EPSILON为允许的误差范围，一般为1.1920929

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
查询OpenTSDB表 - 数据湖探索 DLI
查询OpenTSDB表 - 数据湖探索 DLI

number; 关键字 LIMIT：对查询结果进行限制，number参数仅支持INT类型。注意事项所查询的表必须是已经存在的表，否则会出错。示例查询表opentsdb_table中的数据。 1 SELECT * FROM opentsdb_table limit 100; 父主题：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接OpenTSDB表
查询所有队列 - 数据湖探索 DLI

创建队列的用户。 create_time 否 Long 创建队列的时间。单位为“毫秒”的时间戳。 queue_type 否 String 队列的类型,。 sql general all 如果不指定，默认为“sql”。 cu_count 否 Integer 与该队列绑定的计算单元数，即当前队列的CU数。

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
Print结果表 - 数据湖探索 DLI
Print结果表 - 数据湖探索 DLI

登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager.out文件查看结果日志。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量（例如Spark初始化完成后，Flink消费Kafka时过滤掉2小时之前的数据），如果无法对kafka消息进行过滤，则可以考虑先实时接入生成offset，再truncate

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
导入数据（废弃） - 数据湖探索 DLI

不配置表示动态导入整表数据，导入的数据需要包含分区列的数据；如果导入时，配置所有分区信息，则表示导入数据到指定分区，导入的数据不能包含分区列的数据；如果导入时，配置了部分分区信息，而导入的数据必须包含非指定的分区数据，不能包含指定的分区数据，否则数据导入后，非指定的数据分区字段列会存在null值等异常值。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）

总条数： 196

上一页
1
...
4
5
6
...
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Debezium Format - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

（推荐）DLI SDK V3 - 数据湖探索 DLI

Flink作业相关API - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

算术函数 - 数据湖探索 DLI

创建队列 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

在Flink SQL作业中创建表使用EL表达式，作业运行提示DLI.0005错误怎么办？ - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

原生数据类型 - 数据湖探索 DLI

查询OpenTSDB表 - 数据湖探索 DLI

查询所有队列 - 数据湖探索 DLI

Print结果表 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线