搜索_华为云

Python SDK - 数据湖探索 DLI
Python SDK - 数据湖探索 DLI

Python SDK Python SDK概述 Python SDK环境配置队列相关资源相关 SQL作业相关 Spark作业相关

 帮助中心 > 数据湖探索 DLI > SDK参考
Spark datasource API语法参考 - 数据湖探索 DLI

Spark datasource API语法参考 Spark jar作业提交方式请参考在DLI使用Hudi提交Spark Jar作业 API语法说明 Hudi锁配置说明

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
创建Hbase维表 - 数据湖探索 DLI
创建Hbase维表 - 数据湖探索 DLI

创建Hbase维表功能描述创建Hbase维表用于与输入流连接。前提条件该场景作业需要运行在DLI的独享队列上，因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

字符码不一致导致数据乱码怎么办？在DLI执行作业时，为了避免因字符编码不一致导致的乱码问题，建议您统一数据源的编码格式。 DLI服务只支持UTF-8文本格式，因此在执行创建表和导入操作时，用户的数据需要以UTF-8编码。在将数据导入DLI之前，确保源数据文件（如CSV、JSO

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
创建并使用跨源链接 - 数据湖探索 DLI

创建并使用跨源链接场景描述本章节指导用户通过API创建增强型跨源连接。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。创建增强型跨源连接之前需要获取需要建立连接的服务对应VPC的ID和其所在子网的网络ID。获取VPC的ID接口，具体请参考《虚拟私有云

 帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
current - 数据湖探索 DLI
current - 数据湖探索 DLI

current_date函数用于返回当前日期值。返回值格式为yyyy-mm-dd。相似函数：getdate，getdate函数用于返回当前系统时间。返回值格式为yyyy-mm-dd hh:mi:ss。命令格式 current_date() 参数说明无返回值说明返回DATE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
队列赋权（废弃） - 数据湖探索 DLI

是以下权限中的一种或多种。示例值：["DROP_QUEUE", "SUBMIT_JOB"]。 SUBMIT_JOB：提交作业 CANCEL_JOB ：取消作业 DROP_QUEUE ：删除队列 GRANT_PRIVILEGE：赋权 REVOKE_PRIVILEGE：权限回收 S

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

${table_name}_rt; 实时视图读取（Spark jar作业为例）：与COW表操作一致，请参考COW表相关操作。增量视图读取（Spark SQL作业为例）：与COW表操作一致，请参考COW表相关操作。增量视图读取（Spark jar作业为例）：与COW表操作一致，请参考COW表相关操作。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
产品规格 - 数据湖探索 DLI
产品规格 - 数据湖探索 DLI

产品规格弹性资源池产品规格弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存）。弹性资源池的单位为CU，1CU包含1CPU和4GB内存。您可以在弹性资源池中创建多个队列，队列之间的计算资源支持共享。通过合理设置队列的计算资源池分配策略，提高计算资源利用率。 DL

帮助中心 > 数据湖探索 DLI > 产品介绍
DLI资源 - 数据湖探索 DLI
DLI资源 - 数据湖探索 DLI

column DLI列 databases.dbname.tables.tbname.columns.colname jobs DLI Flink作业 jobs.flink.jobid resource DLI程序包 resources.resourcename group DLI程序包组

 帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
创建弹性资源池和队列 - 数据湖探索 DLI

创建弹性资源池和队列 DLI弹性资源池与队列简介创建弹性资源池并添加队列管理弹性资源池管理队列典型场景示例：创建弹性资源池并运行作业典型场景示例：配置弹性资源池队列扩缩容策略创建非弹性资源池队列（废弃，不推荐使用）

帮助中心 > 数据湖探索 DLI > 用户指南
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

e1 参考创建Flink OpenSource作业，创建flink opensource sql作业，输入以下作业脚本，提交运行作业。该作业脚本将Kafka为数据源，Redis作为维表，数据写入到Kafka结果表中。注意：创建作业时，在作业编辑界面的“运行参数”处，“Flink版本”选择“1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
DLI计算引擎版本生命周期 - 数据湖探索 DLI

擎。长期混用不同版本的Spark/Flink引擎会导致代码在新旧版本之间不兼容，影响作业的执行效率。当作业依赖于特定版本的库或组件，长期混用不同版本的Spark/Flink引擎可能会导致作业因依赖冲突而执行失败。计算引擎版本生命周期表1给出了DLI计算引擎版本生命周期，帮助您规划自己的版本更新节奏。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Spark 2.4.5版本说明 - 数据湖探索 DLI

支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释修改非分区表或分区表的列注释。支持统计SQL作业的CPU消耗支持在控制台查看“CPU累计使用量”。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
SHOW TABLE - 数据湖探索 DLI
SHOW TABLE - 数据湖探索 DLI

lTables 由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。系统响应可以直接在提交任务界面查看任务结果，或者在SQL作业界面，点击对应任务右侧的”更多”->”查看结果”检查任务结果。父主题： Hudi DDL语法说明

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
Hudi数据表Clean规范 - 数据湖探索 DLI

如果MOR表的下游是流式计算，例如Flink流读，可以按照业务需要保留小时级的历史版本，这样的话近几个小时之内的增量数据可以通过log文件读出，如果保留时长过短，下游flink作业在重启或者异常中断阻塞的情况下，上游增量数据已经Clean掉了，flink需要从parquet文件读增量数据，性能会有下降；如果保留时间过

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

Debezium JSON解析为 INSERT / UPDATE / DELETE 消息到 Flink SQL 系统中。在很多情况下，利用这个特性非常的有用，例如将增量数据从数据库同步到其他系统日志审计数据库的实时物化视图关联维度数据库的变更历史，等等。参数说明表1 参数是否必选

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Spark 3.3.1版本说明 - 数据湖探索 DLI

支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释修改非分区表或分区表的列注释。支持统计SQL作业的CPU消耗支持在控制台查看“CPU累计使用量”。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

02:10:58', 'update_user_10'); 参考创建Flink OpenSource作业，创建flink opensource sql作业，输入以下作业脚本，并提交运行。该作业模拟从kafka读取数据，并关联hive维表对数据进行打宽，并输出到print。如下脚本中的加粗参数请根据实际环境修改。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
状态码 - 数据湖探索 DLI
状态码 - 数据湖探索 DLI

请求要求代理的身份认证，与401类似，但请求者应当使用代理进行授权。 408 Request Time-out 服务器等候请求时发生超时。客户端可以随时再次提交该请求而无需进行任何更改。 409 Conflict 服务器在完成请求时发生冲突。返回该状态码，表明客户端尝试创建的资源已经存在

 帮助中心 > 数据湖探索 DLI > API参考 > 公共参数

总条数： 883

上一页
1
...
30
31
32
...
45
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Python SDK - 数据湖探索 DLI

Spark datasource API语法参考 - 数据湖探索 DLI

创建Hbase维表 - 数据湖探索 DLI

字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

创建并使用跨源链接 - 数据湖探索 DLI

current - 数据湖探索 DLI

队列赋权（废弃） - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

产品规格 - 数据湖探索 DLI

DLI资源 - 数据湖探索 DLI

创建弹性资源池和队列 - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

DLI计算引擎版本生命周期 - 数据湖探索 DLI

Spark 2.4.5版本说明 - 数据湖探索 DLI

SHOW TABLE - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

状态码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线