搜索_华为云

管理Spark作业模板 - 数据湖探索 DLI

管理Spark作业模板操作场景在创建Spark作业时，您可以在已有的Spark样例模板中进行修改，来实现实际的作业逻辑需求，节约编辑SQL语句的时间。当前云平台尚未提供预置的Spark模板，但支持用户自定义Spark作业模板，本节操作介绍在Spark管理页面创建Spark模板的操作方法。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

列和“队列CU时套餐包”计划于2024年3月31日 00:00（北京时间）停止销售（EOM）。 DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”计划于2025年6月30日 00:00（北京时间）下线（EOL）。影响 EOM后，不再支持新购队列资源，包括不支持

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

col2...]: 指定分区的列，例如去重的键。 ORDER BY time_attr [asc|desc]: 指定排序的列。所指定的列必须为时间属性。目前仅支持proctime。升序（ ASC ）排列指只保留第一行，而降序排列（ DESC ）则只保留最后一行。 WHERE rownum

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
管理Flink作业模板 - 数据湖探索 DLI

SQL作业模板 Flink OpenSource SQL作业模板描述模板的相关描述，且长度为0～512个字符。创建时间创建模板的时间。更新时间最后修改模板的时间。操作 “编辑”：对已经创建好的模板进行修改。 “创建作业”：直接在该模板下创建作业，创建完后，系统跳转到“作业管理”下的作业编辑页面。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
FileSystem结果表 - 数据湖探索 DLI

Formats默认的策略是根据Part文件大小进行滚动，需要指定文件打开状态最长时间的超时以及文件关闭后的非活动状态的超时时间。对于Bulk Formats在每次创建Checkpoint时进行滚动，并且用户也可以添加基于大小或者时间等的其他条件。在STREAMING模式下使用FileSink需

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
初始化DLI客户端 - 数据湖探索 DLI

钥”。根据提示输入对应信息，单击“确定”。在弹出的提示页面单击“立即下载”。下载成功后，打开凭证文件，获取AK/SK信息。左侧导航栏单击“API凭证”，在“项目列表”中获取“项目ID”即为project_id值，对应的“项目”即为region的值。 Token认证方式样例代码

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
Flink作业委托场景开发指导 - 数据湖探索 DLI

Flink作业委托场景开发指导 Flink Opensource SQL使用DEW管理访问凭据 Flink Jar 使用DEW获取访问凭证读写OBS 获取Flink作业委托临时凭证用于访问其他云服务父主题： Flink作业开发指南

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
取消批处理作业 - 数据湖探索 DLI

是否必选参数类型说明 project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。 batch_id 是 String 批处理作业的ID。具体为创建批处理作业中获取的作业ID。请求消息无请求参数。响应消息表2 响应参数参数名称是否必选参数类型

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
批量添加资源标签 - 数据湖探索 DLI

s/create 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。 resource_type 是 String 资源类型。 dli_queue：队列 dli_elastic_resource_pool：弹性资源池

 帮助中心 > 数据湖探索 DLI > API参考 > 资源标签相关API
Spark Jar作业开发指南 - 数据湖探索 DLI

Jar作业读取和查询OBS数据使用Spark作业访问DLI元数据使用Spark作业跨源访问数据源 Spark Jar 使用DEW获取访问凭证读写OBS 获取Spark作业委托临时凭证用于访问其他云服务

 帮助中心 > 数据湖探索 DLI > 开发指南
窗口关联 - 数据湖探索 DLI
窗口关联 - 数据湖探索 DLI

和相同滚动窗口的数据会被关联在一起。这里给出一个基于 TUMBLE Window TVF 的窗口连接的例子。在下面的例子中，通过将 join 的时间区域限定为固定的 5 分钟，数据集被分成两个不同的时间窗口：[12:00,12:05) 和 [12:05,12:10)。L2 和 R2 不能 join 在一起是因为它们不在一个窗口中。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

col2...]: 指定分区的列，例如去重的键。 ORDER BY time_attr [asc|desc]: 指定排序的列。所指定的列必须为时间属性。目前仅支持proctime。升序（ ASC ）排列指只保留第一行，而降序排列（ DESC ）则只保留最后一行。 WHERE rownum

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
开启或关闭数据多版本 - 数据湖探索 DLI

开启多版本功能后，在进行删除或修改表数据时（insert overwrite或者truncate操作），系统会自动备份历史数据并保留一定时间，后续您可以对保留周期内的数据进行快速恢复，避免因误操作丢失数据。其他多版本SQL语法请参考多版本备份恢复数据。 DLI数据多版本功能当前

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 修改表
去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

col2...]: 指定分区的列，例如去重的键。 ORDER BY time_attr [asc|desc]: 指定排序的列。所指定的列必须为时间属性。目前仅支持proctime。升序（ ASC ）排列指只保留第一行，而降序排列（ DESC ）则只保留最后一行。 WHERE rownum

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
批量删除资源标签 - 数据湖探索 DLI

s/delete 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。 resource_type 是 String 资源类型。 dli_queue：队列 dli_elastic_resource_pool：弹性资源池

 帮助中心 > 数据湖探索 DLI > API参考 > 资源标签相关API
取消作业（推荐） - 数据湖探索 DLI

是否必选参数类型说明 project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。 job_id 是 String 作业ID。可通过提交SQL作业（推荐）获取。请求消息无请求参数。响应消息表2 响应参数参数名称是否必选参数类型说明

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
对象存储OBS结果表 - 数据湖探索 DLI

Formats默认的策略是根据Part文件大小进行滚动，需要指定文件打开状态最长时间的超时以及文件关闭后的非活动状态的超时时间。对于Bulk Formats在每次创建Checkpoint时进行滚动，并且用户也可以添加基于大小或者时间等的其他条件。更多信息参考文件系统 SQL 连接器在STREA

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
查询指定资源实例的标签信息 - 数据湖探索 DLI

id}/tags 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。 resource_type 是 String 资源类型。 dli_queue：队列 dli_elastic_resource_pool：弹性资源池

 帮助中心 > 数据湖探索 DLI > API参考 > 资源标签相关API
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

或更高版本，推荐使用 Python 3.8 获取dli-dbt驱动包：单击dli-jdbc-x.x.x.jar获取JDBC驱动，驱动名称：huaweicloud-dli-jdbc-xxx-dependencies.jar。连接信息：表1 连接信息类别说明获取方式 DLI AKSK AK

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

在Kafka管理控制台，选择“Kafka专享版”，单击对应的Kafka名称，进入到Kafka的基本信息页面。在“连接信息”中获取该Kafka的“内网连接地址”，在“基本信息”的“网络”中获取获取该实例的“虚拟私有云”和“子网”信息，方便后续操作步骤使用。单击“网络”中的安全组名称，在“入方向规则”

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发

总条数： 627

上一页
1
...
16
17
18
...
32
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理Spark作业模板 - 数据湖探索 DLI

DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

去重 - 数据湖探索 DLI

管理Flink作业模板 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

Flink作业委托场景开发指导 - 数据湖探索 DLI

取消批处理作业 - 数据湖探索 DLI

批量添加资源标签 - 数据湖探索 DLI

Spark Jar作业开发指南 - 数据湖探索 DLI

窗口关联 - 数据湖探索 DLI

去重 - 数据湖探索 DLI

开启或关闭数据多版本 - 数据湖探索 DLI

去重 - 数据湖探索 DLI

批量删除资源标签 - 数据湖探索 DLI

取消作业（推荐） - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

查询指定资源实例的标签信息 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线