搜索_华为云

last - 数据湖探索 DLI
last - 数据湖探索 DLI

([partition_clause] [orderby_clause] [frame_clause]) 参数说明表1 参数说明参数是否必选说明 expr 是待计算返回结果的表达式。 ignore_nulls 否 BOOLEAN类型，表示是否忽略NULL值。默认值为False。当参数的值为Tr

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

使用DLI查询数据前，需要将数据文件上传至OBS中。步骤2：创建弹性资源池并添加队列创建提交作业所需的计算资源。步骤3：创建数据库 DLI元数据是SQL作业开发的基础。在执行作业前您需要根据业务场景定义数据库和表。步骤4：创建表数据库创建完成后，需要在数据库db1中基于OBS上的样本数据创建表。

帮助中心 > 数据湖探索 DLI > 快速入门
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

开发流程说明序号阶段操作界面说明 1 创建DLI通用队列 DLI控制台创建作业运行的DLI队列。 2 OBS桶文件配置 OBS控制台如果是创建OBS表，则需要上传文件数据到OBS桶下。配置Spark创建表的元数据信息的存储路径。该文件夹路径用来存储Spark创建表的元数据信息“spark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Spark SQL常用配置项说明 - 数据湖探索 DLI

expandThreshold - 参数说明：对于包含count(distinct)的多维分析（with cube）的查询场景，spark典型的执行计划是将cube使用expand算子来实现，但该操作会导致查询膨胀，为了避免出现查询膨胀，建议执行如下配置： spark.sql.keep.distinct

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
创建Kerberos跨源认证 - 数据湖探索 DLI

参数说明参数参数说明类型选择kerberos。认证信息名称所创建的跨源认证信息名称。名称只能包含数字、英文字母和下划线，但不能是纯数字，且不能以下划线开头。输入长度不能超过128个字符。建议名称中包含MRS安全集群的名称，便于区分不同集群的安全认证信息。用户名安全集群的登录用户名。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
查看Flink作业详情 - 数据湖探索 DLI

操作编辑：编辑已经创建好的作业。启动：启动作业并运行。更多 FlinkUI：单击后，将跳转至Flink任务运行情况界面。说明：如果是新建队列，在该队列提交作业后，如果立即单击FlinkUI，因为后台大约需要10分钟创建集群，会导致缓存空的projectID，从而导致无法查看FlinkUI。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
管理DLI全局变量 - 数据湖探索 DLI

管理DLI全局变量什么是全局变量 DLI支持在管理控制台设置全局变量，将作业开发过程中频繁使用的变量设置为全局变量，可以避免在编辑作业过程中重复定义，减少开发与维护成本。通过使用全局变量可以替换长难复杂变量，简化复杂参数，提升SQL语句可读性。本节操作为您介绍如何创建全局变量。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
创建Kafka_SSL类型跨源认证 - 数据湖探索 DLI

参数说明参数参数说明类型选择Kafka_SSL。认证信息名称所创建的跨源认证信息名称。名称只能包含数字、英文字母和下划线，但不能是纯数字，且不能以下划线开头。输入长度不能超过128个字符。 Truststore路径上传SSL Truststore文件的OBS路径。 MRS

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
类型转换函数 - 数据湖探索 DLI

TYPEOF(input) | TYPEOF(input, force_serializable) 返回输入表达式的数据类型的字符串表示形式。默认情况下返回的字符串是一个摘要字符串，可能会为了可读性而省略某些细节。如果 force_serializable 设置为 TRUE，则字符串表示可以保留在目录中的完整数据类型。请注意，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

即可自动关联出来Elasticsearch服务器列表。安全模式认证如果所需连接的CSS集群在创建时开启了“安全模式”，该参数需设置为“是”，否则设置为“否”。本示例选择为“否”。图2 CDM配置CSS数据源单击“保存”完成CSS数据源配置。配置目的端DLI的数据源连接。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
迁移Elasticsearch数据至DLI - 数据湖探索 DLI

即可自动关联出来Elasticsearch服务器列表。安全模式认证如果所需连接的CSS集群在创建时开启了“安全模式”，该参数需设置为“是”，否则设置为“否”。本示例选择为“否”。图2 CDM配置CSS数据源单击“保存”完成CSS数据源配置。配置目的端DLI的数据源连接。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据迁移
从Kafka读取数据写入到RDS - 数据湖探索 DLI

例选择“按需计费”。区域和项目：保持默认值即可。名称：填写具体的队列名称。新建的队列名称，名称只能包含数字、英文字母和下划线，但不能是纯数字，且不能以下划线开头。长度限制：1~128个字符。队列名称不区分大小写，系统会自动转换为小写。类型：队列类型选择“通用队列”。“按需计费”时需要勾选“专属资源模式”。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink OpenSource SQL作业开发指南
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

CSS的下压功能是否开启，默认为“true”。包含大量IO传输的表在有where过滤条件的情况下能够开启pushdown降低IO。 strict CSS的下压是否是严格的，默认为“false”。精确匹配的场景下比pushdown降低更多IO。 batch.size.entries 单次batch插入en

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
迁移RDS数据至DLI - 数据湖探索 DLI

源端作业配置，具体参考如下：表2 源端作业配置参数名参数值源连接名称选择1.a中已创建的数据源名称。使用SQL语句 “使用SQL语句”选择“是”时，您可以在这里输入自定义的SQL语句，CDM将根据该语句导出数据。本示例当前选择为“否”。模式或表空间选择RDS MySQL待迁移

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据迁移
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

考创建程序包。访问元数据是否通过Spark作业访问元数据。具体请参考《数据湖探索开发指南》是否重试作业失败后是否进行重试。选择“是”需要配置以下参数： “最大重试次数”：设置作业失败重试次数，最大值为“100”。高级配置暂不配置现在配置：包括以下两项参数选择依赖资源：具体参数请参考表3。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
复杂数据类型 - 数据湖探索 DLI

<value>[, ...]) 具体使用示例详见：ARRAY示例。 MAP 一组无序的键/值对，使用给定的Key和Value对生成MAP。键的类型必须是原生数据类型，值的类型可以是原生数据类型或复杂数据类型。同一个MAP键的类型必须相同，值的类型也必须相同。 map(K <key1>, V <value1>

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 数据类型
复杂数据类型 - 数据湖探索 DLI

<value>[, ...]) 具体使用示例详见：ARRAY示例。 MAP 一组无序的键/值对，使用给定的Key和Value对生成MAP。键的类型必须是原生数据类型，值的类型可以是原生数据类型或复杂数据类型。同一个MAP键的类型必须相同，值的类型也必须相同。 map(K <key1>, V <value1>

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
DLI委托概述 - 数据湖探索 DLI
DLI委托概述 - 数据湖探索 DLI

DLI委托概述什么是委托？各云服务之间存在业务交互关系，一些云服务需要与其他云服务协同工作，需要您创建云服务委托，将操作权限委托给DLI服务，让DLI服务以您的身份使用其他云服务，代替您进行一些资源运维工作。例如：在DLI新建Flink作业所需的AKSK存储在数据加密服务D

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

源端作业配置，具体参考如下：表2 源端作业配置参数名参数值源连接名称选择1.a中已创建的数据源名称。使用SQL语句 “使用SQL语句”选择“是”时，您可以在这里输入自定义的SQL语句，CDM将根据该语句导出数据。本示例当前选择为“否”。模式或表空间选择RDS MySQL待迁移

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

跨源表不支持Preview预览功能。检测跨源连接的连通性时对IP约束限制如下： IP必须为合法的IP地址，用“.”分隔的4个十进制数，范围是0-255。测试时IP地址后可选择添加端口，用":"隔开，端口最大限制5位，端口范围：0~65535。例如192.168.xx.xx或者192

帮助中心 > 数据湖探索 DLI > 产品介绍

总条数： 1092

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

last - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

创建Kerberos跨源认证 - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

管理DLI全局变量 - 数据湖探索 DLI

创建Kafka_SSL类型跨源认证 - 数据湖探索 DLI

类型转换函数 - 数据湖探索 DLI

典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

迁移Elasticsearch数据至DLI - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

迁移RDS数据至DLI - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

复杂数据类型 - 数据湖探索 DLI

复杂数据类型 - 数据湖探索 DLI

DLI委托概述 - 数据湖探索 DLI

典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线