搜索_华为云

DLI常用跨源分析开发方式 - 数据湖探索 DLI

跨源分析当DLI有访问外部数据源的业务需求时，首先需要通过建立增强型跨源连接，打通DLI与数据源之间的网络，再开发不同的作业访问数据源以实现DLI跨源分析。本节操作介绍DLI支持的数据源对应的开发方式。使用须知 Flink作业访问DIS，OBS和SMN数据源，无需创建跨源连接，可以直接访问。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

kind：资源包类型，当前支持的包类型分别为： jar：用户jar文件 pyfile：用户Python文件 file：用户文件 modelfile：用户AI模型文件 obs_jar_paths：对应资源包的OBS路径，参数构成为：{bucketName}.{obs域名}/{jarPath}/{jarName}。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
MERGE INTO - 数据湖探索 DLI
MERGE INTO - 数据湖探索 DLI

tableIdentifier 在其中执行MergeInto操作的Hudi表的名称。 target_alias 目标表的别名。 sub_query 子查询。 source_alias 源表或源表达式的别名。 merge_condition 将源表或表达式和目标表关联起来的条件 condition 过滤条件，可选。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
SQL作业运行报错：DLI.0002 FileNotFoundException - 数据湖探索 DLI

0002: FileNotFoundException: getFileStatus on obs://xxx: status [404] 解决方案请排查在同一时间点是否还有另外作业对当前报错作业操作的表信息有删除操作。 DLI不允许同时有多个作业在同一时间点对相同表进行读写操作，否则会造成作业冲突，导致作业运行失败。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

（不使用Catalog的场景）：这里的sink表通过创建临时表指向Hudi表路径来写入数据，同时在表参数中配置hive_sync相关参数，实时同步元数据至由DLI提供的元数据服务。（具体参数详见Flink参数一节）请将作业中sink表的path参数修改为希望保存hudi表的obs路径。 --

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
Hive维表 - 数据湖探索 DLI
Hive维表 - 数据湖探索 DLI

15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。数据类型的使用，请参考Format章节。 Hive 方言支持的 DDL 语句，Flink 1.15 当前仅支持使用Hive语法创建OBS表和使用hive语法的DLI Lakehouse表。使用Hive语法创建OBS表 defalut方言：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

Flink Jar 作业使用固定AKSK访问OBS、Flink Jar 获取委托的临时AKSK、Flink SQL UDF 获取委托的临时AKSK场景。请参考Flink作业委托场景开发指导。 Flink 1.15 Jar 读取用户自定义配置文件的方式相比Flink 1.12存在差异。详细操作说明请参考使用Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
Flink作业概述 - 数据湖探索 DLI
Flink作业概述 - 数据湖探索 DLI

DLI允许用户提交编译为Jar包的Flink作业，提供了更高的灵活性和自定义能力，适合需要进行复杂数据处理的场景。当社区版Flink提供的Connector不能满足特定需求时，用户可以通过Jar作业来实现自定义的Connector或数据处理逻辑。适合需要实现UDF（用户定义函数）或特定库集成的场景，用

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

可以选择配置作业名称，便于识别和筛选。配置”应用程序”，路径指向上一步上传至OBS的Spark jar包。配置委托。选择提交DLI作业所需的委托。自定义委托请参考创建DLI自定义委托。配置”主类（--class）”，为上一步中所写的，包含需要执行的main函数的类的全名。在”Spark参数（--conf）

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
string_split - 数据湖探索 DLI
string_split - 数据湖探索 DLI

登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager.out文件查看结果日志。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数 > 表值函数
数学函数和运算符 - 数据湖探索 DLI

返回x的以2为底的对数 select log2(4);-- 2.0 log10(x) → double 返回x的以10为底的对数 select log10(1000);-- 3.0 log(b, x) → double 返回x的以b为底的对数 select log(3,81); -- 4.0 mod(n

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
SHOW_INVALID_PARQUET - 数据湖探索 DLI

show_invalid_parquet(path => 'obs://path/hudi_table/dt=2021-08-28'); 注意事项使用由DLI提供的元数据服务时，不支持本命令。权限需求由DLI提供的元数据服务 SQL权限： database table 无 SELECT 细粒

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
预览SQL作业查询结果 - 数据湖探索 DLI

预览SQL作业查询结果功能介绍该API用于在执行SQL查询语句的作业完成后，查看该作业执行的结果。目前仅支持查看“QUERY”类型作业的执行结果。该API只能查看前1000条的结果记录，且不支持分页查询。若要查看全部的结果记录，需要先导出查询结果再进行查看，详细请参见导出查询结果。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
Flink作业相关 - 数据湖探索 DLI
Flink作业相关 - 数据湖探索 DLI

SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化，参考队列相关完成队列创建等操作。新建SQL作业 DLI提供新建Flink SQL作业的接口。您可以使用该接口新建Flink SQL作业并提交到DLI，示例代码如下： 1 2

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

这两种采样方法都不允许限制结果集返回的行数。 BERNOULLI 每一行都将基于指定的采样率选择到采样表中。当使用Bernoulli方法对表进行采样时，将扫描表的所有物理块并跳过某些行（基于采样百分比和运行时计算的随机值之间的比较）。结果中包含一行的概率与任何其他行无关。这不会减少从磁盘读取采样表所需的时间。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
字符串函数概览 - 数据湖探索 DLI

查找字符串str1在以逗号（,）分隔的字符串str2中的位置，从1开始计数。 get_json_object get_json_object(string <json>, string <path>) STRING 根据所给路径对json对象进行解析，当json对象非法时将返回NULL。 instr

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
Flink作业推荐配置指导 - 数据湖探索 DLI

Flink作业推荐配置指导用户在创建Flink作业时，可以通过如下配置实现流应用的高可靠性能。用户在消息通知服务（SMN）中提前创建一个“主题”，并将其指定的邮箱或者手机号添加至主题订阅中。此时指定的邮箱或者手机会收到请求订阅的通知，单击链接确认订阅即可。图1 创建主题图2 添加订阅登录DLI控制台，创建Flink

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Json函数和运算符 - 数据湖探索 DLI

SQL中的行，位置比名称更重要。支持从BOOLEAN、TINYINT、SMALLINT、INTEGER、BIGINT、REAL、DOUBLE或VARCHAR进行转换。当数组的元素类型为支持的类型之一、Map的键类型是VARCHAR且Map的值类型是支持的类型之一或行的每个字段类

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
SparkSQL建表参数规范 - 数据湖探索 DLI

preCombineField 预合并键，相同主键的多条数据按该字段进行合并按需必须指定，相同主键的数据会按该字段合并，不能指定多个字段。禁止建表时将hoodie.datasource.hive_sync.enable指定为false。指定为false将导致新写入的分区无法同步到Hive Me

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

操作场景本节操作介绍创建Flink作业时，配置流应用实现高可靠性能的操作方法。操作步骤用户在消息通知服务（SMN）中提前创建一个“主题”，并将其指定的邮箱或者手机号添加至主题订阅中。此时指定的邮箱或者手机会收到请求订阅的通知，单击链接确认订阅即可。图1 创建主题图2 添加订阅

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发

总条数： 900

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI常用跨源分析开发方式 - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

MERGE INTO - 数据湖探索 DLI

SQL作业运行报错：DLI.0002 FileNotFoundException - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

Hive维表 - 数据湖探索 DLI

Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

Flink作业概述 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

string_split - 数据湖探索 DLI

数学函数和运算符 - 数据湖探索 DLI

SHOW_INVALID_PARQUET - 数据湖探索 DLI

预览SQL作业查询结果 - 数据湖探索 DLI

Flink作业相关 - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

字符串函数概览 - 数据湖探索 DLI

Flink作业推荐配置指导 - 数据湖探索 DLI

Json函数和运算符 - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线