搜索_华为云

Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量（例如Spark初始化完成后，Flink消费Kafka时过滤掉2小时之前的数据），如果无法对kafka消息进行过滤，则可以考虑先实时接入生成offset，再truncate

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
TRUNCATE TABLE - 数据湖探索 DLI
TRUNCATE TABLE - 数据湖探索 DLI

TRUNCATE TABLE 语法 TRUNCATE TABLE table_name 描述从表或分区中移除所有行。当表属性“auto.purge”采用默认值“false”时，被删除的数据行将保存到文件系统的回收站，否则，当“auto.purge”设置为“true”时，数据行将被直接删除。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
cume - 数据湖探索 DLI
cume - 数据湖探索 DLI

是否必选说明 partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。返回值说明返回DOUBLE类型的值。 a为NULL，则返回NULL。示例代码为便于理解函数的使用方法，

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
upper/ucase - 数据湖探索 DLI
upper/ucase - 数据湖探索 DLI

是 STRING 待转换的文本字符串。返回值说明返回STRING类型。入参非 STRING、BIGINT、DOUBLE、DECIMAL 或 DATETIME 类型时，返回报错。入参值为NULL时，返回NULL。示例代码将字符串中的小写字符转换为大写字符。命令示例如下。返回ABC。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
Spark增量读取Hudi参数规范 - 数据湖探索 DLI

规则增量查询之前必须指定当前表的查询为增量查询模式，并且查询后重写设置表的查询模式如果增量查询完，不重新将表查询模式设置回去，将影响后续的实时查询示例以SQL作业为例：配置参数 hoodie.tableName.consume.mode=INCREMENTAL // 必须设置当前表读取为增量读取模式

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
导入数据（废弃） - 数据湖探索 DLI

长度范围为3到63个字符，支持小写字母、数字、中划线（-）、英文句号（.）。禁止两个英文句号（.）或英文句号（.）和中划线（-）相邻，禁止以英文句号（.）和中划线（-）开头或结尾。禁止使用IP地址。如果名称中包含英文句号（.），访问桶或对象时可能会进行安全证书校验。导入源文件时，如果源文件中的某一列与目标

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
弹性资源池标签管理 - 数据湖探索 DLI

但首尾不能含有空格，不能以_sys_开头。标签值您可以选择：在输入框的下拉列表中选择预定义标签值。在输入框中输入标签值。说明：标签值的最大长度为255个字符，标签的值可以包含任意语种字母、数字、空格和_ . : +-@ 。最多支持20个标签。一个“键”只能添加一个“值”。每个资源中的键名不能重复。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
使用DEW管理数据源访问凭证 - 数据湖探索 DLI

connector中设置账号、密码等属性。 Flink Jar 使用DEW获取访问凭证读写OBS 访问OBS的AKSK为例介绍Flink Jar使用DEW获取访问凭证读写OBS的操作指导。用户获取Flink作业委托临时凭证 DLI提供了一个通用接口，可用于获取用户在启动Flin

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

将写好的自定义函数打成JAR包，并上传到OBS上。在DLI管理控制台的左侧导航栏中，单击数据管理>“程序包管理”，然后单击创建，并使用OBS中的jar包创建相应的程序包。在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。在“运行参数设置”页签，“UDF

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
队列标签管理 - 数据湖探索 DLI

但首尾不能含有空格，不能以_sys_开头。标签值您可以选择：在输入框的下拉列表中选择预定义标签值。在输入框中输入标签值。说明：标签值的最大长度为255个字符，标签的值可以包含任意语种字母、数字、空格和_ . : +-@ 。最多支持20个标签。一个“键”只能添加一个“值”。每个资源中的键名不能重复。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
OBS表压缩率较高怎么办？ - 数据湖探索 DLI

可以通过调整配置来优化作业的性能。具体方法：在submit-job请求体conf字段中配置“dli.sql.files.maxPartitionBytes=33554432”。该配置项默认值为128MB，将其配置成32MB，可以减少单个任务读取的数据量，避免因过高的压缩比，导致解压后单个任务处理的数据量过大。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Lambda 表达式 - 数据湖探索 DLI
Lambda 表达式 - 数据湖探索 DLI

场景：不支持子查询 x -> 2 + (SELECT 3) 不支持聚合函数 x -> max(y) 示例通过transform()函数获取数组元素的平方： SELECT numbers, transform(numbers, n -> n * n) as squared_numbers

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

VAR_SAMP() 的同义方法。 RANK() 返回值在一组值中的排名。结果是 1 加上分区顺序中当前行之前或等于当前行的行数。排名在序列中不一定连续。 DENSE_RANK() 返回值在一组值中的排名。结果是一加先前分配的等级值。与函数 rank 不同，dense_rank 不会在排名序列中产生间隙。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
Hudi数据表Compaction规范 - 数据湖探索 DLI

pu也要保证CPU与内存的比例）。 Hudi表采用异步Compaction。为了保证流式入库作业的稳定运行，就需要保证流式作业不在实时入库的过程中做其它任务，比如Flink写Hudi的同时会做Compaction。这看似是一个不错的方案，即完成了入库又完成Compaction。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Flink jobmanager日志一直报Timeout expired while fetching topic metadata怎么办？ - 数据湖探索 DLI

JobManager提示 "Timeout expired while fetching topic metadata" ，说明Flink作业在尝试获取Kafka主题的元数据时超时了。此时您需要先检查Flink作业和Kafka的网络连通性，确保执行Flink作业所在的队列可以访问Kafka所在的VPC网络。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
lag - 数据湖探索 DLI
lag - 数据湖探索 DLI

偏移量，BIGINT类型常量，取值大于等于0。值为0时表示当前行，为1时表示前一行，以此类推。默认值为1。输入值为STRING类型、DOUBLE类型则隐式转换为BIGINT类型后进行运算。 default 是常量，默认值为NULL。当offset指定的范围越界时的缺省值，需要与expr对应的数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
row - 数据湖探索 DLI
row - 数据湖探索 DLI

是否必选说明 partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。返回值说明返回DOUBLE类型的值。 a为NULL，则返回NULL。示例代码为便于理解函数的使用方法，

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

x.x.jar获取JDBC驱动，驱动名称：huaweicloud-dli-jdbc-xxx-dependencies.jar。连接信息：表1 连接信息类别说明获取方式 DLI AKSK AK/SK认证就是使用AK/SK对请求进行签名，从而通过身份认证。获取AK/SK DLI

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

这两种采样方法都不允许限制结果集返回的行数。 BERNOULLI 每一行都将基于指定的采样率选择到采样表中。当使用Bernoulli方法对表进行采样时，将扫描表的所有物理块并跳过某些行（基于采样百分比和运行时计算的随机值之间的比较）。结果中包含一行的概率与任何其他行无关。这不会减少从磁盘读取采样表所需的时间。如

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

将写好的自定义函数打成JAR包，并上传到OBS上。在DLI管理控制台的左侧导航栏中，单击数据管理>“程序包管理”，然后单击创建，并使用OBS中的jar包创建相应的程序包。在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。在“运行参数设置”页签，“UDF

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数

总条数： 646

上一页
1
...
7
8
9
...
33
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表初始化 - 数据湖探索 DLI

TRUNCATE TABLE - 数据湖探索 DLI

cume - 数据湖探索 DLI

upper/ucase - 数据湖探索 DLI

Spark增量读取Hudi参数规范 - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

弹性资源池标签管理 - 数据湖探索 DLI

使用DEW管理数据源访问凭证 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

队列标签管理 - 数据湖探索 DLI

OBS表压缩率较高怎么办？ - 数据湖探索 DLI

Lambda 表达式 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

Flink jobmanager日志一直报Timeout expired while fetching topic metadata怎么办？ - 数据湖探索 DLI

lag - 数据湖探索 DLI

row - 数据湖探索 DLI

配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线