搜索_华为云

Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

table，则会导致批量数据写成非常大的log文件，对后续compaction形成很大压力需要更多资源才能完成。 Hudi表在Hive元数据中，应该会存在1张内部表（手动创建），2张外部表（写入数据后自动创建）。 2张外部表，表名_ro（用户只读合并后的parquet文件，即读优化

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Flink SQL作业运行失败，日志中有connect to DIS failed java.lang.IllegalArgumentException: Access key cannot be null错误 - 数据湖探索 DLI

行作业的IAM用户名。单击查询到用户名，查看该用户对应的用户组。单击“用户组”，输入查询到的用户组查询，单击用户组名称，在“授权记录”中查看当前用户的权限。确认当前用户所属用户组下的权限是否包含OBS写入的权限，比如“OBS OperateAccess”。如果没有OBS写入权限，则给对应的用户组进行授权。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
删除表后再重新创建同名的表，需要对操作该表的用户和项目重新赋权吗？ - 数据湖探索 DLI

在管理控制台左侧，单击“数据管理”>“库表管理”。单击需要设置权限的表所在的数据库名，进入该数据库的“表管理”页面。单击所选表“操作”栏中的“权限管理”，将显示该表对应的权限信息。单击表权限管理页面右上角的“授权”按钮。在弹出的“授权”对话框中选择相应的权限。单击“确定”，完成表权限设置。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Spark 3.1.1版本说明 - 数据湖探索 DLI

hash join优化。【SPARK-32272】：添加SQL标准命令SET TIME ZONE。【SPARK-21492】：修复排序合并加入中的内存泄漏。【SPARK-27812】：K8S客户端版本提升到4.6.1。 DLI从Spark 3.x版本开始不支持内置地理空间查询函数。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

、是不是外表（external）等。 LIKE子句用于在新表中包含来自现有表的所有列定义。可以指定多个LIKE子句，从而允许从多个表中复制列。如果指定了INCLUDING PROPERTIES，则将所有表属性复制到新表中。如果WITH子句指定的属性名称与复制的属性名称相同，则将使

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
datediff - 数据湖探索 DLI
datediff - 数据湖探索 DLI

参数说明表1 参数说明参数是否必选参数类型说明 date1 是 DATE 或 STRING 计算两个时间date1、date2的日期差值中的被减数。格式为： yyyy-mm-dd yyyy-mm-dd hh:mi:ss yyyy-mm-dd hh:mi:ss.ff3 date2

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

groupid 否 BIGINT BIGINT类型常量，必须大于等于0。返回值说明返回STRING类型。如果pattern为空串或pattern中没有分组，返回报错。 groupid非BIGINT类型或小于0时，返回报错。不指定时默认为1，表示返回第一个组。如果groupid等于0，则返回满足整个pattern的子串。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
DLI Delta表概述 - 数据湖探索 DLI

Spark API完全兼容，并且其设计能够与结构化流式处理紧密集成，可以轻松地将单个数据副本用于批处理和流式处理操作，并提供大规模增量处理。 DLI中Delta的使用限制仅Spark 3.3.1（3.0.0）及以上版本支持Delta。 DLI支持的Delta版本是Delta 2.3.0。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

db_name Database名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以下划线开头。 table_name 表名称。Database中的表名，由字母、数字和下划线（_）组成。不能是纯数字，且不能以下划线开头。匹配规则为：^(?!_)(?![0-9]+$)[A-Za-z0-9

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
keyvalue - 数据湖探索 DLI
keyvalue - 数据湖探索 DLI

STRING 待拆分的字符串。 split1、split2 否 STRING 用于作为分隔符的字符串，按照指定的两个分隔符拆分源字符串。如果表达式中没有指定这两项，默认split1为";"，split2为":"。当某个被split1拆分后的字符串中有多个split2时，返回结果未定义。 key

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
（推荐）DLI SDK V3 - 数据湖探索 DLI

在线生成SDK代码【样例】 API Explorer能根据需要动态生成SDK代码功能，降低您使用SDK的难度，推荐使用。您可以在API Explorer中具体API页面的“代码示例”页签查看对应编程语言类型的SDK代码。如图1所示。图1 获取SDK代码示例

 帮助中心 > 数据湖探索 DLI > SDK参考
函数概览 - 数据湖探索 DLI
函数概览 - 数据湖探索 DLI

<col3>) as (<key1>,<key2>,...,<col1>, <col2>) 参数的数据类型将一行数据转为多行的UDTF，将列中存储的以固定分隔符格式分隔的数组转为多行。 trunc_numeric trunc_numeric(<number>[, bigint<decimal_places>])

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 其他函数
SparkSQL建表参数规范 - 数据湖探索 DLI

datasource.hive_sync.enable指定为false。指定为false将导致新写入的分区无法同步到Hive Metastore中。由于缺失新写入的分区信息，查询引擎读取该时会丢数。禁止指定Hudi的索引类型为INMEMORY类型。该索引仅是为了测试使用。生产环境上使用该索引将导致数据重复。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

RichParallelSourceFunction<Row>{}，重点实现其中的open、run、close和cancel函数。实现完成后将该类编译打在jar中，通过sql编辑页的UDF Jar上传。依赖的pom配置文件内容参考如下： <dependency> <groupId>org.apache

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
资产识别与管理 - 数据湖探索 DLI

签分析该部门的开发使用成本。 DLI以键值对的形式描述标签。一个队列默认20个标签。每个标签有且只有一对键值。键和值可以任意顺序出现在标签中。同一个集群标签的键不能重复，但是值可以重复，并且可以为空。使用方式 DLI支持通过控制台方式创建队列和数据库标签，详情请参见队列标签管理。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
创建DLI表关联OpenTSDB - 数据湖探索 DLI

点IP与端口，格式为"IP:PORT"，OpenTSDB存在多个节点时，用分号间隔。 metric 所创建的DLI表对应的OpenTSDB中的指标名称。 tags metric对应的标签，用于归类、过滤、快速检索等操作。可以是1个到8个，以“,”分隔，包括对应metric下所有tagk的值。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接OpenTSDB表
ALTER VIEW - 数据湖探索 DLI
ALTER VIEW - 数据湖探索 DLI

REPLACE VIEW类似。 “ALTER VIEW view_name SET TBLPROPERTIES table_properties;”中table_properties格式为 (property_name = property_value, property_name = property_value

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
导出查询结果 - 数据湖探索 DLI

ions参数可以参考表3。注意事项通过配置“spark.sql.shuffle.partitions”参数可以设置非DLI表在OBS桶中插入的文件个数，同时，为了避免数据倾斜，在INSERT语句后可加上“distribute by rand()”，可以增加处理作业的并发量。例如：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
SHOW_LOG_FILE - 数据湖探索 DLI
SHOW_LOG_FILE - 数据湖探索 DLI

file的路径，支持正则匹配否 merge 执行show_logfile_records时，通过merge控制是否将多个log file中的record合并在一起返回否 limit 限制返回结果的条数否示例 call show_logfile_metadata(table

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
最佳实践内容概览 - 数据湖探索 DLI

BI连接DLI的操作步骤。配置PowerBI通过Kyuubi连接DLI进行数据查询和分析介绍PowerBI基于Kyuubi连接DLI，以访问和分析DLI中的数据的操作步骤。配置Fine BI通过Kyuubi连接DLI进行数据查询和分析介绍Fine BI基于Kyuubi连接DLI的操作步骤。

帮助中心 > 数据湖探索 DLI > 最佳实践

总条数： 939

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表初始化 - 数据湖探索 DLI

Flink SQL作业运行失败，日志中有connect to DIS failed java.lang.IllegalArgumentException: Access key cannot be null错误 - 数据湖探索 DLI

删除表后再重新创建同名的表，需要对操作该表的用户和项目重新赋权吗？ - 数据湖探索 DLI

Spark 3.1.1版本说明 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

datediff - 数据湖探索 DLI

regexp - 数据湖探索 DLI

DLI Delta表概述 - 数据湖探索 DLI

REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

keyvalue - 数据湖探索 DLI

（推荐）DLI SDK V3 - 数据湖探索 DLI

函数概览 - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

资产识别与管理 - 数据湖探索 DLI

创建DLI表关联OpenTSDB - 数据湖探索 DLI

ALTER VIEW - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

SHOW_LOG_FILE - 数据湖探索 DLI

最佳实践内容概览 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线