搜索_华为云

DLI SDK简介 - 数据湖探索 DLI
DLI SDK简介 - 数据湖探索 DLI

Spark作业。 DLI支持的SDK分为SDK V3和DLI服务自行开发的SDK。（推荐）DLI SDK V3：是根据定义API的YAML文件统一自动生成，其接口参数与服务的API一致。具体操作请参考SDK V3版本开发指南。 DLI SDK（服务自研）：是DLI服务自行开发的SDK，本手册介绍DLI

帮助中心 > 数据湖探索 DLI > SDK参考
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

range 0 = 0 to 479 while trying to read 143805 bytes 问题原因上述报错可能原因是当前导入的文件数据量较大，同时因为spark.sql.shuffle.partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。解决方案

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
Flink SQL作业类 - 数据湖探索 DLI

在Flink SQL作业中创建表使用EL表达式，作业运行提示DLI.0005错误怎么办？ Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 Flink SQL作业运行失败，日志中有connect to DIS failed java.lang.Il

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

aegg包所在的OBS路径。分组设置和分组名称根据情况选择。单击“确定”完成程序包上传。在报错的Spark作业编辑页面，“依赖python文件”处选择已上传的egg程序包，重新运行Spark作业。 pyspark作业对接MySQL，需要创建跨源链接，打通DLI和RDS之间的网络。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
FileSystem源表 - 数据湖探索 DLI
FileSystem源表 - 数据湖探索 DLI

connector 是无 String 固定位filesystem。 path 是无 String OBS路径。 format 是无 String 文件格式。支持csv、parquet格式。常见问题无父主题：创建源表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

PARSE_URL(string1, string2[, string3]) 从 URL 返回指定的部分。string2 的有效值包括“HOST”，“PATH”，“QUERY”，“REF”，“PROTOCOL”，“AUTHORITY”，“FILE”和“USERINFO”。如果有任一参数为

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

error message 该场景下就需要使用REFRESH TABLE来解决该问题。REFRESH TABLE是用于重新整理某个分区的文件，重用之前的表元数据信息，能够检测到表的字段的增加或者减少，主要用于表中元数据未修改，表的数据修改的场景。语法格式 1 REFRESH TABLE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
创建并提交SQL作业 - 数据湖探索 DLI

当前仅支持运行命令ANALYZE TABLE COMPUTE statistics noscan的配置单元存储表，和直接根据数据文件计算统计信息的基于文件的数据源表。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。 spark

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

'connector' = 'redis', 'host' = '' ); 参数说明表1 参数说明参数是否必选默认值数据类型说明 connector 是无 String connector类型，需配置为'redis'。 host 是无 String redis连接地址。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
数据迁移与传输方式概述 - 数据湖探索 DLI

LI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。具体操作请参考迁移外部数据源数据至DLI。图1 迁移数据至DLI

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

OVERWRITE、TRUNCATE TABLE）时是否清除相关数据： "auto.purge"='true'时，清除元数据和数据文件。 "auto.purge"='false'时，仅清除元数据，数据文件会移入OBS回收站。默认值为“false”，且不建议用户修改此属性，避免数据删除后无法恢复。 CREATE

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
创建Bucket索引表调优 - 数据湖探索 DLI

理：持续大量新增数据的维度表方法一：预留桶数，如使用非分区表则需通过预估较长一段时间内的数据增量来预先增加桶数，缺点是随着数据的增长，文件依然会持续膨胀；方法二：大粒度分区（推荐），如果使用分区表则需要根据数据增长情况来计算，例如使用年分区，这种方式相对麻烦些但是多年后表无需重新导入。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

format 是（none） String 指定使用格式，这里应该是'avro'。 avro.codec 否（none） String 仅用于文件系统，avro 压缩编解码器。默认不压缩。目前支持：deflate、snappy、bzip2、xz。数据类型映射目前，Avro schema

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
使用DataSource语法创建DLI表 - 数据湖探索 DLI

默认值 multiLevelDirEnable 否是否迭代查询子目录中的数据。当配置为true时，查询该表时会迭代读取该表路径中所有文件，包含子目录中的文件。 false compression 否指定压缩格式。一般为parquet格式时指定该参数，推荐使用'zstd'压缩格式。 -

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
DESCRIBE - 数据湖探索 DLI
DESCRIBE - 数据湖探索 DLI

createdAt 建表时间戳 lastModified 最后一次修改的时间戳 partitionColumns 分区列 numFiles 表的最新版本中的文件个数 sizeInBytes 表的最新快照的大小（以字节为单位） properties 为此表设置的所有属性 minReaderVersion

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误 - 数据湖探索 DLI

ObsException: OBSs servcie Error Message. Request Error: java.net.UnknownHostException: xxx: Name or service not known 问题根因第一次执行DLI SQL脚本，用户没有在D

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
Spark SQL常用配置项说明 - 数据湖探索 DLI

批作业SQL语法的常用配置项。表1 常用配置项名称默认值描述 spark.sql.files.maxRecordsPerFile 0 要写入单个文件的最大记录数。如果该值为零或为负，则没有限制。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

open、run、close和cancel函数。实现完成后将该类编译打在jar中，通过sql编辑页的UDF Jar上传。依赖的pom配置文件内容参考如下： <dependency> <groupId>org.apache.flink</groupId> <ar

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Upsert Kafka源表 - 数据湖探索 DLI

单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager.out文件查看结果日志。数据结果参考如下： +I(202103251202020001

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
DWS结果表（不推荐使用） - 数据湖探索 DLI

OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”或“jobmanager”的文件夹进入，下载获取taskmanager.out和jobmanager.out文件查看结果日志。验证跨源是否正确绑定且安全组规则已对该队列开放。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS

总条数： 347

上一页
1
...
12
13
14
...
18
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI SDK简介 - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

Flink SQL作业类 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

FileSystem源表 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

DESCRIBE - 数据湖探索 DLI

在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

Upsert Kafka源表 - 数据湖探索 DLI

DWS结果表（不推荐使用） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线