搜索_华为云

查询SQL作业日志 - 数据湖探索 DLI

DLI作业要由用户主账户统一设置及修改，子用户无权限。不配置DLI作业桶无法查看作业日志。您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。前提条件配置前，请先购买OBS桶或并行文件系统

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
使用DataSource语法创建DLI表 - 数据湖探索 DLI

示例3：使用CTAS将源表的全部数据或部分数据创建新的DLI表示例说明：根据示例1：创建DLI非分区表中创建的DLI表table1，使用CTAS语法将table1中的数据复制到table1_ctas表中。在使用CTAS建表的时候，可以忽略被复制的表在建表时所使用的语法，即不论在创建t

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
查询Spark作业日志 - 数据湖探索 DLI

您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。 Spark日志分割规则：按大小分割：默认情况下，每个日志文件最大为128MB。按时间分割：每过一小时自动创建新的日志文件。前提条件

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
VACUUM - 数据湖探索 DLI
VACUUM - 数据湖探索 DLI

Delta 管理的所有文件，并删除不再处于表事务日志最新状态且超过保留期阈值的数据文件。默认阈值为 7 天。注意事项 RETAIN num HOURS表示保留期阈值，建议设置为至少 7 天。如果对 Delta 表运行VACUUM，则将无法再回头查看在指定数据保留期之前创建的版本。 Delta

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
Spark 3.3.1版本说明 - 数据湖探索 DLI

提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
RESTORE - 数据湖探索 DLI
RESTORE - 数据湖探索 DLI

SSS' version_code 1.3.1中查询结果中的版本号所需权限 SQL权限表2 RESTORE所需权限列表权限描述表的UPDATE权限细粒度权限：dli:table:update。由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
CLEANARCHIVE - 数据湖探索 DLI
CLEANARCHIVE - 数据湖探索 DLI

表1 参数描述参数描述 tableIdentifier Hudi表的名称。 tablelocation Hudi表的存储路径。 hoodie.archive.file.cleaner.policy 清理归档文件的策略：目前仅支持KEEP_ARCHIVED_FILES_BY_SIZ

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

OBS控制台将生成的UDAF函数Jar包文件上传到OBS目录下。 5 创建DLI程序包 DLI控制台选择刚上传到OBS的UDAF函数的Jar文件，由DLI进行纳管。 6 创建DLI的UDAF函数 DLI控制台在DLI控制台的SQL作业管理界面创建使用的UDAF函数。 7 验证和使用DLI的UDAF函数

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
配置DLI程序包权限 - 数据湖探索 DLI

查询组：查询组内程序包详情。删除组：删除该组的程序包。赋权：当前用户可将组的权限赋予其他用户。回收：当前用户可回收其他用户具备的该组的权限，但不能回收该组所有者的权限。查看其他用户具备的权限：当前用户可查看其他用户具备的该组的权限。程序包授权图2 程序包授权表2 程序包授权参数说明

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
SHOW_LOG_FILE - 数据湖探索 DLI
SHOW_LOG_FILE - 数据湖探索 DLI

table 需要查询表的表名，支持database.tablename格式是 log_file_path_pattern log file的路径，支持正则匹配否 merge 执行show_logfile_records时，通过merge控制是否将多个log file中的record合并在一起返回

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
pyspark样例代码 - 数据湖探索 DLI

前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。通过DataFrame API 访问 import相关依赖

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
删除全局变量 - 数据湖探索 DLI

删除全局变量功能介绍该API用于删除全局变量。只有创建全局变量的用户才可以删除对应的变量。调试您可以在API Explorer中调试该接口。 URI URI格式 DELETE /v1.0/{project_id}/variables/{var_name} 参数说明表1

帮助中心 > 数据湖探索 DLI > API参考 > 全局变量相关API
认证证书 - 数据湖探索 DLI
认证证书 - 数据湖探索 DLI

认证证书合规证书华为云服务及平台通过了多项国内外权威机构（ISO/SOC/PCI等）的安全合规认证，用户可自行申请下载合规资质证书。图1 合规证书下载资源中心华为云还提供以下资源来帮助用户满足合规性要求，具体请查看资源中心。图2 资源中心销售许可证&软件著作权证书

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
MERGE INTO - 数据湖探索 DLI
MERGE INTO - 数据湖探索 DLI

Database中的表名，由字母、数字和下划线（_）组成。 bucket_name obs桶名称。 tbl_path Delta表在obs桶中的存储位置。 target_alias 目标表的别名。 sub_query 子查询。 source_alias 源表或源表达式的别名。 merge_condition

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
SparkSQL建表参数规范 - 数据湖探索 DLI

preCombineField 预合并键，相同主键的多条数据按该字段进行合并按需必须指定，相同主键的数据会按该字段合并，不能指定多个字段。禁止建表时将hoodie.datasource.hive_sync.enable指定为false。指定为false将导致新写入的分区无法同步到Hive Me

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
ALTER TABLE - 数据湖探索 DLI
ALTER TABLE - 数据湖探索 DLI

STRICT，对列的修改，仅对表的元数据产生作用。列修改命令只能修改表/分区的元数据，而不会修改数据本身。用户应确保表/分区的实际数据布局符合元数据定义。不支持更改表的分区列/桶列，也不支持更改ORC表。修改表或分区的存储位置。 ALTER TABLE table_name

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

while trying to read 143805 bytes 问题原因上述报错可能原因是当前导入的文件数据量较大，同时因为spark.sql.shuffle.partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。解决方案建议可以尝试调小spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
弹性资源池计费 - 数据湖探索 DLI

中优先抵扣弹性资源池CU时套餐包的规格额度，超过额度的使用量按需计费。弹性资源池的CU时套餐包的额度每个月会重置。弹性资源池单个计费周期内小于1CU的向上取整。弹性资源池扩缩容的开始时间点是以实际扩缩容成功后时间点开始计算，不是按照扩缩容配置的时间开始计费。弹性资源池队列扩

 帮助中心 > 数据湖探索 DLI > 计费说明
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scan.count 每批次读取的数据记录数，默认为100。如果在读取过程中，redis集群中的CPU使用率还有提升空间，可以调大该参数。 iterator.grouping.size 每批次插入的数据记录数，默认为100。如果在插入过程中，redis集群中的CPU使用率还有提升空间，可以调大该参数。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
UPDATE - 数据湖探索 DLI
UPDATE - 数据湖探索 DLI

table_name Database中的表名，由字母、数字和下划线（_）组成。 bucket_name obs桶名称。 tbl_path Delta表在obs桶中的存储位置。 column 待更新的目标列。 EXPRESSION 需在目标表中更新的源表列值的表达式。 boolExpression

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明

总条数： 531

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询SQL作业日志 - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

VACUUM - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

RESTORE - 数据湖探索 DLI

CLEANARCHIVE - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

配置DLI程序包权限 - 数据湖探索 DLI

SHOW_LOG_FILE - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

删除全局变量 - 数据湖探索 DLI

认证证书 - 数据湖探索 DLI

MERGE INTO - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

ALTER TABLE - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

弹性资源池计费 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

UPDATE - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线