搜索_华为云

Hudi Clustering操作说明 - 数据湖探索 DLI

在文件大小和入湖速度之间进行权衡，Hudi提供了一个hoodie.parquet.small.file.limit配置来设置最小文件大小。用户可以将该配置设置为“0”，以强制新数据写入新的文件组，或设置为更高的值以确保新数据被“填充”到现有小的文件组中，直到达到指定大小为止，但其会增加摄取延迟。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

s化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索 DLI > 用户指南> 数据管理> 程序包管理> 内置依赖包”），这些常用算法库满足了大部分用户的使用场景

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
DLI的数据可存储在哪些地方 - 数据湖探索 DLI

DWS，MRS，RDS等。 DLI表与OBS表有什么区别？ DLI表表示数据存储在本服务内部，用户不感知数据存储路径。 OBS表表示数据存储在用户自己账户的OBS桶中，源数据文件由用户自己管理。 DLI表相较于OBS表提供了更多权限控制和缓存加速的功能，性能相较于外表性能更好，但是会收取存储费用。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
创建队列 - 数据湖探索 DLI
创建队列 - 数据湖探索 DLI

d 否 String 企业项目ID，“0”表示default，即默认的企业项目。关于如何设置企业项目请参考《企业管理用户指南》。说明：开通了企业管理服务的用户可设置该参数绑定指定的项目。 platform 否 String 队列计算资源的cpu架构。 x86_64 aarch64

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
执行查询语句报错：There should be at least one partition pruning predicate on partitioned table XX.YYY - 数据湖探索 DLI

YYY执行查询时，其查询条件中未使用其表分区列。查询分区表时，查询条件中每个分区表必须包含至少一个分区列才允许执行，否则不允许执行。解决方案建议用户参考如下例子查询分区表：其中partitionedTable为分区表，partitionedColumn为分区列，查询语句为： SELECT

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
审计与日志 - 数据湖探索 DLI
审计与日志 - 数据湖探索 DLI

CTS可记录的DLI操作列表详见云审计服务支持的DLI操作列表说明。用户开通云审计服务并创建和配置追踪器后，CTS开始记录操作事件用于审计。关于如何开通云审计服务以及如何查看追踪事件，请参考《云审计服务快速入门》中的相关章节。 CTS支持配置关键操作通知。用户可将与IAM相关的高危敏感操作，作为关键操作

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
计费样例 - 数据湖探索 DLI
计费样例 - 数据湖探索 DLI

计费样例计费场景某公司用户A申请了256CUs的弹性资源池，并将1TB数据存放在DLI表中。该公司想要了解采用哪种计费模式才是性价比最优的方式。数据湖探索服务目前支持三种作业：SQL作业，Flink作业和Spark作业。SQL作业的计费包括存储计费和计算计费，Flink作业和Spark作业的计费只有计算计费。

帮助中心 > 数据湖探索 DLI > 计费说明
显示所有函数 - 数据湖探索 DLI

注意事项显示与给定正则表达式或函数名匹配的函数。如果未提供正则表达式或名称，则显示所有函数。如果声明了USER或SYSTEM，那么将分别显示用户定义的Spark SQL函数和系统定义的Spark SQL函数。示例查看当前的所有函数。 1 SHOW FUNCTIONS; 父主题：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
上传分组资源（废弃） - 数据湖探索 DLI

Array of Strings 用户OBS对象路径列表，OBS对象路径为OBS对象URL。 kind 是 String 分组资源文件的类型。 jar：用户jar文件。 pyFile：用户python文件。 file：用户文件。 modelFile：用户AI模型文件。说明：上传的

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

在DLI执行作业时，为了避免因字符编码不一致导致的乱码问题，建议您统一数据源的编码格式。 DLI服务只支持UTF-8文本格式，因此在执行创建表和导入操作时，用户的数据需要以UTF-8编码。在将数据导入DLI之前，确保源数据文件（如CSV、JSON等）是以UTF-8编码保存的。如果数据源不是UTF

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
创建表（废弃） - 数据湖探索 DLI

ocation为OBS时填写。 delimiter 否 String 用户自定义数据分隔符。只有CSV类型数据具有该属性。data_location为OBS时填写。 quote_char 否 String 用户自定义引用字符，默认为双引号（即“\"”）。只有CSV类型数据具有该属

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
查询队列详情 - 数据湖探索 DLI

开通了企业管理服务的用户可设置该参数绑定指定的项目。 resource_type 否 String 资源类型。 vm：ecf集群 container：容器化集群（k8s） cu_spec 否 Integer 队列的规格大小。对于包周期队列，表示包周期部分的CU值；对于按需队列，表示用户购买队列时的初始值。

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
查询所有全局变量 - 数据湖探索 DLI

String 全局变量值。 project_id 否 String 项目ID。 user_id 否 String 用户ID。 user_name 否 String 用户名。 is_sensitive 否 Boolean 是否设置为敏感变量。 create_time 否 Long 创建时间。

帮助中心 > 数据湖探索 DLI > API参考 > 全局变量相关API
查询所有队列 - 数据湖探索 DLI

enterprise_project_id 否 String 企业项目ID。0”表示default，即默认的企业项目。关于如何设置企业项目请参考《企业管理用户指南》。说明：开通了企业管理服务的用户可设置该参数绑定指定的项目。 cidr_in_vpc 否 String 队列的虚拟私有云（VPC）的网段。例如：10.0

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
Spark SQL常用配置项说明 - 数据湖探索 DLI

maxRecordsPerFile 0 要写入单个文件的最大记录数。如果该值为零或为负，则没有限制。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。 spark.sql.dynamicPartitionOverwrite.enabled false 当

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
修改组或资源包拥有者（废弃） - 数据湖探索 DLI

项目编号，用于资源隔离。获取方式请参考获取项目ID。请求消息表2 请求参数参数名称是否必选参数类型说明 new_owner 是 String 新用户名。名称只能包含数字、英文字母、下划线和中划线且不能以数字开头，长度在5-32字符之间。 group_name 是 String 组名。名

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
在default队列执行DLI SQL失败，提示超时异常怎么办？ - 数据湖探索 DLI

Error message:Execution Timeout 问题原因 default队列是系统预置的默认公共队列，主要用来体验产品功能。当多个用户通过该队列提交作业时，容易发生流控，从而导致作业提交失败。解决方案建议不要使用default队列提交作业，可以在DLI控制台新购买SQL队列来提交作业。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
查询所有数据库（废弃） - 数据湖探索 DLI

d 是 String 企业项目ID，“0”表示default，即默认的企业项目。关于如何设置企业项目请参考《企业管理用户指南》。说明：开通了企业管理服务的用户可设置该参数绑定指定的项目。 resource_id 是 String 资源ID。请求示例无响应示例 { "is_success":

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 数据库相关API（废弃）
修改表分区位置（只支持OBS表） - 数据湖探索 DLI

所指定的新的OBS路径必须是已经存在的绝对路径，否则将报错。若新增分区指定的路径包含子目录（或嵌套子目录），则子目录下面的所有文件类型及内容也将作为该分区的记录。用户需要保证该分区目录下所有文件类型和文件内容与表的字段一致，否则查询将报错。示例将student表的分区dt='2008-08-08',

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
数据权限列表 - 数据湖探索 DLI

GRANT_PRIVILEGE（数据库的赋权） REVOKE_PRIVILEGE（数据库权限的回收） SHOW_PRIVILEGES（查看其他用户具备的数据库权限） ALTER_TABLE_ADD_PARTITION（在分区表中添加分区） ALTER_TABLE_DROP_PARTITION（删除分区表的分区）

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据权限相关

总条数： 529

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi Clustering操作说明 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

DLI的数据可存储在哪些地方 - 数据湖探索 DLI

创建队列 - 数据湖探索 DLI

执行查询语句报错：There should be at least one partition pruning predicate on partitioned table XX.YYY - 数据湖探索 DLI

审计与日志 - 数据湖探索 DLI

计费样例 - 数据湖探索 DLI

显示所有函数 - 数据湖探索 DLI

上传分组资源（废弃） - 数据湖探索 DLI

字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

创建表（废弃） - 数据湖探索 DLI

查询队列详情 - 数据湖探索 DLI

查询所有全局变量 - 数据湖探索 DLI

查询所有队列 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

修改组或资源包拥有者（废弃） - 数据湖探索 DLI

在default队列执行DLI SQL失败，提示超时异常怎么办？ - 数据湖探索 DLI

查询所有数据库（废弃） - 数据湖探索 DLI

修改表分区位置（只支持OBS表） - 数据湖探索 DLI

数据权限列表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线