搜索_华为云

资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

thon SDK概述下载样例代码。 kind：资源包类型，当前支持的包类型分别为： jar：用户jar文件 pyfile：用户Python文件 file：用户文件 modelfile：用户AI模型文件 obs_jar_paths：对应资源包的OBS路径，参数构成为：{bucketName}

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
创建跨源认证（废弃） - 数据湖探索 DLI

认证信息名，同一个project下唯一。 user_name 否 String 认证相关用户名。 password 否 String 认证相关用户密码。 certificate_location 否 String 用户安全集群的证书路径，目前只支持OBS路径，cer类型文件。 datasource_type

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 跨源认证相关API（废弃）
创建跨源认证 - 数据湖探索 DLI

认证信息名，同一个project下唯一。 user_name 否 String 认证相关用户名。 password 否 String 认证相关用户密码。 certificate_location 否 String 用户安全集群的证书路径，目前只支持OBS路径，cer类型文件。 datasource_type

帮助中心 > 数据湖探索 DLI > API参考 > 跨源认证相关API
创建OBS表时怎样指定OBS路径 - 数据湖探索 DLI

CREATE TABLE `di_seller_task_activity_30d`(`user_id` STRING COMMENT '用户ID') SORTED as parquet LOCATION 'obs://akc-bigdata/akdc.db/di_seller_task_activity_30d'

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
表相关 - 数据湖探索 DLI
表相关 - 数据湖探索 DLI

createDLITable(Database database) throws DLIException { //构造表列集合，通过实例化Column对象构建列 List<Column> columns = new ArrayList<Column>(); Column

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
欠费说明 - 数据湖探索 DLI
欠费说明 - 数据湖探索 DLI

包年/包月对于包年/包月DLI资源。如队列或弹性资源池，用户已经预先支付了资源费用，因此在账户出现欠费的情况下，已有的包年/包月资源仍可正常使用。然而，对于涉及费用的操作，如新购资源、弹性资源池规格变更、续费订单等，用户将无法正常进行。按需计费当您的账号因按需DLI资源自动

 帮助中心 > 数据湖探索 DLI > 计费说明
已购买套餐包，为什么仍然产生按需计费？ - 数据湖探索 DLI

说明适用场景重置规则扫描数据量套餐包按照用户每个作业的数据扫描量（单位为“GB”）收取计算费用。仅适用于default 队列。扫描数据量套餐的额度按订购周期会重置。弹性资源池CU时套餐包按照“CU时”收取计算费用，用户在弹性资源池添加的队列上运行作业时按照弹性资源池CU时计费。

帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
窗口Top-N - 数据湖探索 DLI
窗口Top-N - 数据湖探索 DLI

与普通Top-N不同，窗口Top-N只在窗口最后返回汇总的Top-N数据，不会产生中间结果。窗口 Top-N 会在窗口结束后清除不需要的中间状态。窗口 Top-N 适用于用户不需要每条数据都更新Top-N结果的场景，相对普通Top-N来说性能更好。通常，窗口 Top-N 直接用于窗口表值函数（Windowing

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
创建并提交Spark作业 - 数据湖探索 DLI

创建并提交Spark作业场景描述本章节指导用户通过API创建并提交Spark作业。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。涉及接口创建弹性资源池：创建弹性资源池。创建队列：在弹性资源池中添加队列。上传分组资源：上传Spark作业所需的资源包。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
创建并提交Flink作业 - 数据湖探索 DLI

创建并提交Flink作业场景描述本章节指导用户通过API创建并运行Flink自定义作业。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。涉及接口创建弹性资源池：创建弹性资源池。创建队列：在弹性资源池中添加队列。上传分组资源：上传Flink自定义作业所需的资源包。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
使用DataSource语法创建OBS表 - 数据湖探索 DLI

持的分区数等有差异，详细请参考语法格式和注意事项说明。推荐使用OBS并行文件系统进行存储。并行文件系统是一种高性能文件系统，提供毫秒级别访问时延，TB/s级别带宽和百万级别的IOPS，适用于大数据交互式分析场景。注意事项创建表时不会统计大小。添加数据时会修改大小至0。如需查看表大小可以通过OBS查看。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
使用Hive语法创建OBS表 - 数据湖探索 DLI

持的分区数等有差异，详细请参考语法格式和注意事项说明。推荐使用OBS并行文件系统进行存储。并行文件系统是一种高性能文件系统，提供毫秒级别访问时延，TB/s级别带宽和百万级别的IOPS，适用于大数据交互式分析场景。注意事项创建表时会统计大小。添加数据时不会修改大小。如需查看表大小可以通过OBS查看。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
查看Delta表历史操作记录 - 数据湖探索 DLI

指标名称指标含义 version 对表操作的版本号 timestamp 当前版本操作的时间戳 userId 当前版本操作的用户id userName 当前版本操作的用户名 operation 操作名称（WRITE|CREATE TABLE|UPDATE|DELETE|MERGE|RESTORE等）

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta Time Travel
计费样例 - 数据湖探索 DLI
计费样例 - 数据湖探索 DLI

计费样例计费场景某公司用户A申请了256CUs的弹性资源池，并将1TB数据存放在DLI表中。该公司想要了解采用哪种计费模式才是性价比最优的方式。数据湖探索服务目前支持三种作业：SQL作业，Flink作业和Spark作业。SQL作业的计费包括存储计费和计算计费，Flink作业和Spark作业的计费只有计算计费。

帮助中心 > 数据湖探索 DLI > 计费说明
显示所有函数 - 数据湖探索 DLI

注意事项显示与给定正则表达式或函数名匹配的函数。如果未提供正则表达式或名称，则显示所有函数。如果声明了USER或SYSTEM，那么将分别显示用户定义的Spark SQL函数和系统定义的Spark SQL函数。示例查看当前的所有函数。 1 SHOW FUNCTIONS; 父主题：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

数据倾斜、网络问题或任务过多导致的。解决方案：设置并发数：通过设置合适的并发数，可以启动多任务并行运行，从而提高作业的处理能力。例如访问DWS大批量数据库数据时设置并发数，启动多任务的方式运行，避免作业运行超时。具体并发设置可以参考对接DWS样例代码中的partition

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
配置Hudi数据列默认值 - 数据湖探索 DLI

配置Hudi数据列默认值该特性允许用户在给表新增列时，设置列的默认值。查询历史数据时新增列返回默认值。使用约束新增列在设置默认值前，如果数据已经进行了重写，则查询历史数据不支持返回列的默认值，返回NULL。数据入库、更新、执行Compaction、Clustering都会导致部分或全部数据重写。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考
包年/包月计费模式的DLI资源可以和按需计费模式相互转换吗？ - 数据湖探索 DLI

优惠。自建队列购买方式如下：购买队列请参考创建队列。弹性资源池购买方式如下：具体弹性资源池的购买和添加队列操作可以参考《数据湖探索用户指南》中的“创建弹性资源池”和“弹性资源池添加队列”相关章节。父主题：计费相关问题

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

在DLI执行作业时，为了避免因字符编码不一致导致的乱码问题，建议您统一数据源的编码格式。 DLI服务只支持UTF-8文本格式，因此在执行创建表和导入操作时，用户的数据需要以UTF-8编码。在将数据导入DLI之前，确保源数据文件（如CSV、JSON等）是以UTF-8编码保存的。如果数据源不是UTF

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

据。对于流式查询，与普通去重不同，窗口去重只在窗口的最后返回结果数据，不会产生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，性能较好。通常，窗口去重直接用于窗口表值函数上。另外，它可以用于基于窗口表值函数的操作。比如窗口聚合，窗口TopN和窗口关联。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口

总条数： 997

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

资源相关 - 数据湖探索 DLI

创建跨源认证（废弃） - 数据湖探索 DLI

创建跨源认证 - 数据湖探索 DLI

创建OBS表时怎样指定OBS路径 - 数据湖探索 DLI

表相关 - 数据湖探索 DLI

欠费说明 - 数据湖探索 DLI

已购买套餐包，为什么仍然产生按需计费？ - 数据湖探索 DLI

窗口Top-N - 数据湖探索 DLI

创建并提交Spark作业 - 数据湖探索 DLI

创建并提交Flink作业 - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

查看Delta表历史操作记录 - 数据湖探索 DLI

计费样例 - 数据湖探索 DLI

显示所有函数 - 数据湖探索 DLI

Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

配置Hudi数据列默认值 - 数据湖探索 DLI

包年/包月计费模式的DLI资源可以和按需计费模式相互转换吗？ - 数据湖探索 DLI

字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线