搜索_华为云

提交作业时提示作业桶权限不足怎么办？ - 数据湖探索 DLI

Flink作业所需要使用的桶授权信息如下，其中domainId和userId分别为DLI的账号和子账号，bucketName为用户桶名，timeStamp为策略创建时的时间戳。 { "Statement": [ { "Effect": "Allow",

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI权限管理类
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

参数说明配置样例优先级当前弹性资源池中的优先级数字越大表示优先级越高。本例设置一条扩缩容策略，默认优先级为1。 1 时间段首条扩缩容策略是默认策略，不能删除和修改时间段配置。即设置00-24点的扩缩容策略。 00-24 最小CU 设置扩缩容策略支持的最小CU数。 16 最大CU

帮助中心 > 数据湖探索 DLI > 快速入门
使用DLI分析电商BI报表 - 数据湖探索 DLI

brand int 品牌ID 脱敏评价数据表3 评价数据字段名称字段类型字段说明取值范围 deadline string 截止时间单位：天 product_id int 商品编号脱敏 comment_num int 累计评论数分段 0表示无评论 1表示有1条评论 2表示有2-10条评论

 帮助中心 > 数据湖探索 DLI > 最佳实践
配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

0b33ea2a7e0010802fe4c009bb05076d kyuubi.engine.dli.sql.limit.time.sec SQL查询的执行时间限制。默认600s 否 300 kyuubi.engine.dli.result.line.num.limit SQL查询的返回的最大条数。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
更新SQL作业 - 数据湖探索 DLI
更新SQL作业 - 数据湖探索 DLI

次。 2：at_least_once，数据至少被消费一次。默认值为1。 checkpoint_interval 否 Integer 快照时间间隔。单位为秒，默认值为“10”。 obs_bucket 否 String 当“checkpoint_enabled”为“true”时，该参数是用户授权保存快照的OBS桶名称。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Hudi表索引设计规范 - 数据湖探索 DLI

保持写入的性能。使用该索引无法支持Flink和Spark交叉混写。对于数据总量持续上涨的表，采用Bucket索引时，须使用时间分区，分区键采用数据创建时间。参照Flink状态索引的特点，Hudi表超过一定数据量后，Flink作业状态后端压力很大，需要优化状态后端参数才能维持性

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
DWS源表（不推荐使用） - 数据湖探索 DLI

包括位置应用、金融保险、互联网电商等。数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DWS的更多信息，请参见《数据仓库服务管理指南》。推荐使用DWS服务自研的DWS Connector。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

0b33ea2a7e0010802fe4c009bb05076d kyuubi.engine.dli.sql.limit.time.sec SQL查询的执行时间限制。默认600s 否 300 kyuubi.engine.dli.result.line.num.limit SQL查询的返回的最大条数。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
Hbase维表 - 数据湖探索 DLI
Hbase维表 - 数据湖探索 DLI

lookup.cache.ttl 否 -1 Long 维表配置，缓存超时时间，超过该时间的数据会被剔除。格式为：{length value}{time unit label}，如123ms, 321s，支持的时间单位包括: d,h,min,s,ms等，默认为ms。默认表示不使用该配置。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
Hbase维表 - 数据湖探索 DLI
Hbase维表 - 数据湖探索 DLI

lookup.cache.ttl 否 -1 Long 维表配置，缓存超时时间，超过该时间的数据会被剔除。格式为：{length value}{time unit label}，如123ms, 321s，支持的时间单位包括: d,h,min,s,ms等，默认为ms。默认表示不使用该配置。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

0b33ea2a7e0010802fe4c009bb05076d kyuubi.engine.dli.sql.limit.time.sec SQL查询的执行时间限制。默认600s 否 300 kyuubi.engine.dli.result.line.num.limit SQL查询的返回的最大条数。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
查询Spark作业日志 - 数据湖探索 DLI

DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。 Spark日志分割规则：按大小分割：默认情况下，每个日志文件最大为128MB。按时间分割：每过一小时自动创建新的日志文件。前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
边缘Flink作业状态上报（废弃） - 数据湖探索 DLI

参数类型说明 job_id 否 Integer 作业ID。 status 是 String 作业状态。 create_time 是 Long 时间戳。 exceptions 否 String 作业异常信息。 metrics 否 String 作业指标信息。 plan 否 String

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > IEF相关API（废弃）
条件函数 - 数据湖探索 DLI
条件函数 - 数据湖探索 DLI

WHEN value2_1 [, value2_2 ]* THEN result2 ]* [ ELSE resultZ ] END 当第一个时间值包含在 (valueX_1, valueX_2, …) 中时，返回 resultX。当没有值匹配时，如果提供则返回 result_z，否则返回

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

用户首次使用子账号创建队列时，需要先使用主账号登录控制台，在DLI的数据库中保持记录，才能创建队列。新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。按需队列创建完成后，如果在1小时内未运行作业，系统将进行释放。按需队列与包年/包月队列不能互相转换，如需使用包年/包月队列，直接购买即可。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

如果您在HDFS上拥有基于文本的数据文件或者表，而且正在使用Spark SQL对数据执行查询操作，那么推荐将文本数据文件转换为Parquet数据文件，转换需要时间，但查询性能的提升在某些情况下可能达到约30倍或更高。节省存储空间 Parquet还支持灵活的压缩选项，因此可以显著减少磁盘上的存储。存储的节省可高达约75%。

帮助中心 > 数据湖探索 DLI > 最佳实践
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

不再支持混合使用年月字段和日时间字段说明： Spark2.4.x：单位列表间隔文字可以混合使用年月字段（YEAR 和 MONTH）和日时间字段（WEEK、DAY、...、MICROSECOND）。 Spark3.3.x：单位列表间隔文字不能混合使用年月字段（YEAR 和 MONTH）和日时间字段（WEEK、DAY、

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
了解数据目录、数据库和表 - 数据湖探索 DLI

管理”，可进入其表管理页面。表管理页面显示用户在当前数据库中创建所有的表，您可以查看表类型，数据存储位置等信息。表列表默认按创建时间排列，创建时间最近的表显示在最前端。父主题：创建数据库和表

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
Hudi数据表Compaction规范 - 数据湖探索 DLI

Compaction操作。如果长时间不做compaction，Hudi表的log将会越来越大，这必将会出现以下问题： Hudi表读取很慢，且需要很大的资源。这是由于读MOR表涉及到log合并，大log合并需要消耗大量的资源并且速度很慢。长时间进行一次Compaction需要耗费很多资源才能完成，且容易出现OOM。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

更高的值意味着达到边界需要更长的时间，但可能会有更多的请求排队，并使用更多的堆空间。默认请设置为2147483647。 connection-timeout-millis 否 10000 Integer 尝试连接redis集群时的最大超时时间。 commands-timeout-millis

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表

总条数： 466

上一页
1
...
13
14
15
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

提交作业时提示作业桶权限不足怎么办？ - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

更新SQL作业 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

DWS源表（不推荐使用） - 数据湖探索 DLI

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Hbase维表 - 数据湖探索 DLI

Hbase维表 - 数据湖探索 DLI

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

边缘Flink作业状态上报（废弃） - 数据湖探索 DLI

条件函数 - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线