搜索_华为云

Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

必须同时设置 lookup.batch.interval 和 lookup.batch.size 选项。此外，由于底层批处理间隔干扰机制的实现，用户必须在 flink 配置中显式启用 table.exec.batch-lookup.enabled' 选项 ignore-retractions

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

而且在延迟时间内到达的每个数据都会更新输出结果。说明：当时间窗口为处理时间时，无论lateness_interval为何值，都不会有效果。 period_interval和lateness_interval不可为负数。当period_interval为0时，表示没有使用窗口的周期触发策略；

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

而且在延迟时间内到达的每个数据都会更新输出结果。说明：当时间窗口为处理时间时，无论lateness_interval为何值，都不会有效果。 period_interval和lateness_interval不可为负数。当period_interval为0时，表示没有使用窗口的周期触发策略；

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency> <groupId>org.apache.spark</groupId>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
DLI作业开发流程 - 数据湖探索 DLI

link作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相关的Python包或者C库，可以通过这种方式帮助用户实现功能扩展。创建自定义镜像请参考使用自定义镜像增强作业运行环境。 DLI元数据是SQL作业、Spark作业场景开发的基础。在执行作业前您需要根据业务场景定义数据库和表。

帮助中心 > 数据湖探索 DLI > 用户指南
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

流式处理读取的默认间隔为'1 min'，Hive 流式处理temporal join的默认间隔为 '60 min'，这是因为在当前 Hive 流式处理临时连接实现中，每个 TM 都会访问 Hive metaStore，这可能会对 metaStore 产生压力，这将在未来得到改善。 streaming-source

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

ublic”。如果选择界面没有待选择的模式或表空间，请确认对应连接里的账号是否有元数据查询的权限。说明：该参数支持配置通配符（*），实现导出以某一前缀开头或者以某一后缀结尾的所有数据库。例如： SCHEMA*表示导出所有以“SCHEMA”开头的数据库。 *SCHEMA表示导出所有以“SCHEMA”结尾的数据库。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
创建Flink Jar作业 - 数据湖探索 DLI

具中将scope设为provided 日志配置文件（例如：“log4j.properties”或者“logback.xml”等）日志输出实现类JAR包（例如：log4j等）注意事项创建作业提交任务前，建议先开通云审计服务，用于记录与DLI服务相关的操作事件，便于日后的查询、

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
Spark SQL常用配置项说明 - 数据湖探索 DLI

对于包含count(distinct)的多维分析（with cube）的查询场景，spark典型的执行计划是将cube使用expand算子来实现，但该操作会导致查询膨胀，为了避免出现查询膨胀，建议执行如下配置： spark.sql.keep.distinct.expandThreshold：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
pyspark样例代码 - 数据湖探索 DLI

认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现详解 import相关依赖包 1 2 3 from __future__ import print_function from pyspark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

通过DLI开放的API和调用示例，您可以使用并管理队列，SQL作业，Spark作业和跨源作业等。您还可以直接调用DLI SDK提供的接口函数实现业务。常用API API概览队列相关API Spark作业相关API 增强型跨源相关API 流作业相关API 流作业模板相关API SDK参考

 帮助中心 > 数据湖探索 DLI > 成长地图
Hudi表索引设计规范 - 数据湖探索 DLI

优点：写入过程中对主键进行hash分桶写入，性能比较高，不受表的数据量限制。Flink和Spark引擎都支持，Flink和Spark引擎可以实现交叉混写同一张表。缺点：Bucket个数不能动态调整，数据量波动和整表数据量持续上涨会导致单个Bucket数据量过大出现大数据文件。需要结合分区表来进行平衡改善。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据应用场景在车联网领域，云计算与大数据为企业提供了强大的分析挖掘能力，可以帮助企业和车队管理者更加科学、便捷地进行车辆数据管理与分析。方案架构根据已有的某货运公司车辆定时上报的详单数据和货运订单数据，DLI可以完成对该货运公司车辆行驶特点分析、记录明细的查询。

帮助中心 > 数据湖探索 DLI > 最佳实践
创建并提交Spark作业 - 数据湖探索 DLI

创建并提交Spark作业场景描述本章节指导用户通过API创建并提交Spark作业。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。涉及接口创建弹性资源池：创建弹性资源池。创建队列：在弹性资源池中添加队列。上传分组资源：上传Spark作业所需的资源包。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
Upsert Kafka结果表 - 数据湖探索 DLI

sink会保证至少一次将数据插入Kafka topic。这意味着，Flink可以将具有相同key的重复记录写入Kafka topic。因此，upsert-kafka 连接器可以实现幂等写入。语法格式 1 2 3 4 5 6 7 8 9 10 11 12 create table kafkaSource(

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Hudi数据表Compaction规范 - 数据湖探索 DLI

过调大内存占比解决。建议通过增加并发数提升Compaction性能。 CPU和内存比例配置合理会保证Compaction作业是稳定的，实现单个Compaction task的稳定运行。但是Compaction整体的运行时长取决于本次Compaction处理文件数以及分配的cp

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
cume - 数据湖探索 DLI
cume - 数据湖探索 DLI

cume_dist cume_dist函数用于求累计分布，相当于求分区中大于等于或小于等于当前行的数据在分区中的占比。使用限制窗口函数的使用限制如下：窗口函数只能出现在select语句中。窗口函数中不能嵌套使用窗口函数和聚合函数。窗口函数不能和同级别的聚合函数一起使用。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

如需及时了解Prometheus监控状态并做出响应，您还需要配置告警通知，SMN服务为您提供了灵活的消息推送能力，可以将Prometheus的告警事件通知发送到不同的终端，从而实现多通道告警事件通知。本节操作介绍配置Prometheus监控告警通知的操作步骤。了解SMN计费规则请参考SMN计费说明。创建SMN主题并添加订阅。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
权限策略和授权项 - 数据湖探索 DLI

授权项：自定义策略中支持的Action，在自定义策略中的Action中写入授权项，可以实现授权项对应的权限功能。依赖的授权项：部分Action存在对其他Action的依赖，需要将依赖的Action同时写入授权项，才能实现对应的权限功能。 IAM项目(Project)/企业项目(Enterprise

帮助中心 > 数据湖探索 DLI > API参考
percent - 数据湖探索 DLI
percent - 数据湖探索 DLI

percent_rank percent_rank函数为窗口的ORDER BY子句所指定列中值的返回值，但以介于0和1之间的小数形式表示，计算方法为 (分组内当前行的RANK值-1)/(分组内总行数-1)。使用限制窗口函数的使用限制如下：窗口函数只能出现在select语句中。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数

总条数： 232

上一页
1
...
6
7
8
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Redis维表 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

创建并提交Spark作业 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

cume - 数据湖探索 DLI

配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

权限策略和授权项 - 数据湖探索 DLI

percent - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线