搜索_华为云

cume - 数据湖探索 DLI
cume - 数据湖探索 DLI

partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。返回值说明返回DOUBLE类型的值。 a为NULL，则返回NULL。示例代码为便于理解函数的使用方法，本文为您提供源数据，基于源数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

uri uri的格式为：mongodb://username:pwd@host:8635/db 其中以下参数需要修改为实际值： “username”为创建的mongo（DDS）数据库用户名。 “pwd”为创建的mongo（DDS）数据库用户名对应的密码。 “host”为创建的mongo（DDS）数据库实例IP。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

LITERAL 的时候，指定字符串常量替换 Map 中的空 key 值。支持的Connector Kafka 示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Hudi Compaction操作说明 - 数据湖探索 DLI

会将TimeLine里的所有Compaction Plan一个一个去执行，一直到全部都执行完。对于Merge-On-Read表，数据使用列式Parquet文件和行式Avro文件存储，更新被记录到增量文件，然后进行同步/异步compaction生成新版本的列式文件。Merge-O

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
套餐包计费 - 数据湖探索 DLI
套餐包计费 - 数据湖探索 DLI

图1描述了按需计费的DLI资源各个阶段的状态。购买后，在计费周期内资源正常运行，此阶段为有效期；当您的账号因按需资源自动扣费导致欠费后，账号将变成欠费状态，资源将陆续进入宽限期和保留期。图1 按需计费的DLI资源生命周期欠费预警系统会在每个计费周期后的一段时间对按需计费资源进行扣费。当您的账

 帮助中心 > 数据湖探索 DLI > 计费说明
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

系统中。在很多情况下，利用这个特性非常的有用，例如将增量数据从数据库同步到其他系统日志审计数据库的实时物化视图关联维度数据库的变更历史，等等。 Flink 还支持将 Flink SQL 中的 INSERT / UPDATE / DELETE 消息编码为 Canal 格式的 JSON 消息，输出到

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

数据湖探索DLI的计费由不同的计费项组成，不同的计费项有不同的计费模式，如图1所示。图1 DLI的计费组成计费项 DLI的计费项包括计算计费、存储计费、扫描量计费。DLI的计费详情请参见DLI产品价格详情。您可以通过DLI提供的价格计算器，快速计算出购买资源的参考价格。表1

帮助中心 > 数据湖探索 DLI > 计费说明
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 > 输入kafka的地址 > 测试）。如果能

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

S表即可对OBS上的数据进行分析和处理。本指导中的操作内容包括：创建OBS表、导入OBS表数据、插入和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。前提条件已创建OBS的桶。具体OBS操作可以参考《对象存储服务用户指南》。本指导中的OBS桶名都为“dli-test-021”。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
查看Flink作业详情 - 数据湖探索 DLI

时延指事件从源端算子到达本算子的过程中消耗的时间，单位为毫秒（ms）。发送的记录数算子发送数据的记录。发送的字节数算子发送的字节数。接受的字节数算子接收的字节数。接受的记录数算子收到数据的记录。开始时间算子运行开始时间。结束时间算子运行结束时间。查看Flink作业执行计划

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

使用ogg-json读取kafka中的ogg记录，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
更新Flink Jar作业 - 数据湖探索 DLI

entrypoint 否 String 用户已上传到DLI资源管理系统的程序包名，用户自定义作业主类所在的jar包。 dependency_jars 否 Array of Strings 用户已上传到DLI资源管理系统的程序包名，用户自定义作业的其他依赖包。示例“myGroup/test.jar

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

使用canal-json读取kafka中的canal记录，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
新建Flink Jar作业 - 数据湖探索 DLI

String 标签的键。说明：标签的键的最大长度为128个字符，标签的键可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格，不能以_sys_开头。 value 是 String 标签的值。说明：标签值的最大长度为255个字符，标签的值可以包含任意语种字母、数字、空格和_

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
查询所有队列 - 数据湖探索 DLI

企业项目ID。0”表示default，即默认的企业项目。关于如何设置企业项目请参考《企业管理用户指南》。说明：开通了企业管理服务的用户可设置该参数绑定指定的项目。 cidr_in_vpc 否 String 队列的虚拟私有云（VPC）的网段。例如：10.0.0.0/8~24，172

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
Hudi数据表Compaction规范 - 数据湖探索 DLI

新版本的Parquet文件，那旧版本的文件就不能被Clean清理，增加存储压力。提交Spark jar作业时，CPU与内存比例为1:4~1:8。 Compaction作业是将存量的parquet文件内的数据与新增的log中的数据进行合并，需要消耗较高的内存资源，按照之前的表设计

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
配置SQL防御规则 - 数据湖探索 DLI

同一个队列，同一个动作的防御规则仅支持创建一条。系统默认创建的规则会分别创建每个支持动作的规则。例如：创建队列时，会分别创建“提示”和“拦截”动作的Scan files number规则。不同的引擎版本支持的防御规则不同。如需查看队列的引擎版本，您可以在队列资源的资源列表页面，通

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

当发生故障时，Debezium应用只能保证at-least-once的投递语义。即在非正常情况下，Debezium可能会投递重复的变更事件到Kafka中，当Flink从Kafka中消费的时候就会得到重复的事件。这可能会导致Flink query的运行得到错误的结果或者非预期的异常。解决方案：将作业参数 table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

field：进行分桶时计算Hash值的字段，必须为主键的子集，默认为Hudi表的主键。该参数不填则默认为recordkey.field。创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi

总条数： 319

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

cume - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

套餐包计费 - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

更新Flink Jar作业 - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

新建Flink Jar作业 - 数据湖探索 DLI

查询所有队列 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线