搜索_华为云

Flink 1.15版本说明 - 数据湖探索 DLI

Flink Jar作业最小化提交是指Flink仅提交作业必须的依赖项，而不是整个Flink环境。通过将非Connector的Flink依赖项（以flink-开头）和第三方库（如Hadoop、Hive、Hudi、Mysql-cdc）的作用域设置为provided，可以确保这些依赖项不会被

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
导入Flink作业保存点 - 数据湖探索 DLI

是 String Flink作业的作业ID。 project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。请求参数表2 请求Body参数参数是否必选参数类型描述 job_id 是 Long Flink作业的ID。 savepoint_path

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业管理相关API
触发Flink作业保存点 - 数据湖探索 DLI

bs/{job_id}/savepoint 表1 路径参数参数是否必选参数类型描述 job_id 是 String Flink作业的作业ID。 project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。请求参数表2 请求Body参数参数

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业管理相关API
创建DLI表关联Oracle - 数据湖探索 DLI

式是Oracle推荐的，对于集群来说，每个节点的SID可能不一致，但ServiceName是一致的，包含所有节点。 driver Oracle驱动类名: oracle.jdbc.driver.OracleDriver dbtable 指定在Oracle关联的表名，或者"用户名.表名"，例如：public

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接Oracle表
更新SQL作业 - 数据湖探索 DLI
更新SQL作业 - 数据湖探索 DLI

当“checkpoint_enabled”为“true”时，该参数是用户授权保存快照的OBS桶名称。当“log_enabled” 为“true”时，该参数是用户授权保存作业日志的OBS桶名称。 log_enabled 否 Boolean 是否开启作业的日志上传到用户的OBS功能。默认为“false”。 smn_topic

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
配置SQL防御规则 - 数据湖探索 DLI

同一个队列，同一个动作的防御规则仅支持创建一条。系统默认创建的规则会分别创建每个支持动作的规则。例如：创建队列时，会分别创建“提示”和“拦截”动作的Scan files number规则。不同的引擎版本支持的防御规则不同。如需查看队列的引擎版本，您可以在队列资源的资源列表页面，通

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

使用ogg-json读取kafka中的ogg记录，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？什么是数据倾斜？数据倾斜是在SQL作业执行中常见的问题，当数据分布不均匀的情况下，一部分计算节点处理的数据量远大于其他节点，从而影响整个计算过程的处理效率。例如观察到SQL执行时间较长，进入SparkUI查看对应SQL的执行状态，如图1所示，查看到一个stage运行时间超过

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 > 输入kafka的地址 > 测试）。如果能

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

使用canal-json读取kafka中的canal记录，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Hudi数据表Clean规范 - 数据湖探索 DLI

具体可以按照下面的计算公式来保留2个小时的历史版本数据：版本数设置为3600*2/版本interval时间，版本interval时间来自于flink作业的checkpoint周期，或者上游批量写入的周期。 COW表如果业务没有历史版本数据保留的特殊要求，保留版本数设置为1。 COW表的每个版本都是表的全量数据

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
初始化DLI客户端 - 数据湖探索 DLI

通过以下方式可获取AK/SK，项目ID及对应的region信息。登录管理控制台。鼠标指向界面右上角的登录用户名，在下拉列表中单击“我的凭证”。在左侧导航栏中选择“访问密钥”，单击“新增访问密钥”。根据提示输入对应信息，单击“确定”。在弹出的提示页面单击“立即下载”。下载成功后，打开凭证文件，获取AK/SK信息。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
初始化DLI客户端 - 数据湖探索 DLI

通过以下方式可获取AK/SK，项目ID及对应的region信息。登录管理控制台。鼠标指向界面右上角的登录用户名，在下拉列表中单击“我的凭证”。在左侧导航栏中选择“访问密钥”，单击“新增访问密钥”。根据提示输入对应信息，单击“确定”。在弹出的提示页面单击“立即下载”。下载成功后，打开凭证文件，获取AK/SK信息。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
生成Flink SQL作业的静态流图 - 数据湖探索 DLI

parallel_number 否 Integer 最大并行度。并行数为作业每个算子的并行数，适度增加并行数会提高作业整体算力，但也须考虑线程增多带来的切换开销，上限是计算单元CU数的4倍，最佳实践为计算单元CU数的1-2倍。 tm_cus 否 Integer 单个taskManagerCU数量。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Hudi表模型设计规范 - 数据湖探索 DLI

SparkSQL天然与Hive集成，无需考虑元数据问题。该条建议针对的是通过Spark Datasource API或者Flin写Hudi表的场景，通过这两种方式写Hudi时需要增加向Hive同步元数据的配置项；该配置的目的是将Hudi表的元数据统一托管到Hive元数据服务中，为后续的跨引擎操作数据以及数据管理提供便利。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

* 从 Kafka brokers 中的 consumer 组（consumer 属性中的 group.id 设置）提交的偏移量中开始读取分区。 * 如果找不到分区的偏移量，那么将会使用配置中的 auto.offset.reset 设置。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

当发生故障时，Debezium应用只能保证at-least-once的投递语义。即在非正常情况下，Debezium可能会投递重复的变更事件到Kafka中，当Flink从Kafka中消费的时候就会得到重复的事件。这可能会导致Flink query的运行得到错误的结果或者非预期的异常。解决方案：将作业参数 table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
与其他云服务的关系 - 数据湖探索 DLI

与云审计服务（CTS）的关系云审计服务（Cloud Trace Service）为DLI提供对应用户的操作审计。云审计服务支持的DLI操作请参考《云审计服务支持的DLI操作列表说明》。与云监控服务（CES）的关系云监控（Cloud Eye）为DLI提供监控数据，监控作业中的多项指标，从而集中高效地呈现状态信息。

帮助中心 > 数据湖探索 DLI > 产品介绍
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

db_name 需要执行INSERT命令的表所在数据库的名称。 table_name 需要执行INSERT命令的表的名称。 part_spec 指定详细的分区信息。若分区字段为多个字段，需要包含所有的字段，但是可以不包含对应的值，系统会匹配上对应的分区。单表分区数最多允许100000个。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
弹性资源池计费 - 数据湖探索 DLI

中优先抵扣弹性资源池CU时套餐包的规格额度，超过额度的使用量按需计费。弹性资源池的CU时套餐包的额度每个月会重置。弹性资源池单个计费周期内小于1CU的向上取整。弹性资源池扩缩容的开始时间点是以实际扩缩容成功后时间点开始计算，不是按照扩缩容配置的时间开始计费。弹性资源池队列扩

 帮助中心 > 数据湖探索 DLI > 计费说明

总条数： 562

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink 1.15版本说明 - 数据湖探索 DLI

导入Flink作业保存点 - 数据湖探索 DLI

触发Flink作业保存点 - 数据湖探索 DLI

创建DLI表关联Oracle - 数据湖探索 DLI

更新SQL作业 - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

生成Flink SQL作业的静态流图 - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

与其他云服务的关系 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

弹性资源池计费 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线