搜索_华为云

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Flink作业配置参数对于Flink Jar作业，您需要在代码中开启Checkpoint，同时如果有自定义的状态需要保存，您还需要实现ListCheckpointed接口，并为每个算子设置唯一ID。然后在作业配置中，勾选“从Checkpoint恢复”，并准确配置Checkpoint路径。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

[00:00，09:00)。默认的扩缩容策略不支持时间段配置修改。弹性资源池扩缩容策略生效规则为：在任意一个时间段周期内，优先满足所有队列的最小CU数，剩余的CU（弹性资源池最大CU-所有队列的最小CU数之和）则根据配置的优先级顺序分配，直到剩余的CU数分配完成。队列扩容成功

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

升级引擎版本后是否对作业有影响：功能增强，无影响默认配置spark.sql.adaptive.enabled=true 说明： Spark2.4.x：在Spark 2.4.x版本中，默认情况下spark.sql.adaptive.enabled配置项的值是false，即自适应查询执行（Adaptive

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

endianness' 配置。 INT 采用 big-endian （默认）编码的四个字节。字节序可以通过 'raw.endianness' 配置。 BIGINT 采用 big-endian （默认）编码的八个字节。字节序可以通过 'raw.endianness' 配置。 FLOAT 采用

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
在DLI控制台创建数据库和表 - 数据湖探索 DLI

在DLI控制台创建数据库和表数据库是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。表是数据库最重要的组成部分之一。表是由行与列组合成的。每一列被当作是一个字段。每个字段中的值代表一种类型的数据。数据库是一个框架，表是其实质内容。一个数据库包含一个或者多个表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

分别存放了Spark-submit相关的执行脚本、配置文件和依赖包。进入配置文件conf目录，修改“client.properties”中的配置项，（具体配置项参考表1）。表1 DLI 客户端工具配置参数属性项必须配置默认值描述 dliEndPont 否 - DLI服务的域名。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
创建并使用跨源链接 - 数据湖探索 DLI

"ip":"192.168.0.1", "name":"ecs-97f8-0001" }, { "ip":"192.168.0.2", "name":"ecs-97f8-0002" } ] } 响应示例 { "is_success":

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

所在行的“操作”列，单击“编辑”进入SQL编辑器界面。在SQL编辑器界面，单击“设置”，在“配置项”尝试添加以下几个Spark参数进行解决。参数项如下，冒号前是配置项，冒号后是配置项的值。 spark.sql.enableToString:false spark.sql.adaptive

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
pyspark样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现详解 import相关依赖包 1 2 3 from __future__ import

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
DIS源表 - 数据湖探索 DLI
DIS源表 - 数据湖探索 DLI

当该参数配置时则从配置的时间开始读取数据，有效格式为yyyy-MM-dd HH:mm:ss。当没有配置start-time也没配置offset的时候，读取最新数据。 connector. enable-checkpoint 否是否启用checkpoint功能，可配置为true（启用）或者false（停用），

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

列。更多属性参数配置请参考DLI SQL属性参数说明。图8 编辑DLI SQL节点属性属性编辑完成后，单击“保存”，保存属性配置信息。配置作业调度由于创建库表只需要执行一次，所以本示例只设置为单次调度。鼠标左键单击作业画布空白处。单击 “调度配置” ，选择 “单次调

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

盖了全量数据而不是预期的分区数据，这可能是因为动态分区覆盖功能没有被启用。如果需要动态覆盖DataSource表指定的分区数据，您需要先配置参数 dli.sql.dynamicPartitionOverwrite.enabled=true，然后通过insert overwrite语句实现。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
添加分区（只支持OBS表） - 数据湖探索 DLI

您可以在建表语句OPTIONS中设置“multiLevelDirEnable”为true以查询子目录下的内容，此参数默认值为false（注意，此配置项为表属性，请谨慎配置。Hive表不支持此配置项)。示例建OBS表时仅有一个分区列，建表成功后添加分区数据。先使用DataSource语法创建一个OBS分区

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
设置多版本备份数据保留周期 - 数据湖探索 DLI

设置多版本备份数据保留周期功能描述在DLI数据多版本功能开启后，备份数据默认保留7天，您可以通过配置系统参数“dli.multi.version.retention.days”调整保留周期。保留周期外的多版本数据后续在执行insert overwrite或者truncate语

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

仅在选择“包年/包月”计费模式，或在“按需计费”模式中，勾选“专属资源模式”时，支持配置“高级配置”。在“队列类型”中，勾选了“专属资源模式”后，需要选择“高级选项”。默认配置：由系统自动配置。自定义配置： “网段”：支持指定使用的网段范围。如需使用DLI增强型跨源，DLI队列网段与数据源网段不能重合。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
类型转换函数 - 数据湖探索 DLI

timestamp), cast(case_timestamp_to_date as date) from kafkaSource; 连接Kafka集群，向Kafka的topic中发送如下测试数据： {"cast_int_to_string":"1", "cast_String_to_int":

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
设置SQL作业优先级 - 数据湖探索 DLI

设置SQL作业优先级在“ 设置 > 参数配置”中配置如下参数，其中x为优先级取值。 spark.sql.dli.job.priority=x 登录DLI管理控制台。单击“作业管理 > SQL作业”。选择待配置的作业，单击操作列下的编辑。在“ 设置 > 参数配置”中配置spark.sql.dli

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
故障处理 - 数据湖探索 DLI
故障处理 - 数据湖探索 DLI

on: Message stream modified (41) 解决方案编辑“krb5.conf” 配置文件，将文件中所有“renew_lifetime = xxx”配置删除。重新创建和提交Spark作业。父主题：对接HBase

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
新建SQL作业 - 数据湖探索 DLI
新建SQL作业 - 数据湖探索 DLI

用户为作业选择的CU数。默认值为“2”。 CU数量为DLI的计算单元数量和管理单元数量总和，CU也是DLI的计费单位，1CU=1核4G。当前配置的CU数量为运行作业时所需的CU数，不能超过其绑定队列的CU数量。管理单元参数设置详见：manager_cu_number。 parallel_number

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

参数填写完成后，单击“立即购买”，在界面上确认当前配置是否正确。单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表4 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。

帮助中心 > 数据湖探索 DLI > 快速入门

总条数： 633

上一页
1
...
20
21
22
...
32
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

创建并使用跨源链接 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

DIS源表 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

添加分区（只支持OBS表） - 数据湖探索 DLI

设置多版本备份数据保留周期 - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

类型转换函数 - 数据湖探索 DLI

设置SQL作业优先级 - 数据湖探索 DLI

故障处理 - 数据湖探索 DLI

新建SQL作业 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线