搜索_华为云

ARCHIVELOG - 数据湖探索 DLI
ARCHIVELOG - 数据湖探索 DLI

ARCHIVELOG 命令功能用于根据配置对Timeline上的Instant进行归档，并从Timeline上将已归档的Instant删除，以减少Timeline的操作压力。命令格式 RUN ARCHIVELOG ON tableIdentifier; RUN ARCHIVELOG

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
创建DLI表关联HBase - 数据湖探索 DLI

创建DLI表关联HBase 功能描述使用CREATE TABLE命令创建DLI表并关联HBase上已有的表。 Spark跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。前提条件创建DLI

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
创建DLI表关联DDS - 数据湖探索 DLI

创建DLI表关联DDS 功能描述使用CREATE TABLE命令创建DLI表并关联DDS上已有的collection。 Spark跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。前提条件创建DLI

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DDS表
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

Spark作业相关前提条件已参考Java SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化，参考队列相关完成队列创建等操作。提交批处理作业 DLI提供执行批处理作业的接口。您可以使用该接口执行批处理作业。示例代码如下： 1

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
ALTER COLUMN - 数据湖探索 DLI
ALTER COLUMN - 数据湖探索 DLI

ALTER COLUMN 功能开启配置参数： hoodie.schema.evolution.enable=true 命令功能 ALTER TABLE ... ALTER COLUMN语法用于修改当前列属性包括列类型、列位置、列comment。命令语法 ALTER TABLE

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Schema演进语法说明
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本。安装和配置IntelliJ IDEA IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其他兼容版本。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。开发流程

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
对象存储OBS结果表 - 数据湖探索 DLI

完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subtask，每个桶将至少包含一个Part文件。将根据配置的滚动策略来创建其他Part文件。对于Row

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

参数填写完成后，单击“立即购买”，在界面上确认当前配置是否正确。单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表3 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。

帮助中心 > 数据湖探索 DLI > 快速入门
生成Flink SQL作业的静态流图 - 数据湖探索 DLI

static_estimator_config 否 String 每个算子的流量/命中率配置，json格式的字符串。当static_estimator为true时需要配置该参数，配置时传入算子ID和算子流量配置。可先行调用该接口获取算子ID，即响应消息中stream_graph包含的o

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
RENAME COLUMN - 数据湖探索 DLI
RENAME COLUMN - 数据湖探索 DLI

RENAME COLUMN 功能开启配置参数： hoodie.schema.evolution.enable=true 命令功能 ALTER TABLE ... RENAME COLUMN语法用于修改列名称。命令语法 ALTER TABLE tableName RENAME COLUMN

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Schema演进语法说明
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

Hudi表在Hive元数据中，应该会存在1张内部表（手动创建），2张外部表（写入数据后自动创建）。 2张外部表，表名_ro（用户只读合并后的parquet文件，即读优化视图表），_rt（读实时写入的最新版本数据，即实时视图表）。父主题： Bucket调优示例

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
窗口Top-N - 数据湖探索 DLI
窗口Top-N - 数据湖探索 DLI

Top-N 需要 PARTITION BY 子句包含窗口表值函数或窗口聚合产生的 window_start 和 window_end。否则优化器无法翻译。更多介绍和使用请参考开源社区文档：窗口Top-N。语法格式 SELECT [column_list] FROM ( SELECT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
设置SQL作业优先级 - 数据湖探索 DLI

设置SQL作业优先级在“ 设置 > 参数配置”中配置如下参数，其中x为优先级取值。 spark.sql.dli.job.priority=x 登录DLI管理控制台。单击“作业管理 > SQL作业”。选择待配置的作业，单击操作列下的编辑。在“ 设置 > 参数配置”中配置spark.sql.dli

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

资源相关前提条件已参考Python SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化。上传资源包您可以使用DLI提供的接口上传资源包，示例代码如下。完整样例代码和依赖包说明请参考：Python SDK概述。 1 2 3 4

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
怎样监控DLI队列上的作业异常？ - 数据湖探索 DLI

DLI为用户提供了作业失败的topic订阅功能。登录DLI控制台。单击左侧“队列管理”，进入队列管理页面。在队列管理页面，单击左上角“创建消息通知主题”进行配置。详细操作请参考《数据湖探索用户指南》。父主题： DLI弹性资源池和队列类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
DLI JDBC Driver支持的API列表 - 数据湖探索 DLI

DLI JDBC Driver支持的API列表 DLI JDBC Driver支持JDBC标准的众多API，也有部分API不支持用户调用，例如涉及事务调用的API“prepareCall”，调用这类API将抛出“SQLFeatureNotSupportedException”异常

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

false Boolean 指定是否启用批量查找优化。如果启用，用户必须同时设置 lookup.batch.interval 和 lookup.batch.size 选项。此外，由于底层批处理间隔干扰机制的实现，用户必须在 flink 配置中显式启用 table.exec.batch-lookup

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？问题描述 Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为不一致根因分析该问题的根因是数据库设置的时区不合理，通常该问题出现时F

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
在Spark SQL作业中使用UDF - 数据湖探索 DLI

Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本。安装和配置IntelliJ IDEA IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其他兼容版本。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。开发流程

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

当下游消费Hudi过慢，上游写入端会把Hudi文件归档，导致File Not Found问题。设置合理的消费参数避免File Not Found问题。优化建议：调大read.tasks。如果有限流，调大限流参数。调大上游compaction、archive、clean参数。表1 参数名称

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi

总条数： 569

上一页
1
...
13
14
15
...
29
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ARCHIVELOG - 数据湖探索 DLI

创建DLI表关联HBase - 数据湖探索 DLI

创建DLI表关联DDS - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

ALTER COLUMN - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

生成Flink SQL作业的静态流图 - 数据湖探索 DLI

RENAME COLUMN - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

窗口Top-N - 数据湖探索 DLI

设置SQL作业优先级 - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

怎样监控DLI队列上的作业异常？ - 数据湖探索 DLI

DLI JDBC Driver支持的API列表 - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线