搜索_华为云

导入Flink作业保存点 - 数据湖探索 DLI

参数类型描述 job_id 是 Long Flink作业的ID。 savepoint_path 是 String Savepoint路径。配置示例：obs://bucket-name/dir 响应参数状态码： 200 表3 响应Body参数参数名称参数类型说明 is_success

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业管理相关API
SHOW_LOG_FILE - 数据湖探索 DLI
SHOW_LOG_FILE - 数据湖探索 DLI

database table 无 SELECT 细粒度权限：dli:table:select 由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。系统响应可以检查任务状态是否成功，查看任务结果，查看任务日志确认有无异常。父主题： Hudi CALL

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
SHOW_COMMIT_FILES - 数据湖探索 DLI
SHOW_COMMIT_FILES - 数据湖探索 DLI

database table 无 SELECT 细粒度权限：dli:table:select 由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。系统响应可以检查任务状态是否成功，查看任务结果，查看任务日志确认有无异常。父主题： Hudi CALL

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
SHOW_TIME_LINE - 数据湖探索 DLI
SHOW_TIME_LINE - 数据湖探索 DLI

line列表： call show_active_instant_list(table => '[table_name]'); 查看某个表某个时间戳后的生效的time line列表： call show_active_instant_list(table => '[table_name]'

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
Hadoop jar包冲突，导致Flink提交失败 - 数据湖探索 DLI

<scope> provided </scope> </dependency> 或使用exclusions标签将其排除关联。若使用到hdfs的配置文件，则需要将core-site.xml、hdfs-site.xml、yarn-site.xml 修改为mrs-core-site.xml、mrs-hdfs-site

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
Spark 2.4.5版本说明 - 数据湖探索 DLI

版本主要的功能特性。更多版本新特性请参考Release Notes - Spark 2.4.5。表1 Spark 2.4.5版本优势特性说明支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Hudi表分区设计规范 - 数据湖探索 DLI

Hudi表分区设计规范规则分区键不可以被更新： Hudi具有主键唯一性机制，但在分区表的场景下通常只能保证分区内主键唯一，因此如果分区键的值发生变更后，会导致相同主键的行记录出现多条的情况。在以日期分区的场景，可采用数据的创建时间为分区字段，切记不要采用数据更新时间做分区。当指定Hudi

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
触发Flink作业保存点 - 数据湖探索 DLI

枚举值： TRIGGER：触发 savepoint_path 是 String Savepoint路径。请确保在使用前完成桶的相关操作授权。配置示例：obs://bucket-name/dir/savepoint/ 响应参数状态码： 200 表3 响应Body参数参数名称参数类型

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业管理相关API
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

nction<Row>{}，重点实现其中的open、run、close和cancel函数。实现完成后将该类编译打在jar中，通过sql编辑页的UDF Jar上传。依赖的pom配置文件内容参考如下： <dependency> <groupId>org.apache.flink</groupId>

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
CONVERT TO DELTA - 数据湖探索 DLI
CONVERT TO DELTA - 数据湖探索 DLI

Delta Lake 事务日志来跟踪这些文件，并通过读取所有 Parquet 文件的页脚来自动推断数据架构。转换过程会收集统计信息，以提升转换后的 Delta 表的查询性能。如果提供表名，则元存储也将更新，以反映该表现在是 Delta 表。注意事项分区表转换需要设置参数spark

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

新一次输出结果。若没有设置，则默认没有使用周期触发策略。 lateness_interval 表示窗口结束后延迟lateness_interval时长，继续统计在窗口结束后延迟时间内到达的属于该窗口的数据，而且在延迟时间内到达的每个数据都会更新输出结果。说明：当时间窗口为处理

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

一次输出结果。如果没有设置，则默认没有使用周期触发策略。 lateness_interval 表示窗口结束后延迟lateness_interval时长，继续统计在窗口结束后延迟时间内到达的属于该窗口的数据，而且在延迟时间内到达的每个数据都会更新输出结果。说明：当时间窗口为处理

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

足自己的业务需求，节约成本。本节操作仅适用于普通队列，不适用于弹性资源池队列。使用弹性扩缩容定时任务注意事项新创建的队列需要运行作业后才可进行扩缩容。目前只支持规格为64CUs以上的队列进行定时弹性扩缩容任务，即队列最小规格为64CUs。对于每个队列，最多支持创建12个定时任务。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
pyspark样例代码 - 数据湖探索 DLI

builder.appName("datasource-css").getOrCreate() 通过DataFrame API 访问连接配置 1 2 resource = "/mytest" nodes = "to-css-1174404953-hDTx3UPK.datasource

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
SHALLOW CLONE - 数据湖探索 DLI
SHALLOW CLONE - 数据湖探索 DLI

细粒度权限：dli:database:createTable, dli:table:select。 LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。示例 CREATE OR REPLACE TABLE delta_table1 SHALLOW CLONE

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
修改主机信息 - 数据湖探索 DLI

hosts 是 Array of objects 用户自定义主机信息，最大支持2万条记录，详细信息参见表 hosts请求参数。内容填空表示清除所有已配置的主机信息。表3 hosts请求参数参数名称是否必选参数类型说明 name 否 String 自定义主机名称。长度128，数字字

 帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

sink可以在initializeState里引入。图2 获取kafka sink 操作步骤从Kafka实例的基本信息页面下载SSL证书，解压后将其中的clinet.jks文件上传到OBS。图3 下载SSL证书在DLI控制台，打开“数据管理 > 程序包管理”，单击“创建”，创建clinet

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
构造请求 - 数据湖探索 DLI
构造请求 - 数据湖探索 DLI

（请求发送的时间）请求头。例如，对于IAM获取用户Token接口，由于不需要认证，所以只添加“Content-Type”即可，添加消息头后的请求如下所示。 POST https://iam.cn-north-1.myhuaweicloud.com/v3/auth/tokens Content-Type:

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
CREATE TABLE AS SELECT - 数据湖探索 DLI

细粒度权限：dli:database:createTable, dli:table:select。由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。示例创建分区表 create table if not exists delta_table0 using

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
Spark 3.3.1版本说明 - 数据湖探索 DLI

传输效率。动态Executor shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告

总条数： 549

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

导入Flink作业保存点 - 数据湖探索 DLI

SHOW_LOG_FILE - 数据湖探索 DLI

SHOW_COMMIT_FILES - 数据湖探索 DLI

SHOW_TIME_LINE - 数据湖探索 DLI

Hadoop jar包冲突，导致Flink提交失败 - 数据湖探索 DLI

Spark 2.4.5版本说明 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

触发Flink作业保存点 - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

CONVERT TO DELTA - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

SHALLOW CLONE - 数据湖探索 DLI

修改主机信息 - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

构造请求 - 数据湖探索 DLI

CREATE TABLE AS SELECT - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线