搜索_华为云

自定义函数参数传递 - 数据湖探索 DLI

自定义函数中提供了可选的open(FunctionContext context)方法，FunctionContext具备参数传递功能，自定义配置项通过此对象来传递。自定义函数的参数传递操作步骤如下：在Flink OpenSource SQL编辑页面右侧自定义配置中添加参数pipeline.g

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

如何呢？其实PySpark本身就已经考虑到这一点了，那就是基于PyFiles来指定依赖，在DLI Spark作业页面中可以直接选取存放在OBS上的Python第三方程序库（支持zip、egg等）。图1 Spark作业编辑页面对于依赖的这个Python第三方库的压缩包有一定的结

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
DLI内置依赖包 - 数据湖探索 DLI

10作业程序开发的样例代码可以参考使用Flink Jar写入数据到OBS开发指南。 2020年12月之后创建的新队列才能使用Flink 1.10依赖包。表5 Flink 1.10依赖包依赖包名称 bcpkix-jdk15on-1.60.jar esdk-obs-java-3.20.6.1.jar java-xmlbuilder-1

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Checkpoint和Savepoint生成机制及格式一致，因而，也可以通过Flink作业列表“操作”列中的“更多”>“导入保存点”，导入OBS中最新成功的Checkpoint，并从中恢复。图3 停止作业图4 恢复保存点父主题： Flink作业性能调优类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
重启/扩容/缩容队列 - 数据湖探索 DLI

"message": "Submit restart job success, it need some time to cancel jobs, please wait for a while and check job status", "job_id": "d9039

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
使用CES监控DLI服务 - 数据湖探索 DLI

监控指标和告警信息。命名空间 SYS.DLI 监控指标表1 数据湖探索服务支持的监控指标指标ID 指标名称指标含义取值范围测量对象监控周期（原始指标） queue_cu_num 队列CU使用量展示用户队列申请的CU数 ≥0 队列 5分钟 queue_job_launching_num

帮助中心 > 数据湖探索 DLI > 用户指南
构造请求 - 数据湖探索 DLI
构造请求 - 数据湖探索 DLI

请求服务器返回指定资源。 PUT 请求服务器更新指定资源。 POST 请求服务器新增资源或执行特殊操作。 DELETE 请求服务器删除指定资源，如删除对象等。 HEAD 请求服务器资源头部。 PATCH 请求服务器更新资源的部分内容。当资源不存在的时候，PATCH可能会去创建一个新的资源。

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

Hive，每天通过批处理流水线作业或 Flink 作业更新一次，kafka流来自实时在线业务数据或日志，需要与维度表连接以扩充流。使用spark sql 创建 hive obs 外表，并插入数据。 CREATE TABLE if not exists dimension_hive_table ( product_id

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
SHOW FUNCTIONS - 数据湖探索 DLI
SHOW FUNCTIONS - 数据湖探索 DLI

ON NULL INPUT SYMBOL com.test.udf.hetuengine.functions.repeat URI obs://bucket/user/hetuserver/udf/data/hetu_udf/udf-test-0.0.1-SNAPSHOT.jar

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
实时任务接入 - 数据湖探索 DLI

//指定写入的是Hudi表 'path' = 'obs://bucket/path/hudi_sink_table', //指定Hudi表的存储路径

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
提交SQL作业（废弃） - 数据湖探索 DLI

（推荐）介绍的API。 URI URI格式： POST /v1.0/{project_id}/queues/{queue_name}/jobs/submit-job 参数说明表1 URI参数名称是否必选说明 project_id 是项目编号，用于资源隔离。获取方式请参考获取项目ID。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

name string); CREATE TABLE test_like_properties LIKE test0 LOCATION 'obs://bucket1/test/test_like_properties'; 执行sql： DESCRIBE FORMATTED test_like_properties;

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
开启Flink作业动态扩缩容 - 数据湖探索 DLI

在Flink作业进行动态扩缩时后台作业需要停止继而从savepoint恢复，因此未恢复成功前，作业无法处理数据。因扩缩容过程中需要触发savepoint，因此必须配置obs桶，并保存日志，同时请注意开启checkpoint。扩缩容检测周期不要设置过小，避免频繁启停作业。扩缩容作业恢复过程中的时间长短受sa

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

fileName为需要访问的文件名。本节示例适用于Flink 1.12版本。Flink 1.15版本的Jar作业开发指导请参考Flink Jar写入数据到OBS开发指南。配置文件使用方法方案一：直接在main函数里面加载文件内容到内存，然后广播到各个taskmanager，这种方式适合那种需要提前加载的少量变量。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
创建队列 - 数据湖探索 DLI
创建队列 - 数据湖探索 DLI

创建队列功能介绍该API用于创建队列，该队列将会绑定用户指定的计算资源。新队列第一次运行作业时，需要一定的时间，通常为5~15分钟。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v1.0/{project_id}/queues 参数说明

 帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

Hive，每天通过批处理流水线作业或 Flink 作业更新一次，kafka流来自实时在线业务数据或日志，需要与维度表连接以扩充流。使用spark sql 创建 hive obs 外表，并插入数据。 CREATE TABLE if not exists dimension_hive_table ( product_id

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Spark SQL常用配置项说明 - 数据湖探索 DLI

by a1, a2 with cube spark.sql.distinct.aggregator.enabled false dli.jobs.sql.resubmit.enable null 通过设置该参数可以控制在driver故障、队列重启时Spark SQL作业是否重新提交。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
原生数据类型 - 数据湖探索 DLI

原生数据类型 DLI支持原生数据类型，请参见表1。表1 原生数据类型数据类型描述存储空间范围 OBS表支持情况 DLI表支持情况 INT 有符号整数 4字节 -2147483648～2147483647 是是 STRING 字符串 - - 是是 FLOAT 单精度浮点型

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

CREATE FUNCTION mergeBill AS 'com.xxx.hiveudf.MergeBill' using jar 'obs://onlyci-7/udf/MergeBill.jar'; 父主题：自定义函数

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
创建并提交Spark作业 - 数据湖探索 DLI

{endpoint}信息请从地区和终端节点获取。 Body： { "paths": [ "https://test.obs.xxx.com/txr_test/jars/spark-sdv-app.jar" ], "kind": "jar",

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门

总条数： 761

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

自定义函数参数传递 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

DLI内置依赖包 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

重启/扩容/缩容队列 - 数据湖探索 DLI

使用CES监控DLI服务 - 数据湖探索 DLI

构造请求 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

SHOW FUNCTIONS - 数据湖探索 DLI

实时任务接入 - 数据湖探索 DLI

提交SQL作业（废弃） - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

创建队列 - 数据湖探索 DLI

使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

原生数据类型 - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

创建并提交Spark作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线