搜索_华为云

Hudi - 数据湖探索 DLI
Hudi - 数据湖探索 DLI

量拉取的功能。表1 支持类别类别详情支持Flink表类型源表、结果表支持hudi表类型 MOR表，COW表支持读写类型批量读，批量写，流式读，流式写 Hudi源表 Hudi 结果表父主题： Connector列表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

任意参数为null时，返回null 若integer为负数，则返回null 若integer不大于string1的长度，则返回string1裁剪为integer长度的字符串例如LPAD('hi',4,'??') 返回"??hi" LPAD('hi',1,'??') 返回"h" RPAD(string1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
在Spark SQL作业中使用UDF - 数据湖探索 DLI

int b) { return a + b; } } 编写调试完成代码后，通过IntelliJ IDEA工具编译代码并导出Jar包。单击工具右侧的“Maven”，参考下图分别单击“clean”、“compile”对代码进行编译。编译成功后，单击“package”对代码进行打包。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

任意参数为null时，返回null 若integer为负数，则返回null 若integer不大于string1的长度，则返回string1裁剪为integer长度的字符串例如LPAD('hi',4,'??') 返回"??hi" LPAD('hi',1,'??') 返回"h" RPAD(string1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
SQL作业使用咨询 - 数据湖探索 DLI

timeout（单位是秒）参数配置超时时间。 DLI支撑本地测试Spark作业吗? DLI暂不支持本地测试Spark作业，您可以安装DLI Livy工具，通过Livy工具提供的交互式会话能力调测Spark作业。推荐使用使用Livy提交Spark Jar作业。 DLI 表(OBS表 / DLI 表 )数据支持删除某行数据吗？

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
队列相关API（废弃） - 数据湖探索 DLI

队列相关API（废弃）修改队列网段（废弃）创建队列定时扩缩容计划（废弃）查看队列定时扩缩容计划（废弃）批量删除队列定时扩缩容计划（废弃）单个删除队列定时扩缩容计划（废弃）修改队列定时扩缩容计划（废弃）父主题：历史API

帮助中心 > 数据湖探索 DLI > API参考 > 历史API
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

} } 最后调用close方法，对需要清理的方法进行清理。编写调试完成代码后，通过IntelliJ IDEA工具编译代码并导出Jar包。单击工具右侧的“Maven”，参考下图分别单击“clean”、“compile”对代码进行编译。编译成功后，单击“package”对代码进行打包。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

sum; } } } 图8 编写UDAF函数代码编写调试完成代码后，通过IntelliJ IDEA工具编译代码并导出Jar包。单击工具右侧的“Maven”，参考下图分别单击“clean”、“compile”对代码进行编译。编译成功后，单击“package”对代码进行打包。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
SDK的获取与安装 - 数据湖探索 DLI

Maven安装完成后，可根据开发需要，直接引入依赖到已有的Maven工程或先用开发工具创建Maven工程。创建项目以idea开发工具为例(已有Maven 工程可跳过此步骤)：打开IntelliJ IDEA 开发工具。点击File - New - project... 在New Pro

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
Flink作业相关 - 数据湖探索 DLI
Flink作业相关 - 数据湖探索 DLI

stopFlinkJob(body); System.out.println(result); } 批量删除作业 DLI提供批量删除Flink作业的接口。您可以使用该接口批量删除任何状态的Flink作业。示例代码如下： 1 2 3 4 5 6 7 8 9 10

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
自动续费 - 数据湖探索 DLI
自动续费 - 数据湖探索 DLI

图2 续费管理为包年/包月资源开通自动续费。单个资源开通自动续费：选择需要开通自动续费的资源，单击操作列“更多 > 开通自动续费”。批量资源开通自动续费：选择需要开通自动续费的资源，单击列表左上角的“更多 > 开通自动续费”。选择续费时长，并根据需要设置自动续费次数，单击“开通”。

帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
Hudi表模型设计规范 - 数据湖探索 DLI

计算场景下采用MOR表模型。关于MOR表在读写性能的对比关系如下：对比维度 MOR表 COW表流式写高低流式读高低批量写高低批量读低高实时入湖，表模型采用MOR表。实时入湖一般的性能要求都在分钟内或者分钟级，结合Hudi两种表模型的对比，因此在实时入湖场景中需要选择MOR表模型。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Spark作业运维类 - 数据湖探索 DLI

有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] Spark作业运行大批量数据时上报作业运行超时异常错误使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常执行作业的用户数据库和表权限不足导致作业运行失败

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
Flink作业常用操作 - 数据湖探索 DLI

启动作业，有以下两种方式：启动单个作业选择一个作业，在对应的“操作”列中，单击“启动”。也可以在作业列表中，勾选一个作业，单击作业列表左上方的“启动”。批量启动作业勾选多个作业，单击作业列表左上方的“启动”，可以启动多个作业。单击“启动”后，跳转至“作业配置清单”页面。在“作业配置清单”

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Elasticsearch结果表 - 数据湖探索 DLI

max-actions 否批量写入时的每次最大写入记录数 connector.bulk-flush.max-size 否批量写入时的最大数据量，当前只支持MB，请带上单位 mb connector.bulk-flush.interval 否批量写入时的刷新的时间间隔，单位为milliseconds，无需带上单位

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Hudi数据表Clean规范 - 数据湖探索 DLI

retained设置的阈值。如果是Flink写hudi，则至少提交的checkpoint要超过这个阈值；如果是批写Hudi，则批写次数要超过这个阈值。建议 MOR表下游采用批量读模式，采用clean的版本数为compaction版本数+1。 MOR表一定要保证Compaction Plan能够被成功执行，Compaction

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
调用说明 - 数据湖探索 DLI
调用说明 - 数据湖探索 DLI

状态API，从而获取该异步操作API最终是否执行成功。同时数据湖探索还提供多种编程语言的SDK供您使用，SDK的使用方法请参见华为云开发工具包（SDK）。父主题： API使用前必读

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

Spark3.3.1基础镜像内置了3.1.62版本的huaweicloud-sdk-core。准备环境已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 pom文件配置中依赖包 <dependency> <groupId>com.huaweicloud.sdk</groupId>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

Browser+。下载地址请参考《对象存储服务工具指南》。安装OBS Browser+。安装步骤请参考《对象存储服务工具指南》。登录OBS Browser+。OBS Browser+支持AK方式登录，以及授权码登录两种登录方式。登录步骤请参考《对象存储服务工具指南》。通过OBS Browser+上传数据。

帮助中心 > 数据湖探索 DLI > 最佳实践
DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

本做了安全加固。为了避免依赖包兼容性问题或日志输出及转储问题，打包时请注意排除以下文件：系统内置的依赖包，或者在Maven或者Sbt构建工具中将scope设为provided 日志配置文件（例如l：“log4j.properties”或者“logback.xml”等）日志输出实现类JAR包（例如：log4j等）

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类

总条数： 118

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

SQL作业使用咨询 - 数据湖探索 DLI

队列相关API（废弃） - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

Flink作业相关 - 数据湖探索 DLI

自动续费 - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

Spark作业运维类 - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

调用说明 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线