搜索_华为云

DLI常用跨源分析开发方式 - 数据湖探索 DLI

DLI常用跨源分析开发方式跨源分析当DLI有访问外部数据源的业务需求时，首先需要通过建立增强型跨源连接，打通DLI与数据源之间的网络，再开发不同的作业访问数据源以实现DLI跨源分析。本节操作介绍DLI支持的数据源对应的开发方式。使用须知 Flink作业访问DIS，OBS和

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
DLI程序包标签管理 - 数据湖探索 DLI

DLI程序包标签管理标签是用户自定义的、用于标识云资源的键值对，它可以帮助用户对云资源进行分类和搜索。标签由标签“键”和标签“值”组成。 DLI支持对程序包组或程序包添加标签。在DLI管理控制台单击“数据管理 > 程序包管理”。选择程序包，单击操作列的“更多 > 标签”，显示当前程序包组或程序包的标签信息。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
修改DLI程序包所有者 - 数据湖探索 DLI

修改DLI程序包所有者 DLI提供了修改程序包组或程序包的所有者的功能。登录DLI管理控制台，选择“数据管理 > 程序包管理”。在“程序包管理”页面，单击程序包“操作 ”列中的“更多 > 修改所有者”。如果该程序包进行过分组设置，选择“组”或者“程序包”进行修改。图1 修改程序包所有者

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

Capture，变更数据捕获）的工具，可以把来自 MySQL、PostgreSQL、Oracle、Microsoft SQL Server 和许多其他数据库的更改实时流式传输到 Kafka 中。 Debezium 为变更日志提供了统一的格式结构，并支持使用 JSON 和 Apache Avro 序列化消息。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

sum; } } } 图8 编写UDAF函数代码编写调试完成代码后，通过IntelliJ IDEA工具编译代码并导出Jar包。单击工具右侧的“Maven”，参考下图分别单击“clean”、“compile”对代码进行编译。编译成功后，单击“package”对代码进行打包。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

查看监控指标 06 开发您可以使用客户端或第三方BI工具对接DLI，以及通过DLI跨源连接进行数据分析。客户端工具操作指导使用Spark-submit提交作业使用UDF操作指导第三方BI工具对接DLI 配置BI工具连接DLI 跨源数据分析操作指导概述对接HBase 对接OpenTSDB

帮助中心 > 数据湖探索 DLI > 成长地图
入门实践 - 数据湖探索 DLI
入门实践 - 数据湖探索 DLI

入门实践我们整理了从队列网络连通、不同类型的作业分析、数据迁移场景的常用开发指南和最佳实践内容，帮助您更好的使用DLI进行大数据分析和处理。表1 DLI常用开发指南与最佳实践场景操作指导描述 Spark SQL作业开发使用Spark SQL作业分析OBS数据介绍使用Spark

帮助中心 > 数据湖探索 DLI > 快速入门
使用DLI分析电商BI报表 - 数据湖探索 DLI

Browser+。下载地址请参考《对象存储服务工具指南》。安装OBS Browser+。安装步骤请参考《对象存储服务工具指南》。登录OBS Browser+。OBS Browser+支持AK方式登录，以及授权码登录两种登录方式。登录步骤请参考《对象存储服务工具指南》。通过OBS Browser+上传数据。

帮助中心 > 数据湖探索 DLI > 最佳实践
DataGen - 数据湖探索 DLI
DataGen - 数据湖探索 DLI

max-past”参数指定相对当前时间向过去偏移的最大值。 sequence表示有界的序列生成器。您可以通过“fields.#.start”和“fields.#.end”指定序列的起始和结束值，当序列数字达到结束值时，就不会再生成数据。 fields.#.min 否 '#'号指定的字段类型的最小值

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Hudi Clustering操作说明 - 数据湖探索 DLI

出来做Clustering。 hoodie.clustering.plan.strategy.sort.columns=${排序列1,......,排序列n} // 无默认值，根据业务场景指定。指定为查询业务经常使用且不包含null的列。 hoodie.clustering.plan

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

ttle-endian'。更多细节可查阅字节序。数据类型映射下表详细说明了这种格式支持的 SQL 类型，包括用于编码和解码的序列化类和反序列化类的详细信息。表2 数据类型映射 Flink SQL 类型值 CHAR / VARCHAR / STRING UTF-8（默认）编码的文本字符串。编码字符集可以通过

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

数。排名在序列中不一定连续。 DENSE_RANK() 返回值在一组值中的排名。结果是一加先前分配的等级值。与函数 rank 不同，dense_rank 不会在排名序列中产生间隙。 ROW_NUMBER() 在窗口分区内根据 rows 的排序为每一行分配一个唯一的序列号，从一开始。ROW_NUMBER

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
DataGen源表 - 数据湖探索 DLI
DataGen源表 - 数据湖探索 DLI

生成器。 sequence生成器，您可以通过“fields.#.start”和“fields.#.end”指定序列的起始和结束值。sequence是有界的生成器，当序列数字达到结束值，读取结束。 fields.#.min 否 '#'号指定的字段类型的最小值 '#'号指定的字段类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

基于ModelArts提供的MindSpore预置镜像，并借助ModelArts命令行工具，通过加载镜像构建模板并修改Dockerfile，构建出一个新镜像，最后注册后在Notebook使用。 ModelArts命令行工具请参考ma-cli镜像构建命令介绍。基础镜像地址：swr.{endpo

帮助中心 > 数据湖探索 DLI > 用户指南
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

Debezium Format 功能描述 Debezium是一个 CDC（Changelog Data Capture，变更数据捕获）的工具，可以把其他数据库的更改实时流式传输到 Kafka 中。 Debezium 为变更日志提供了统一的格式结构，并支持使用 JSON消息。 Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
rand - 数据湖探索 DLI
rand - 数据湖探索 DLI

否 INT类型。参数seed的格式包括浮点数格式、整数格式、字符串格式。如果指定种子seed，在相同运行环境下，将会得到一个稳定的随机数序列。返回值说明返回DOUBLE类型的值。示例代码返回0.3668915240363728。 select rand(); 返回0.25738143505962285。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

A样例代码演示将kafka数据处理后写入到OBS，具体参数配置请根据实际环境修改。环境准备已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 Maven工程的pom.xml文件配置请参考JAVA样例代码（Flink 1.12）中“pom文件配置”说明。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

</dependency> 注意事项暂不支持通过python写UDF、UDTF、UDAF自定义函数。如果使用IntelliJ IDEA工具对创建的自定义函数进行调试，则需要在IDEA上勾选：include dependencies with "Provided" scope，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
测试地址连通性 - 数据湖探索 DLI

测试地址连通性 DLI提供的“测试地址连通性”用于验证DLI队列与目标地址之间的网络连通性。常用于读写外部数据源场景，在配置了跨源连接后，检验DLI队列与绑定的跨源对端地址之间的通信能力。测试队列与数据源地址连通性登录DLI管理控制台，选择“资源管理 > 队列管理”。在“

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
Over聚合 - 数据湖探索 DLI
Over聚合 - 数据湖探索 DLI

作为上边界。有两种方法可以定义范围：ROWS 间隔和 RANGE 间隔： RANGE 间隔 RANGE 间隔是定义在排序列值上的，在 Flink 里，排序列总是一个时间属性。下面的 RANG 间隔定义了聚合会在比当前行的时间属性小 30 分钟的所有行上进行。 RANGE BETWEEN

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML

总条数： 179

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI常用跨源分析开发方式 - 数据湖探索 DLI

DLI程序包标签管理 - 数据湖探索 DLI

修改DLI程序包所有者 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

入门实践 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

DataGen - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

DataGen源表 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

rand - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

测试地址连通性 - 数据湖探索 DLI

Over聚合 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线