搜索_华为云

开源Kafka输入流 - 数据湖探索 DLI

从Kafka读取对象为test的topic。数据编码格式为json且包含嵌套。本示例使用了复杂数据类型ROW，ROW使用语法可以参考数据类型。测试数据参考如下： { "id":"1", "type2":"online", "data":{ "patient_id":1234

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输入流
套餐包计费 - 数据湖探索 DLI
套餐包计费 - 数据湖探索 DLI

弹性资源池CU时套餐包按照“CU时”收取计算费用，用户在弹性资源池添加的队列上运行作业时按照弹性资源池CU时计费。适用于可预估队列使用量的场景、或测试项目等资源消耗不高的场景。弹性资源池CU时套餐包的额度按订购周期重置。存储量套餐包按照存储在DLI服务中的数据存储量（单位为“GB”）收取存储费用。

帮助中心 > 数据湖探索 DLI > 计费说明
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

型跨源，并绑定所要使用的Flink弹性资源池。设置Redis的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根据redis的地址测试队列连通性。若能连通，则表示跨源已经绑定成功，否则表示未成功。在Redis客户端中执行如下命令，向不同的key中插入数据，以hash形式存储：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
聚合函数概览 - 数据湖探索 DLI

col, p [, B]) DOUBLE 返回组内数字列近似的第p位百分数（包括浮点数），p值在[0,1]之间。参数B控制近似的精确度，B值越大，近似度越高，默认值为10000。当列中非重复值的数量小于B时，返回精确的百分数。 stddev_pop stddev_pop(col) DOUBLE

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 内置函数 > 聚合函数
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

型跨源，并绑定所要使用的Flink弹性资源池。设置Redis的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根据redis的地址测试队列连通性。若能连通，则表示跨源已经绑定成功，否则表示未成功。在Redis客户端中执行如下命令，向不同的key中插入数据，以hash形式存储：

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
作业开发 - 数据湖探索 DLI
作业开发 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ Spark作业访问MySQL数据库的方案如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 Spark jar 如何读取上传文件父主题： Spark作业相关问题

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相关问题
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

查询结果指定的OBS数据目录包含数据文件。在OBS桶“dli-test-021”根目录下创建数据文件目录“data2”。创建如下内容的测试数据文件“test.csv”，并上传文件到“obs://dli-test-021/data2”目录下。 Jordon,88,23 Kim,87

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
创建弹性资源池 - 数据湖探索 DLI

弹性资源池名称不区分大小写，系统会自动转换为小写。规格基础版：16-64CUs规格适用于对资源消耗不高、对资源高可靠性和高可用性要求不高的测试场景。不支持高可靠与高可用。不支持设置队列属性和作业优先级。不支持对接Notebook实例。标准版：64CUs及以上规格具备强大

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

单击“确定”完成添加队列配置。步骤2：OBS桶文件配置如果需要创建OBS表，则需要先上传数据到OBS桶目录下。本次演示的样例代码创建了OBS表，测试数据内容参考如下示例，创建名为的testdata.csv文件。 12,Michael 27,Andy 30,Justin 进入OBS管理控

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

如果为 true，则根据拆分数推断源并行度。如果为 false，则源的并行度由 config 设置。 table.exec.hive.infer-source-parallelism.max 1000 Integer 设置源运算符的最大推断并行度。 Load Partition Splits

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
迁移RDS数据至DLI - 数据湖探索 DLI

tabletest VALUES ('456','efg'); insert into tabletest VALUES ('789','hij'); 查询测试的表数据。 select * from tabletest; 图1 查询RDS表数据在DLI上创建数据库和表。登录DLI管理控制台，选

 帮助中心 > 数据湖探索 DLI > 用户指南 > 迁移外部数据源数据至DLI
迁移RDS数据至DLI - 数据湖探索 DLI

tabletest VALUES ('456','efg'); insert into tabletest VALUES ('789','hij'); 查询测试的表数据。 select * from tabletest; 图1 查询RDS表数据在DLI上创建数据库和表。登录DLI管理控制台，选

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据迁移
迁移Kafka数据至DLI - 数据湖探索 DLI

ig/producer.properties 上述命令中的“Kafka角色实例所在节点的IP地址”即为4中获取的Kafka实例IP。发送测试消息内容如下： {"PageViews":5, "UserID":"4324182021466249494", "Duration":146

帮助中心 > 数据湖探索 DLI > 用户指南 > 迁移外部数据源数据至DLI
使用DLI进行车联网场景驾驶行为数据分析 - 数据湖探索 DLI

表中；同时您也可以将文件或文件夹拖拽到指定的目录上，这样可以上传到指定的目录中。单击Best_Practice_01.zip获取本示例的测试数据，将“Best_Practice_01.zip”压缩包解压。后续操作说明如下：详单数据：将解压后Data目录下的“detail-re

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析
迁移Kafka数据至DLI - 数据湖探索 DLI

ig/producer.properties 上述命令中的“Kafka角色实例所在节点的IP地址”即为4中获取的Kafka实例IP。发送测试消息内容如下： {"PageViews":5, "UserID":"4324182021466249494", "Duration":146

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据迁移
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

开发流程说明序号阶段操作界面说明 1 创建DLI通用队列 DLI控制台创建作业运行的DLI队列。 2 上传数据到OBS桶 OBS控制台将测试数据上传到OBS桶下。 3 新建Maven工程，配置pom文件 IntelliJ IDEA 参考样例代码说明，编写程序代码读取OBS数据。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
查询作业列表 - 数据湖探索 DLI

用，指定作业运行使用的DLI基础Flink镜像的版本。 operator_config 否 String 各算子并行度参数，以json的形式展示各算子id和并行度。 static_estimator_config 否 String 静态流图资源预估参数，以json的形式展示。 real_cu_number

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

根据MySQL和kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据MySQL和kafka的地址测试队列连通性。若能连通，则表示跨源已经绑定成功；否则表示未成功。在MySQL的flink数据库下创建表order_count，创建语句如下：

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

根据MySQL和kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据MySQL和kafka的地址测试队列连通性。若能连通，则表示跨源已经绑定成功；否则表示未成功。在MySQL的flink数据库下创建表order_count，创建语句如下：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

根据MySQL和kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据MySQL和kafka的地址测试队列连通性。如果能连通，则表示跨源已经绑定成功；否则表示未成功。在MySQL的flink数据库下创建表order_count，创建语句如下：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML

总条数： 244

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开源Kafka输入流 - 数据湖探索 DLI

套餐包计费 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

聚合函数概览 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

作业开发 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

创建弹性资源池 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

迁移RDS数据至DLI - 数据湖探索 DLI

迁移RDS数据至DLI - 数据湖探索 DLI

迁移Kafka数据至DLI - 数据湖探索 DLI

使用DLI进行车联网场景驾驶行为数据分析 - 数据湖探索 DLI

迁移Kafka数据至DLI - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线