搜索_华为云

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

实现相应的处理逻辑，以实现各个指标的统计。为了简化最终的处理逻辑，使用创建视图进行数据预处理。利用over窗口条件和过滤条件结合以去除重复数据（该方式是利用了top N的方法），同时利用相应的内置函数concat和substr将当天的00:00:00作为统计的开始时间，当天的23:59:59作为统计结束时间，并

 帮助中心 > 数据湖探索 DLI > 最佳实践
Hudi表索引设计规范 - 数据湖探索 DLI

处于单task读写可接受范围之内。如果是单个Bucket的数据量超过了该值范围，可能会有什么影响？读写任务可能会出现OOM的问题，解决方法就是提升单个task的内存占比。读写性能下降，因为单个task的处理的数据量变大，导致处理耗时变大。父主题： Hudi数据表设计规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
DWS结果表（不推荐使用） - 数据湖探索 DLI

DWS的更多信息，请参见《数据仓库服务管理指南》。推荐使用DWS服务自研的DWS Connector。 DWS-Connector的使用方法请参考dws-connector-flink。前提条件创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
配置SQL防御规则 - 数据湖探索 DLI

可进行日志分析，评估现网SQL质量，提前感知潜在SQL风险，并做出有效预防措施。本节操作介绍创建SQL防御规则以增加SQL防御能力的配置方法。 DLI SQL防御规则约束与限制仅Spark 3.3.x及以上版本支持SQL防御功能。同一个队列，同一个动作的防御规则仅支持创建一条。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
使用Hive语法创建OBS表 - 数据湖探索 DLI

apache.hadoop.hive.contrib.serde2.MultiDelimitSerDe时，字段分隔符才支持设置为多字符。使用方法参考示例7：创建表并设置多字符的分割符。参数说明表2 参数说明参数是否必选描述 db_name 否 Database名称。由字

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
自定义函数参数传递 - 数据湖探索 DLI

SQL编辑页面，自定义配置中修改该参数值，即可达到快速修改UDF参数值的目的。操作步骤自定义函数中提供了可选的open(FunctionContext context)方法，FunctionContext具备参数传递功能，自定义配置项通过此对象来传递。自定义函数的参数传递操作步骤如下：在Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

且会以相同的格式输出。 ogg-json.map-null-key.mode 否 'FAIL' String 指定处理 Map 中 key 值为空的方法. 当前支持的值有 'FAIL', 'DROP' 和 'LITERAL': Option 'FAIL' 将抛出异常。 Option 'DROP'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
自定义函数参数传递 - 数据湖探索 DLI

SQL编辑页面，自定义配置中修改该参数值，即可达到快速修改UDF参数值的目的。操作步骤自定义函数中提供了可选的open(FunctionContext context)方法，FunctionContext具备参数传递功能，自定义配置项通过此对象来传递。自定义函数的参数传递操作步骤如下：在Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
了解数据目录、数据库和表 - 数据湖探索 DLI

数据库是一个框架，表是其实质内容。一个数据库包含一个或者多个表。用户可通过管理控制台或SQL语句创建数据库和表，其中SQL语句的操作方法请参见创建数据库、创建OBS表和创建DLI表等。本章节介绍在管理控制台创建数据库和表的操作步骤。创建数据库和表时，有权限控制，需要对其他

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
从Kafka读取数据写入到RDS - 数据湖探索 DLI

步骤6：发送数据和查询结果使用Kafka客户端向步骤2：创建Kafka的Topic中的Topic发送数据，模拟实时数据流。 Kafka生产和发送数据的方法请参考：DMS - 连接实例生产消费信息。发送样例数据如下： {"user_id":"0001", "user_name":"Alice"

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

123'，并以相同的格式输出时间戳。 canal-json.map-null-key.mode 否 'FALL' String 指定处理 Map 中 key 值为空的方法. 当前支持的值有'FAIL', 'DROP'和 'LITERAL'。 Option 'FAIL' 将抛出异常，如果遇到 Map 中 key

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用DLI分析电商BI报表 - 数据湖探索 DLI

"obs://DLI-demo/data/JData_User") 上述SQL语句中的文件路径为实际存放数据的OBS路径。单击“执行”，创建用户信息表user。用相同的方法创建商品表，评价表，行为表。商品表 create table product( product_id int, a1 int,

帮助中心 > 数据湖探索 DLI > 最佳实践
JSON函数 - 数据湖探索 DLI
JSON函数 - 数据湖探索 DLI

{ NULL | ERROR | DEFAULT <defaultExpr> } ON ERROR ]) 从JSON字符串中提取标量。此方法在JSON字符串中搜索给定的路径表达式，如果该路径上的值是标量，则返回该值。如果不是标量值，则无法返回。默认情况下，该值以STRING类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

“安全组”章节。 Flink跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证。跨源认证简介及操作方法请参考跨源认证简介。注意事项创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

Kafka源表功能描述创建source流从Kafka获取数据，作为作业的输入数据。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

“安全组”章节。 Flink跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证。跨源认证简介及操作方法请参考跨源认证简介。注意事项创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Confluent Avro Format - 数据湖探索 DLI

cs的地址-->测试）。若能连通，则表示跨源已经绑定成功；否则表示未成功。购买ecs集群，并下载5.5.2版本的confluent（https://packages.confluent.io/archive/5.5/）和jdk1.8.0_232，并上传到购买的ecs集群中，然后

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

创建OBS表的Hive语法可以参考使用Hive语法创建OBS表。使用DataSource语法创建OBS表以下通过创建CSV格式的OBS表举例，创建其他数据格式的OBS表方法类似，此处不一一列举。创建OBS非分区表指定OBS数据文件，创建csv格式的OBS表。按照以下文件内容创建“test.csv”文件，并将“test

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

约束与限制弹性资源池约束限制更多弹性资源池约束限制请参考弹性资源池使用约束限制。表1 弹性资源池约束限制限制项说明资源规格当前弹性资源池最大的计算资源 32000CUs。弹性资源池中可创建队列的最小CU：通用队列：4CUs SQL队列：Spark SQL队列：8CUs；HetuEngine

帮助中心 > 数据湖探索 DLI > 产品介绍
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

“安全组”章节。 Flink跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证。跨源认证简介及操作方法请参考跨源认证简介。注意事项创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表

总条数： 229

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

DWS结果表（不推荐使用） - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

JSON函数 - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线