搜索_华为云

在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

i_table'; 等待下方执行历史显示作业执行成功，代表建表成功，此时创建了一张Hudi的COW分区表。可以执行 SHOW TABLES 检查建表是否成功： SHOW TABLES; 执行SQL写入刚才创建的Hudi表： INSERT INTO hudi_table VALUES

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
GROUP BY中使用HAVING - 数据湖探索 DLI

GROUP BY中使用HAVING 功能描述利用HAVING子句在表分组后实现过滤。语法格式 1 2 3 SELECT attr_expr_list FROM table_reference GROUP BY groupby_expression[, groupby_expression…

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本功能描述对于Hive表，我们可以将其作为有界流读出。在这种情况下，Hive表只能在查询时跟踪其最新版本。最新版本的表保留了Hive表的所有数据。注意事项每个连接子任务都需要保留自己的Hive表缓存。请确保Hive表可以放入TM任务槽的内存中。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
在Spark SQL作业中使用UDF - 数据湖探索 DLI

SQL作业中使用UDF 操作场景 DLI支持用户使用Hive UDF（User Defined Function，用户定义函数）进行数据查询等操作，UDF只对单行数据产生作用，适用于一进一出的场景。约束限制在DLI Console上执行UDF相关操作时，需要使用自建的SQL队列。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

'driver'='com.mysql.jdbc.Driver')") 表1 创建表参数参数说明 url RDS的连接地址，需要先创建跨源连接，管理控制台操作请参考《数据湖探索用户指南》。创建经典型跨源连接后，使用经典型跨源连接中返回的连接地址。创建增强型跨源连接后，使用RDS提供的"内

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
清理多版本数据 - 数据湖探索 DLI

清理多版本数据功能描述多版本数据保留周期是在表每次执行insert overwrite或者truncate语句时触发，所以当表的多版本数据在保留周期时间外但是后续该表不会再执行insert overwrite或者truncate语句时，多版本保留周期外的数据不会自动清理。可以

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

fetch-size 否每次从数据库拉取数据的行数。默认值为0，表示忽略该提示示例使用gsjdbc4驱动连接时，加载的数据库驱动类为：org.postgresql.Driver。该驱动为默认，创建表时可以不填该驱动参数。表car_info没有在schema下时。 1 2 3

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

类型的数据保持原状，不使用科学计数法表示。例：0.000000027 默认会表示为 2.7E-8。当此选项设为 true 时，则会表示为 0.000000027。元数据元数据可以在 DDL 中作为只读（虚拟）meta 列声明。 Format的元数据只有在相应的连接器使用元数据时才可用。目前，只有Kafka连接器。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用CDM迁移数据至DLI - 数据湖探索 DLI

图2 选择连接器类型选择“云数据库 MySQL”后单击“下一步”，配置云数据库 MySQL连接的参数。单击“显示高级属性”可查看更多可选参数，具体请参见配置云数据库MySQL/MySQL数据库连接。这里保持默认，必填参数如表1所示。表1 MySQL连接参数参数名说明取值样例

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业提交Spark jar作业的场景需要手动配置由LakeFormation提供元数据服务的Hudi锁实现类，请参照 Hudi锁配置说明。登录DLI管理控制台，选择“作业管理 > Spark作业”，进入到Spark作业的界面。提交Hudi相关的Spark

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

Data Capture，变更日志数据捕获）工具，可以实时地将 MySQL 变更传输到其他系统。Canal 为变更日志提供了统一的数据格式，并支持使用 JSON 或 protobuf序列化消息（Canal 默认使用 protobuf）。 Flink 支持将 Canal 的 JSON

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

类型的数据保持原状，不使用科学计数法表示。例：0.000000027 默认会表示为 2.7E-8。当此选项设为 true 时，则会表示为 0.000000027。 canal-json.database.include 否 (none) String 一个可选的正则表达式，通过正则匹配

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
查看表统计信息 - 数据湖探索 DLI

FORMATTED：使用表格形式显示所有表的元数据。参数说明表1 参数描述参数描述 db_name Database名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以下划线开头。 table_name Database中的表名，由字母、数字和下划线（_）组成。不能是纯数字，且不能以下划线开头。匹配规则为：^(

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 查看表
在DLI使用Delta提交Spark Jar作业 - 数据湖探索 DLI

在DLI使用Delta提交Spark Jar作业 1. 添加如下依赖 <dependency> <groupId>io.delta</groupId> <artifactId>delta-core_2.12</artifactId> <version>2.3

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > DLI中使用Delta开发作业
创建并提交SQL作业 - 数据湖探索 DLI

创建数据库和表。您可以参考在DLI控制台创建数据库和表提前创建数据库和表。例如本例创建表，表名为“qw”。在SQL作业编辑窗口输入表“qw”的SQL查询语句： 1 SELECT * FROM qw.qw LIMIT 10; 或者双击左侧表名“qw”，上述查询语句会自动在作业编辑窗口中输入。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
DLI中使用Delta开发作业 - 数据湖探索 DLI

DLI中使用Delta开发作业 DLI Delta元数据在DLI使用Delta提交Spark Jar作业

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
使用DLI分析电商BI报表 - 数据湖探索 DLI

为保护用户的隐私和数据安全，所有数据均已进行了采样和脱敏。用户数据表1 用户数据字段名称字段类型字段说明取值范围 user_id int 用户ID 脱敏 age int 年龄段 -1表示未知 gender int 性别 0表示男 1表示女 2表示保密 rank Int 用户等级有顺序的级别枚举，越高级别数字越大

 帮助中心 > 数据湖探索 DLI > 最佳实践
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

资源，涉及VPC、DMS、DLI、RDS。步骤2：获取DMS连接地址并创建Topic。获取DMS Kafka实例连接地址并创建DMS Topic。步骤3：创建RDS数据库表。获取RDS实例内网地址，登录RDS实例创建RDS数据库及MySQL表。步骤4：创建DLI增强型跨源。

帮助中心 > 数据湖探索 DLI > 最佳实践
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

这可能会导致Flink查询得到错误的结果或意外的异常。因此，在这种情况下，建议将作业配置table.exec.source.cdc-events-duplicate设置为true，并在源表上定义PRIMARY KEY。Framework将生成一个额外的有状态操作符，并使用主键对变

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
管理SQL作业 - 数据湖探索 DLI
管理SQL作业 - 数据湖探索 DLI

数设置，标签，结果条数，已扫描数据，扫描数据条数，错误记录条数，存储路径，数据格式，数据库，表，表头，分隔符，引用字符，转义字符，日期格式，时间戳格式，CPU累计使用量，输出字节。建表（create table）作业（作业类型：DDL），包括以下信息：队列，作业ID，用户名，类

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业

总条数： 1211

上一页
1
2
3
4
5
...
61
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

GROUP BY中使用HAVING - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

清理多版本数据 - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

使用CDM迁移数据至DLI - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

查看表统计信息 - 数据湖探索 DLI

在DLI使用Delta提交Spark Jar作业 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

DLI中使用Delta开发作业 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

管理SQL作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线