搜索_华为云

DLI中使用Hudi开发作业 - 数据湖探索 DLI

DLI中使用Hudi开发作业在DLI使用Hudi提交Spark SQL作业在DLI使用Hudi提交Spark Jar作业在DLI使用Hudi提交Flink SQL作业使用HetuEngine on Hudi

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
从Kafka读取数据写入到RDS - 数据湖探索 DLI

0/16，单击“确定”完成安全组规则添加。 Kafka和RDS实例属于同一VPC和子网下？是，执行7。Kafka和RDS实例在同一VPC和子网，不用再重复创建增强型跨源连接。否，执行5。Kafka和RDS实例分别在两个VPC和子网下，则要分别创建增强型跨源连接打通网络。登录D

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
DLI中使用Delta开发作业 - 数据湖探索 DLI

DLI中使用Delta开发作业 DLI Delta元数据在DLI使用Delta提交Spark Jar作业

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

使用Temporal join关联维表的最新分区功能描述对于随时间变化的分区表，我们可以将其读取为无界流，如果每个分区包含某个版本的完整数据，则该分区可以被视为时间表的一个版本，时间表的版本保留了分区的数据。Flink支持在处理时间关联中自动跟踪时间表的最新分区（版本）。最新分区（版本）由 'streaming-source

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

Flink有什么区别？ DLI Flink是天然的云原生基础架构。在内核引擎上DLI Flink进行了多处核心功能的优化，并且提供了企业级的一站式开发平台，自带开发和运维功能，免除自建集群运维的麻烦；在connector方面除了支持开源connector之外，还可以对接云上Mysql、GaussDB、MRS

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
从Kafka读取数据写入到DWS - 数据湖探索 DLI

0/16，单击“确定”完成安全组规则添加。 Kafka和DWS实例属于同一VPC和子网下？是，执行7。Kafka和DWS实例在同一VPC和子网，不用再重复创建增强型跨源连接。否，执行5。Kafka和DWS实例分别在两个VPC和子网下，则要分别创建增强型跨源连接打通网络。登录D

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
使用SQL作业模板开发并提交SQL作业 - 数据湖探索 DLI

DLI支持定制模板或将正在使用的SQL语句保存为模板，便捷快速的执行SQL操作。开发指导 Spark SQL语法参考提供SQL数据库、表、分区、导入及导出数据、自定义函数、内置函数等语法说明和样例指导。使用Spark作业访问DLI元数据提供SQL作业开发的操作指引和样例代码参考。 Spark SQL 相关API

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

0/16，单击“确定”完成安全组规则添加。 Kafka和CSS实例属于同一VPC和子网下？是，执行7。Kafka和CSS实例在同一VPC和子网，不用再重复创建增强型跨源连接。否，执行5。Kafka和CSS实例分别在两个VPC和子网下，则要分别创建增强型跨源连接打通网络。登录D

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
SQL作业使用咨询 - 数据湖探索 DLI

L作业会被系统按超时取消处理。用户可以通过dli.sql.job.timeout（单位是秒）参数配置超时时间。 DLI支撑本地测试Spark作业吗? DLI暂不支持本地测试Spark作业，您可以安装DLI Livy工具，通过Livy工具提供的交互式会话能力调测Spark作业。推荐使用使用Livy提交Spark

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

整体作业开发流程整体作业开发流程参考图1。图1 作业开发流程步骤1：创建队列：创建DLI作业运行的队列。步骤2：创建RDS Postgres数据库：创建RDS Postgres的数据库和表。步骤3：创建DWS数据库和表：创建用于接收数据的DWS数据库和表。步骤4：

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Hudi数据表Compaction规范 - 数据湖探索 DLI

对于在•Hudi表采用异步Compaction和•采用Spark异步执行Compaction，不...中提到的异步Compaction任务，这里给出以下开发建议：不需要对每张Hudi表都开发异步Compaction任务，这样会导致作业开发成本上升。异步Compaction任务可以通过提交Spark

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

集群。整体作业开发流程整体作业开发流程参考图1。图1 作业开发流程步骤1：创建队列：创建DLI作业运行的队列。步骤2：创建RDS MySQL数据库和表：创建RDS MySQL的数据库和表。步骤3：创建DWS数据库和表：创建用于接收数据的DWS数据库和表。步骤4：创建

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
SQL作业运行慢如何定位 - 数据湖探索 DLI

接。在Stage中，可以看到每一个Task开始运行时间“Launch Time”，以及Task运行耗时时间“Duration”。单击“Duration”，可以根据耗时进行排序，排查是否存在单个Task耗时过长导致整体作业时间变长问题。参考图10可以看到数据倾斜时，单个任务的

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
CREATE TABLE语句 - 数据湖探索 DLI

发出到目前为止已观察到的最大时间戳的 watermark ，时间戳大于最大时间戳的行被认为没有迟到。递增时间戳： WATERMARK FOR rowtime_column AS rowtime_column - INTERVAL '0.001' SECOND。发出到目前为止已观察到的最大时间戳减 1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
DLI SDK功能矩阵 - 数据湖探索 DLI

DLI SDK功能矩阵 SDK开发指南指导您如何安装和配置开发环境、如何通过调用DLI SDK提供的接口函数进行二次开发。 Java、Python SDK功能矩阵请参见表1 表1 SDK功能矩阵语言功能内容 Java OBS授权介绍将OBS桶的操作权限授权给DLI的Java

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

用2019.1或其他兼容版本。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。开发流程 DLI进行Spark作业访问DLI元数据开发流程参考如下：图1 Spark作业访问DLI元数据开发流程表2 开发流程说明序号阶段操作界面说明 1 创建DLI通用队列

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

跨源连接状态图13 详情测试队列与RDS、DMS实例连通性。单击“队列管理”，选择您所使用的队列，单击“操作”列中的“更多”>“测试地址连通性”。图14 检测地址连通性输入DMS Kafka实例连接地址和步RDS MySQL实例内网地址，进行网络连通性测试。测试结果显示可达，则D

帮助中心 > 数据湖探索 DLI > 最佳实践
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

性能，配置间隔时间需权衡对业务的性能影响及恢复时长，最好大于Checkpoint的完成时间，建议设置为5分钟。 Exactly Once模式保证每条数据只被消费一次，At Least Once模式每条数据至少被消费一次，请依据业务情况选择。勾选“异常自动恢复”和“从Checkp

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
SparkSQL建表参数规范 - 数据湖探索 DLI

SparkSQL建表参数规范规则建表必须指定primaryKey和preCombineField。 Hudi表提供了数据更新的能力和幂等写入的能力，该能力要求数据记录必须设置主键用来识别重复数据和更新操作。不指定主键会导致表丢失数据更新能力，不指定preCombineField会导致主键重复。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

目前path支持如下表达式参考下表表3。表3 json_path参数支持的表达式表达式说明 $ 根对象 [] 数组下标 * 数组通配符 . 取子元素示例测试输入数据。测试数据源kafka，具体消息内容参考如下： {"name":"James","age":24,"gender":"male","grade":{"math":95

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数

总条数： 538

上一页
1
2
3
4
5
...
27
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI中使用Hudi开发作业 - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

DLI中使用Delta开发作业 - 数据湖探索 DLI

使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

从Kafka读取数据写入到DWS - 数据湖探索 DLI

使用SQL作业模板开发并提交SQL作业 - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

SQL作业使用咨询 - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

DLI SDK功能矩阵 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线