搜索_华为云

使用DEW管理数据源访问凭证 - 数据湖探索 DLI

= 'jdbc:mysql://MySQLAddress:MySQLPort/flink',--其中url中的flink表示MySQL中orders表所在的数据库名 'table-name' = 'orders', 'username' = 'MySQLUsername'

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

= 'jdbc:mysql://MySQLAddress:MySQLPort/flink',--其中url中的flink表示MySQL中orders表所在的数据库名 'table-name' = 'orders', 'username' = 'MySQLUsername'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate 执行overwrite时是否不删除原表，直接执行清空表操作，取值范围： true false 默认为'false'，即在执行overwrite操作时，先将原表删除再重新建表。 isolationLevel

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。执行SQL作业请选择SQL队列。执行Flink或Spark作业请选择通用队列。 _ 执行引擎 SQL队列可以选择队列引擎为Spark或者HetuEngine。 _ 企业项目选择对应的企业项目。

帮助中心 > 数据湖探索 DLI > 快速入门
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

'connector.url' = 'jdbc:mysql://xx.xx.xx.xx:3306/xx', 'connector.table' = 'jdbc_table_name', 'connector.driver' = 'com.mysql.jdbc.Driver', 'connector

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

“立即启动”开始执行作业。等待作业运行完成，作业状态显示为“已完成”。登录RDS控制台，单击RDS数据库实例，单击创建的数据库名，如“test2”，在创建的表“tabletest2”所在行的“操作”列，单击“SQL查询”。在“SQL查询”界面，单击“执行SQL”，查看RDS表数据已写入成功。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

Handler 的子类进行失败处理。 sink.flush-on-checkpoint 否 true Boolean 在进行 checkpoint 时是否保证刷出缓冲区中的数据。如果关闭这一选项，在进行checkpoint时 sink 将不再为所有进行中的请求等待 Elasticsearch

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

当您使用insert overwrite语句覆盖分区表的数据时，如果发现它覆盖了全量数据而不是预期的分区数据，这可能是因为动态分区覆盖功能没有被启用。如果需要动态覆盖DataSource表指定的分区数据，您需要先配置参数 dli.sql.dynamicPartitionOverwrite

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
查询作业执行进度信息 - 数据湖探索 DLI

正在运行的子作业ID，如果作业还没开始运行或者运行结束，则子作业ID可能为空。 progress 否 Double 正在运行的子作业的进度或者整个作业进度，该值只能粗略的估算子作业进度，不表示作业的详细进度。如果整个作业刚开始运行或者在提交中，则进度展示为0；如果作业运行结束，

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

所产生的请求次数和流量大小有关，请根据自己的业务进行预估。 DLI 在创建SQL作业前需购买队列，使用DLI的队列资源时，按照队列CU时进行计费。如购买按需计费的队列，在使用队列资源时，按照队列CU时进行计费。以小时为单位进行结算。不足一小时按一小时计费，小时数按整点计算。队

 帮助中心 > 数据湖探索 DLI > 最佳实践
Hive方言 - 数据湖探索 DLI
Hive方言 - 数据湖探索 DLI

之间切换来执行不同语句的情况。详情可参考：Apache Flink Hive 方言功能描述 Flink目前支持两种SQL 方言: default 和 hive。您需要先切换到Hive 方言，然后才能使用Hive语法编写。下面介绍如何使用SQL设置方言。您可以为执行的每个语句动

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Spark作业开发类 - 数据湖探索 DLI

Spark作业的实际资源使用情况将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？如何在DLI中运行复杂PySpark程序？如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 Spark jar 如何读取上传文件

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
pyspark样例代码 - 数据湖探索 DLI

提交Spark作业将写好的python代码文件上传至OBS桶中。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。创建Spark作业完成后，在控制台单击右上角“执行”提交作业，页面显示“批处理作业提交成功”说明Spark作业提交成功，可以在Spark作业管理页面查看提交的作业的状态和日志。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
入门实践 - 数据湖探索 DLI
入门实践 - 数据湖探索 DLI

OpenSource SQL作业从Kafka读取数据写入到Elasticsearch的开发示例。从MySQL CDC源表读取数据写入到DWS 介绍使用Flink OpenSource SQL作业从MySQL CDC源表读取数据写入到DWS的开发示例。从PostgreSQL CDC源表读取数据写入到DWS

帮助中心 > 数据湖探索 DLI > 快速入门
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

'url' = 'jdbc:mysql://MySQLAddress:MySQLPort/flink',--flink为RDS MySQL创建的数据库名 'table-name' = 'orders', 'username' = 'MySQLUsername', 'password'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
了解数据目录、数据库和表 - 数据湖探索 DLI

了解数据目录、数据库和表数据库和表是SQL作业、Spark作业场景开发的基础，在执行作业前您需要根据业务场景定义数据库和表。 Flink支持动态数据类型，可以在运行时定义数据结构，不需要事先定义元数据。数据目录数据目录（Catalog）是元数据管理对象，它可以包含多个数据库。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
Java SDK - 数据湖探索 DLI
Java SDK - 数据湖探索 DLI

Java SDK Java SDK概述 Java SDK环境配置 OBS授权队列相关资源相关 SQL作业相关 Flink作业相关 Spark作业相关 Flink作业模板相关

 帮助中心 > 数据湖探索 DLI > SDK参考
查询CSS表 - 数据湖探索 DLI
查询CSS表 - 数据湖探索 DLI

SELECT命令用于查询CSS表中的数据。语法格式 1 SELECT * FROM table_name LIMIT number; 关键字 LIMIT：对查询结果进行限制，number参数仅支持INT类型。注意事项所查询的表必须是已经存在的表，否则会出错。示例查询表dli_to_css中的数据。 1

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

partitions参数提高并行度操作场景 Spark作业在执行shuffle类语句，包括group by、join等场景时，常常会出现数据倾斜的问题，导致作业任务执行缓慢。该问题可以通过设置spark.sql.shuffle.partitions提高shuffle read task的并行度来进行解决。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
查询作业模板列表 - 数据湖探索 DLI

每页显示的最大结果行数，范围: [1, 100]。默认值为：50。 current-page 否 Integer 当前页码，默认为第一页。请求参数无响应参数表3 响应参数参数参数类型说明 is_success Boolean 执行请求是否成功。“true”表示请求执行成功。 message

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API

总条数： 882

上一页
1
2
3
4
5
...
45
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DEW管理数据源访问凭证 - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

Elasticsearch - 数据湖探索 DLI

为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

查询作业执行进度信息 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

Hive方言 - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

入门实践 - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

Java SDK - 数据湖探索 DLI

查询CSS表 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

查询作业模板列表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线