搜索_华为云

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

最新成功的Checkpoint文件恢复内部状态和消费位点，保证数据不丢失及聚合算子等内部状态的精确一致语义。同时，为了保证数据不重复，建议使用带主键数据库或者文件系统作为目标数据源，否则下游处理业务需要加上去重逻辑（最新成功Checkpoint记录位点到异常时间段内的数据会重复消费）。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

e(fs.special_start_time), 'yyyymmdd') = substr('20220601',1,8) 解决措施在使用join进行多表关联查询时，不管表数据量大小，join时都需要指定on条件来减少多表关联的数据量，从而减轻队列的负荷，提升查询效率。例如

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

在“连接信息”中获取该Kafka的“内网连接地址”，在“基本信息”的“网络”中获取获取该实例的“虚拟私有云”和“子网”信息，方便后续操作步骤使用。单击“网络”中的安全组名称，在“入方向规则”中添加放通队列网段的规则。例如，本示例队列网段为“10.0.0.0/16”，则规则添加为：

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink OpenSource SQL作业开发指南
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

password' = '' ); 参数说明表1 参数说明参数是否必选说明 connector.type 是数据源类型，‘jdbc’表示使用JDBC connector，必须为jdbc connector.url 是数据库的URL connector.table 是读取数据库中的数据所在的表名

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

SUM(amount) FROM Orders GROUP BY GROUPING SETS ((user), (product)); GROUP BY中使用HAVING过滤功能描述利用HAVING子句在表分组后实现过滤。语法格式 1 2 3 4 5 SELECT [ ALL | DISTINCT

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

SUM(amount) FROM Orders GROUP BY GROUPING SETS ((user), (product)); GROUP BY中使用HAVING过滤功能描述利用HAVING子句在表分组后实现过滤。语法格式 1 2 3 4 5 SELECT [ ALL | DISTINCT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

SUM(amount) FROM Orders GROUP BY GROUPING SETS ((user), (product)); GROUP BY中使用HAVING过滤功能描述利用HAVING子句在表分组后实现过滤。语法格式 1 2 3 4 5 SELECT [ ALL | DISTINCT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

SUM(amount) FROM Orders GROUP BY GROUPING SETS ((user), (product)); GROUP BY中使用HAVING过滤功能描述利用HAVING子句在表分组后实现过滤。语法格式 1 2 3 4 5 SELECT [ ALL | DISTINCT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
创建Hbase维表 - 数据湖探索 DLI
创建Hbase维表 - 数据湖探索 DLI

如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。若使用MRS HBase，请在增强型跨源的主机信息中添加MRS集群所有节点的主机ip信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
parse - 数据湖探索 DLI
parse - 数据湖探索 DLI

com/path1/p.php?k1=v1&k2=v2#Ref1', 'HOST') 返回 'facebook.com'.。当第二个参数为QUERY时，可以使用第三个参数提取特定参数的值，例如： parse_url('http://facebook.com/path1/p.php?k1=v1&k2=v2#Ref1'

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 内置函数 > 字符串函数
插入数据至DCS表 - 数据湖探索 DLI

with_key_column:Michael的表：如果在建表时没有指定“key.column”，则在Redis中的key name将会使用uuid。例如： 1 2 3 4 5 6 7 create table test_redis(name string, age int) using

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 跨源连接DCS表
插入数据至DCS表 - 数据湖探索 DLI

with_key_column:Michael的表：如果在建表时没有指定“key.column”，则在Redis中的key name将会使用uuid。例如： 1 2 3 4 5 6 7 create table test_redis(name string, age int) using

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DCS表
parse - 数据湖探索 DLI
parse - 数据湖探索 DLI

com/path1/p.php?k1=v1&k2=v2#Ref1', 'HOST') 返回 'facebook.com'.。当第二个参数为QUERY时，可以使用第三个参数提取特定参数的值，例如： parse_url('http://facebook.com/path1/p.php?k1=v1&k2=v2#Ref1'

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

段名，hashvalue为源表的字段值。 connector.use-internal-schema 否 table存储模式下可配置，是否使用redis中已存在schema，默认为false。 connector.key-column 否 table存储模式下可配置，将该字段值作

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

学习的算法库（具体可以参考”数据湖探索 DLI > 用户指南> 数据管理> 程序包管理> 内置依赖包”），这些常用算法库满足了大部分用户的使用场景。对于用户的PySpark程序依赖了内置算法库未提供的程序库该如何呢？其实PySpark本身就已经考虑到这一点了，那就是基于PyFiles来指定依赖，在DLI

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
创建Hbase维表 - 数据湖探索 DLI
创建Hbase维表 - 数据湖探索 DLI

如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。若使用MRS HBase，请在增强型跨源的主机信息中添加MRS集群所有节点的主机ip信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
userDefined结果表 - 数据湖探索 DLI

class-name' = '' ); 参数说明表1 参数说明参数是否必选说明 connector.type 是只能为user-defined，表示使用自定义的sink。 connector.class-name 是 sink函数的全限定类名。sink类的具体实现可以参考前提条件说明。 connector

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

to_dli。源端作业配置，具体参考如下：表2 源端作业配置参数名参数值源连接名称选择1.a中已创建的数据源名称。使用SQL语句 “使用SQL语句”选择“是”时，您可以在这里输入自定义的SQL语句，CDM将根据该语句导出数据。本示例当前选择为“否”。模式或表空间

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

password' = '' ); 参数说明表1 参数说明参数是否必选说明 connector.type 是数据源类型，‘jdbc’表示使用JDBC connector，必须为jdbc connector.url 是数据库的URL connector.table 是读取数据库中的数据所在的表名

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

password' = '' ); 参数说明表1 参数说明参数是否必选说明 connector.type 是数据源类型，‘jdbc’表示使用JDBC connector，必须为jdbc connector.url 是数据库的URL connector.table 是读取数据库中的数据所在的表名

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表

总条数： 1217

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

创建Hbase维表 - 数据湖探索 DLI

parse - 数据湖探索 DLI

插入数据至DCS表 - 数据湖探索 DLI

插入数据至DCS表 - 数据湖探索 DLI

parse - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

创建Hbase维表 - 数据湖探索 DLI

userDefined结果表 - 数据湖探索 DLI

典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线