搜索_华为云

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

t文件恢复内部状态和消费位点，保证数据不丢失及聚合算子等内部状态的精确一致语义。同时，为了保证数据不重复，建议使用带主键数据库或者文件系统作为目标数据源，否则下游处理业务需要加上去重逻辑（最新成功Checkpoint记录位点到异常时间段内的数据会重复消费）。图1 Flink作业配置参数

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
上传数据相关API（废弃） - 数据湖探索 DLI

上传数据相关API（废弃）对已创建的上传作业进行鉴权（废弃）父主题：历史API

帮助中心 > 数据湖探索 DLI > API参考 > 历史API
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

ErrorIfExis：如果已经存在数据，则抛出异常。 Overwrite：如果已经存在数据，则覆盖原数据。 Append：如果已经存在数据，则追加保存。 Ignore：如果已经存在数据，则不做操作。这类似于SQL中的“如果不存在则创建表”。读取DWS上的数据。方式一：read.format()方法

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
插入数据至Oracle表 - 数据湖探索 DLI

插入数据至Oracle表功能描述 INSERT INTO命令将数据插入到已关联的指定Oracle表中。语法格式将SELECT查询结果插入到表中： 1 2 3 4 5 6 7 INSERT INTO DLI_TABLE SELECT field1,field2... [FROM

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接Oracle表
插入数据至DWS表 - 数据湖探索 DLI

插入数据至DWS表功能描述 INSERT INTO命令将DLI表中的数据插入到已关联的指定DWS表中。语法格式将SELECT查询结果插入到表中： 1 2 3 4 5 6 7 INSERT INTO DLI_TABLE SELECT field1,field2... [FROM

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DWS表
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

“username”为创建的mongo（DDS）数据库用户名。 “pwd”为创建的mongo（DDS）数据库用户名对应的密码。 “host”为创建的mongo（DDS）数据库实例IP。 “db”为创建的mongo（DDS）数据库名称。 mongo（DDS）数据库用户创建详见：创建DDS数据库账户。 database

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
查看指定表所有分区 - 数据湖探索 DLI

查看指定表所有分区功能描述查看指定表的所有分区。语法格式 1 2 SHOW PARTITIONS [db_name.]table_name [PARTITION partition_specs]; 关键字 PARTITIONS：表中的分区。 PARTITION：分区。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 查看表
pyspark样例代码 - 数据湖探索 DLI

id、location、city：限定了长度，插入数据时须按长度给定数据值，否则查询时会发生编码格式错误。操作结果；提交Spark作业将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。如果

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
插入数据至HBase表 - 数据湖探索 DLI

插入数据至HBase表功能描述 INSERT INTO命令将DLI表中的数据插入到已关联的hbase表中。语法格式将SELECT查询结果插入到表中： 1 2 3 4 5 6 7 INSERT INTO DLI_TABLE SELECT field1,field2...

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
插入数据至CSS表 - 数据湖探索 DLI

错。类型不一致时不一定报错，例如插入int类型数据，但CSS中Schema保存的是文本类型，int类型会被转换成文本类型。不建议对同一张表并发插入数据，因为有一定概率发生并发冲突，导致插入失败。示例查询表“user”中的数据插入表“test”中。 1 2 3 4 5 6 INSERT

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
DLI Delta表概述 - 数据湖探索 DLI

Lake技术实现的数据存储解决方案，它使用基于文件的事务日志扩展了 Parquet 数据文件，可以处理 ACID 事务和可缩放的元数据。 Delta Lake与Apache Spark API完全兼容，并且其设计能够与结构化流式处理紧密集成，可以轻松地将单个数据副本用于批处理和流式处理操作，并提供大规模增量处理。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
从Kafka读取数据写入到RDS - 数据湖探索 DLI

业运行状态变为“运行中”。步骤6：发送数据和查询结果使用Kafka客户端向步骤2：创建Kafka的Topic中的Topic发送数据，模拟实时数据流。 Kafka生产和发送数据的方法请参考：DMS - 连接实例生产消费信息。发送样例数据如下： {"user_id":"0001"

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
插入数据至RDS表 - 数据湖探索 DLI

插入数据至RDS表功能描述 INSERT INTO命令将DLI表中的数据插入到已关联的指定RDS表中。语法格式将SELECT查询结果插入到表中： 1 2 3 4 5 6 7 INSERT INTO DLI_TABLE SELECT field1,field2... [FROM

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接RDS表
插入数据至DDS表 - 数据湖探索 DLI

插入数据至DDS表功能描述 INSERT INTO命令将DLI表中的数据插入到已关联的指定DDS表中。语法格式将SELECT查询结果插入到表中： 1 2 3 4 5 6 7 INSERT INTO DLI_TABLE SELECT field1,field2... [FROM

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DDS表
使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

Spark作业不支持访问sftp，建议将文件数据上传到OBS，再通过Spark作业进行读取和分析。上传数据到OBS桶：通过OBS管理控制台或者使用命令行工具将存储在sftp中的文件数据上传到OBS桶中。 Spark读取OBS文件数据，详见使用Spark Jar作业读取和查询OBS数据。配置Spark作

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
创建Hive Catalog - 数据湖探索 DLI

Catalog 简介 Catalog提供了元数据信息，例如数据库、表、分区、视图以及数据库或其他外部系统中存储的函数和信息。数据处理最关键的方面之一是管理元数据。元数据可以是临时的，例如临时表、或者通过TableEnvironment注册的UDF。元数据也可以是持久化的，例如Hive

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

from dli_to_rd").show(); 插入数据后：提交Spark作业将写好的代码生成jar包，上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

SQL作业时，需要创建OBS分区表，用于后续进行批处理。操作步骤该示例将car_info数据，以day字段为分区字段，parquet为编码格式，转储数据到OBS。更多内容请参考《数据湖探索Flink SQL语法参考》。 1 2 3 4 5 6 7 8 9 10

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
使用HetuEngine on Hudi - 数据湖探索 DLI

HetuEngine是高性能的交互式SQL分析及数据虚拟化引擎，它与大数据生态无缝融合，实现海量数据秒级交互式查询，并支持跨源跨域统一访问，使能数据湖内、湖间、湖仓一站式SQL融合分析。 HetuEngine对Hudi仅支持select操作，即支持SELECT语法来查询Hudi表中的数据。 HetuEngine暂不支持查询Hudi的增量视图。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

ErrorIfExis：如果已经存在数据，则抛出异常。 Overwrite：如果已经存在数据，则覆盖原数据。 Append：如果已经存在数据，则追加保存。 Ignore：如果已经存在数据，则不做操作。这类似于SQL中的“如果不存在则创建表”。读取RDS上的数据。方式一：read.format()方法

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS

总条数： 1507

上一页
1
...
10
11
12
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

上传数据相关API（废弃） - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

插入数据至Oracle表 - 数据湖探索 DLI

插入数据至DWS表 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

查看指定表所有分区 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

插入数据至HBase表 - 数据湖探索 DLI

插入数据至CSS表 - 数据湖探索 DLI

DLI Delta表概述 - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

插入数据至RDS表 - 数据湖探索 DLI

插入数据至DDS表 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

创建Hive Catalog - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

使用HetuEngine on Hudi - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线