搜索_华为云

DLI计算引擎版本生命周期 - 数据湖探索 DLI

不建议长期混用不同版本的Spark/Flink引擎。长期混用不同版本的Spark/Flink引擎会导致代码在新旧版本之间不兼容，影响作业的执行效率。当作业依赖于特定版本的库或组件，长期混用不同版本的Spark/Flink引擎可能会导致作业因依赖冲突而执行失败。计算引擎版本生命周期表1给出了DLI计算引擎版本

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
恢复多版本备份数据 - 数据湖探索 DLI

VERSION：指定版本号。具体的版本号可以通过SHOW HISTORY命令获取，详情请参考查看多版本备份数据。参数说明表1 参数说明参数描述 db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。 column 分区列名。 value

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
配置多版本过期数据回收站 - 数据湖探索 DLI

TBLPROPERTIES：TBLPROPERTIES子句给表添加key/value的属性。参数说明表1 参数说明参数描述 db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。 obs桶多版本回收站目录当

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 多版本备份恢复数据
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

eckpoint文件恢复内部状态和消费位点，保证数据不丢失及聚合算子等内部状态的精确一致语义。同时，为了保证数据不重复，建议使用带主键数据库或者文件系统作为目标数据源，否则下游处理业务需要加上去重逻辑（最新成功Checkpoint记录位点到异常时间段内的数据会重复消费）。图1 Flink作业配置参数

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业相关问题 > 性能调优
Connector概述 - 数据湖探索 DLI
Connector概述 - 数据湖探索 DLI

MySQL，Redis等。结果表：Flink作业输出的结果数据表，将每条实时处理完的数据写入的目标存储，如 MySQL，HBase 等数据库。示例： Flink 实时消费用户订单数据的 Kafka 源表，通过Redis维表将商品ID关联维表获取商品分类，并计算不同类别的商品销售金额，将计算结果写入

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
配置多版本过期数据回收站 - 数据湖探索 DLI

TBLPROPERTIES：TBLPROPERTIES子句给表添加key/value的属性。参数说明表1 参数说明参数描述 db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。 obs桶多版本回收站目录当

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
创建Redis表 - 数据湖探索 DLI
创建Redis表 - 数据湖探索 DLI

二级key属性的列名。 cache_max_num 否表示最大缓存的查询结果数，默认值为32768。 cache_time 否表示数据库查询结果在内存中缓存的最大时间。单位为毫秒，默认值为10000，当值为0时表示不缓存。注意事项不支持Redis集群。请务必确保您的账户

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建维表
API概览 - 数据湖探索 DLI
API概览 - 数据湖探索 DLI

本章节介绍了目前DLI所提供的API列表。表1 DLI API列表类型说明权限相关API 包括队列赋权、查看队列的使用者、数据赋权、查看数据库的使用者、查看表的使用者、查看表的用户权限和查看赋权对象使用者权限信息。全局变量相关API 包括创建全局变量、删除全局变量、修改全局变量和查询所有全局变量。

帮助中心 > 数据湖探索 DLI > API参考
创建Redis表 - 数据湖探索 DLI
创建Redis表 - 数据湖探索 DLI

二级key属性的列名。 cache_max_num 否表示最大缓存的查询结果数，默认值为32768。 cache_time 否表示数据库查询结果在内存中缓存的最大时间。单位为毫秒，默认值为10000，当值为0时表示不缓存。注意事项不支持Redis集群。请务必确保您的账户

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建维表
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

OPTIONS：属性列表。参数说明表1 参数描述参数描述 folder_path 原始数据文件夹或者文件的OBS路径。 db_name 数据库名称。若未指定，则使用当前数据库。 table_name 需要导入数据的DLI表的名称。以下是可以在导入数据时使用的配置选项： DATA_TYPE: 指定

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线）
使用DLI进行账单分析与优化 - 数据湖探索 DLI

在数据湖探索服务中创建表。登录DLI控制台，左侧导航栏单击“SQL编辑器”，执行引擎选择“spark”，选择执行的队列和数据库。本次演示队列和数据库选择“default”。下载的文件中包含时间用量等，按表头意义在DLI上创建表，具体可以参考如下示例，其中amount列为费用。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

OPTIONS：属性列表。参数说明表1 参数描述参数描述 folder_path 原始数据文件夹或者文件的OBS路径。 db_name 数据库名称。若未指定，则使用当前数据库。 table_name 需要导入数据的DLI表的名称。以下是可以在导入数据时使用的配置选项： DATA_TYPE: 指定

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
查询资源实例数量 - 数据湖探索 DLI

dli_elastic_resource_pool：弹性资源池 dli_enhanced_datasource：增强型跨源连接 dli_database：数据库 dli_package_resource：资源包（不支持指定有Module ID的内置资源包） dli_flink_job：Flink作业

 帮助中心 > 数据湖探索 DLI > API参考 > 资源标签相关API
入门实践 - 数据湖探索 DLI
入门实践 - 数据湖探索 DLI

介绍如何通过CDM数据同步功能，迁移Elasticsearch类型的CSS集群数据至DLI。迁移RDS数据至DLI 介绍如何通过CDM数据同步功能，迁移关系型数据库RDS数据至DLI。迁移DWS数据至DLI 介绍如何通过CDM数据同步功能，迁移数据仓库服务DWS数据至DLI。

帮助中心 > 数据湖探索 DLI > 快速入门
配置DLI队列与内网数据源的网络联通 - 数据湖探索 DLI

安全组”参数下获取Kafka的安全组。 RDS 在RDS控制台“实例管理”页面，单击对应实例名称，查看“连接信息”，获取“内网地址”、“虚拟私有云”、“子网”、“数据库端口”和“安全组”信息。 CSS 在CSS管理控制台，选择“Elasticsearch > 集群管理”，单击已创建的CSS集群名称，进入到CSS的基本信息页面。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 队列网络联通
典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

安全组”参数下获取Kafka的安全组。 RDS 在RDS控制台“实例管理”页面，单击对应实例名称，查看“连接信息”，获取“内网地址”、“虚拟私有云”、“子网”、“数据库端口”和“安全组”信息。 CSS 在CSS管理控制台，选择“Elasticsearch > 集群管理”，单击已创建的CSS集群名称，进入到CSS的基本信息页面。

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI读写外部数据源数据
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-sql_2

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
查询作业状态 - 数据湖探索 DLI

Integer 当前作业返回的结果总条数或insert作业插入的总条数。 database_name String 记录其操作的表所在的数据库名称。类型为IMPORT、EXPORT和QUERY的作业才有“database_name”属性。 table_name String 记录其

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
查询作业详细信息 - 数据湖探索 DLI

String 导入或导出的数据类型（当前支持csv和json格式）。 database_name 是 String 导入或导出表所属的数据库名称。 table_name 是 String 导入或导出表的名称。 with_column_header 否 Boolean 导入作业时，导入的数据是否包括列名。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
获取分区信息列表（废弃） - 数据湖探索 DLI

project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。 database_name 是 String 数据库名称。 table_name 是 String 表名称。表2 query参数参数名称是否必选参数类型说明 limit 否 Integer

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）

总条数： 412

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI计算引擎版本生命周期 - 数据湖探索 DLI

恢复多版本备份数据 - 数据湖探索 DLI

配置多版本过期数据回收站 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Connector概述 - 数据湖探索 DLI

配置多版本过期数据回收站 - 数据湖探索 DLI

创建Redis表 - 数据湖探索 DLI

API概览 - 数据湖探索 DLI

创建Redis表 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

使用DLI进行账单分析与优化 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

查询资源实例数量 - 数据湖探索 DLI

入门实践 - 数据湖探索 DLI

配置DLI队列与内网数据源的网络联通 - 数据湖探索 DLI

典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

查询作业状态 - 数据湖探索 DLI

查询作业详细信息 - 数据湖探索 DLI

获取分区信息列表（废弃） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线