搜索_华为云

创建表时指定表的生命周期 - 数据湖探索 DLI

创建表时指定表的生命周期功能描述 DLI提供了表生命周期管理功能，在创建表时指定表的生命周期。DLI会根据每张表的最后修改时间和表的生命周期来判断是否要回收此表。通过设置表的生命周期，可以帮助您更好的管理数目众多的表，自动清理长期不再使用的数据表，简化数据表的回收流程。同时支持数据恢复设置，避免因误操作丢失数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
DLI JDBC Driver支持的API列表 - 数据湖探索 DLI

a/sql/package-summary.html。支持的API列表 DLI JDBC Driver支持的API列表如下，对可能与JDBC标准产生歧义的地方加以备注说明。 Connection API支持的常用方法签名： Statement createStatement()

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
pyspark样例代码 - 数据湖探索 DLI

指南》中的“选择依赖资源参数说明”。通过API提交作业请参考《数据湖探索API参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码通过DataFrame API 访问认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
Data masking函数 - 数据湖探索 DLI

数据脱敏(Data masking) 指对某些敏感信息通过脱敏规则进行数据的变形，实现敏感隐私数据的可靠保护。 mask_first_n(string str[, int n]) →varchar 描述：返回str的屏蔽版本，前n个值被屏蔽。大写字母被转为＂X＂，小写字母被转为＂x＂，数字被转为＂n＂。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
创建DLI表关联CSS - 数据湖探索 DLI

X版本时，该参数只需要填写index即可。 pushdown CSS的下压功能是否开启，默认为“true”。包含大量IO传输的表在有where过滤条件的情况下能够开启pushdown降低IO。 strict CSS的下压是否是严格的，默认为“false”。精确匹配的场景下比pushdown降低更多IO。 batch

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
怎样获取DLI作业样例（Demo） - 数据湖探索 DLI

为了方便用户更好地使用DLI，DLI服务提供了供作业开发的Demo样例，您可以通过DLI样例代码获取。该样例代码的目录内容介绍如下： dli-flink-demo：开发Flink作业时的样例代码参考。例如，样例代码实现读取Kafka源表数据写入到HDFS、DWS、Hive等结果表中的功能。 dli-spark

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
增强型跨源连接标签管理 - 数据湖探索 DLI

标签如果不符合标签策略的规则，则可能会导致资源创建失败，请联系组织管理员了解标签策略详情。 DLI支持以下两类标签：资源标签：在DLI中创建的非全局的标签。预定义标签：在标签管理服务（简称TMS）中创建的预定义标签，属于全局标签。有关预定义标签的更多信息，请参见《标签管理服务用户指南》。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

overwrite覆盖分区表数据的时候，覆盖了全量数据？当您使用insert overwrite语句覆盖分区表的数据时，如果发现它覆盖了全量数据而不是预期的分区数据，这可能是因为动态分区覆盖功能没有被启用。如果需要动态覆盖DataSource表指定的分区数据，您需要先配置参数 dli

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Flink Jar作业开发基础样例 - 数据湖探索 DLI

供用户调用的方法，DLI只对这些方法的兼容性做出产品保证。图4 配置参数表3 参数说明名称描述 CU数量一个CU为1核4G的资源量。CU数量范围为2~400个。管理单元设置管理单元的CU数，支持设置1~4个CU，默认值为1个CU。并行数作业中每个算子的最大并行数。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
GROUP BY中使用HAVING - 数据湖探索 DLI

先依据num对表transactions进行分组，再利用HAVING子句对查询结果进行过滤，price与amount乘积的最大值大于5000的记录将被筛选出来，返回对应的num及price与amount乘积的最大值。 1 2 3 4 SELECT num, max(price*amount) FROM transactions

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
DWS Connector概述 - 数据湖探索 DLI

数据的读写操作。您可以通过自定义函数（UDF）的方式使用DWS自研的DWS Connector。自定义函数操作请参考自定义函数。 DWS-Connector的使用方法请参考dws-connector-flink。（废弃，不推荐使用）DLI服务的DWS Connector：支持

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
DLI常用管理操作 - 数据湖探索 DLI

DLI常用管理操作使用自定义镜像增强作业运行环境管理DLI全局变量管理Jar作业程序包管理DLI资源配额

 帮助中心 > 数据湖探索 DLI > 用户指南
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

使用ogg-json读取kafka中的ogg记录，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

AOM服务提供的Prometheus监控是一种全面对接开源Prometheus生态的监控解决方案。它支持多种类型的组件监控，提供预置监控大盘和全面托管的Prometheus服务，通过Prometheus监控来统一采集、存储和显示监控对象的数据，适用于时间序列数据库的收集和处理，尤其适用于监控Flink作业场景。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

x版本在SQL队列的差异对比 DLI整理了Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异，便于您了解Spark版本升级后SQL队列上运行的作业在适配新版本引擎时的影响。 histogram_numeric函数的返回值的类型不同说明： Spark SQL中的histo

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

数据。实现相应的处理逻辑，以实现各个指标的统计。为了简化最终的处理逻辑，使用创建视图进行数据预处理。利用over窗口条件和过滤条件结合以去除重复数据（该方式是利用了top N的方法），同时利用相应的内置函数concat和substr将当天的00:00:00作为统计的开始时间

 帮助中心 > 数据湖探索 DLI > 最佳实践
左半连接 - 数据湖探索 DLI
左半连接 - 数据湖探索 DLI

注意事项所要进行JOIN连接的表必须是已经存在的表，否则会出错。此处的attr_expr_list中所涉及的字段只能是左表中的字段，否则会出错。示例返回选课学生的姓名及其所选的课程编号。 1 2 SELECT student_info.name, student_info

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
运行Spark作业报java.lang.AbstractMethodError - 数据湖探索 DLI

ogging，且编译时使用的是低版本的Spark，那么应用程序在Spark 2.3的环境中运行将会报java.lang.AbstractMethodError。解决措施有如下两种方案：基于Spark 2.3重新编译应用使用sl4j+log4j来实现日志功能，而不是直接继承S

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
DLI Delta表概述 - 数据湖探索 DLI

DLI Delta表概述 Delta表是一种基于Delta Lake技术实现的数据存储解决方案，它使用基于文件的事务日志扩展了 Parquet 数据文件，可以处理 ACID 事务和可缩放的元数据。 Delta Lake与Apache Spark API完全兼容，并且其设计能够与结

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
DLI对接LakeFormation - 数据湖探索 DLI

优先推荐您使用控制台提供的“元数据来源”参数项进行配置。 Lakeformation 数据目录名称配置Spark作业访问的数据目录名称。此处选择的是在DLI管理控制台创建的数据目录，即DLI与Lakeformation默认实例下的数据目录的映射，该数据目录连接的是LakeForma

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据

总条数： 320

上一页
1
...
4
5
6
...
16
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建表时指定表的生命周期 - 数据湖探索 DLI

DLI JDBC Driver支持的API列表 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Data masking函数 - 数据湖探索 DLI

创建DLI表关联CSS - 数据湖探索 DLI

怎样获取DLI作业样例（Demo） - 数据湖探索 DLI

增强型跨源连接标签管理 - 数据湖探索 DLI

为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

GROUP BY中使用HAVING - 数据湖探索 DLI

DWS Connector概述 - 数据湖探索 DLI

DLI常用管理操作 - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

左半连接 - 数据湖探索 DLI

运行Spark作业报java.lang.AbstractMethodError - 数据湖探索 DLI

DLI Delta表概述 - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线