搜索_华为云

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

DataSource和Hive两种语法创建OBS表的区别 DataSource语法和Hive语法主要区别在于支持的表数据存储格式范围、支持的分区数等有差异。两种语法创建OBS表主要差异点参见表1。表1 DataSource语法和Hive语法创建OBS表的差异点语法支持的数据类型范围

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

debezium-json.timestamp-format.standard 否 'SQL' String 声明输入和输出的时间戳格式。当前支持的格式为'SQL'和'ISO-8601'。可选参数 'SQL' 将会以 "yyyy-MM-dd HH:mm:ss.s{precision}"

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。如果使用MRS HBase，请

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
数据湖探索简介 - 数据湖探索 DLI

分钟级别扩缩容，从容应对流量洪峰和资源诉求。支持分时设置队列优先级和配额，提高资源利用率。作业级资源隔离（暂未实现，后续版本支持）支持独立Spark实例运行SQL作业，减少作业间相互影响。自动弹性（暂未实现，后续版本支持）基于队列负载和优先级实时自动更新队列配额。弹性

 帮助中心 > 数据湖探索 DLI > 产品介绍
查看SQL执行计划 - 数据湖探索 DLI

SQL执行计划是数据库查询的逻辑流程图，它展示了数据库管理系统如何执行一个特定的SQL查询。执行计划详细列出了执行查询所需的各个步骤，例如表扫描、索引查找、连接操作（如内连接、外连接）、排序和聚合等。执行计划可以帮助分析查询的性能，识别可能的性能瓶颈，通过了解查询的执行逻辑，并根据这些信息调整查询或数据库结构，以提高SQL查询效率。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
查询指定资源实例的标签信息 - 数据湖探索 DLI

弹性资源池ID：通过调用查询所有弹性资源池获弹性资源池ID。响应中的resource_id为弹性资源池ID。增强型跨源连接ID：在DLI管理控制台的“增强型跨源连接”列表页获取“连接ID”即为增强型跨源连接ID。数据库ID：添加标签时候传入的数据库ID即数据库名。您可以在DLI控制台的“库表管理”页面查看数据库名称。

帮助中心 > 数据湖探索 DLI > API参考 > 资源标签相关API
新建Flink Jar作业 - 数据湖探索 DLI

示例："myGroup/test.cvs,myGroup/test1.csv"。通过在应用程序中添加以下内容可访问对应的依赖文件。其中，“fileName”为需要访问的文件名，“ClassName”为需要访问该文件的类名。 ClassName.class.getClassLoader().getRe

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

千~2万条消息。细粒度权限管理：P公司内部有N个子部门，子部门之间需要对数据进行共享和隔离。DLI支持计算资源按租户隔离，保障作业SLA；支持数据权限控制到表/列，帮助企业实现部门间数据共享和权限管理。建议搭配以下服务使用 OBS、DIS、DataArts Studio 图3

帮助中心 > 数据湖探索 DLI > 产品介绍
创建跨源成功但测试网络连通性失败怎么办？ - 数据湖探索 DLI

检查VPC网络是否设置了ACL规则限制了网络访问检查是否在域名或者IP后添加了端口测试连通性时需要添加端口号。例如，测试队列与指定RDS实例连通性，本例RDS实例使用3306端口。测试连通性如下所示。图1 测试地址连通性检查是否连接的是对端VPC和子网创建增强型跨源连接时需要填写对端的VPC和子网。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
Flink作业相关 - 数据湖探索 DLI
Flink作业相关 - 数据湖探索 DLI

System.out.println(result); } 查询作业APIG网关服务访问地址 DLI提供查询Flink作业APIG访问地址的接口。您可以使用该接口查询作业APIG网关服务访问地址。示例代码如下： 1 2 3 4 5 private static void

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
DLI Hudi元数据 - 数据湖探索 DLI
DLI Hudi元数据 - 数据湖探索 DLI

Hudi元数据 DLI Hudi元数据说明创建Hudi表时会在元数据仓创建表的相关元数据信息。 Hudi支持对接DLI元数据和Lakeformation元数据（仅Spark 3.3.1及以上版本支持对接Lakeformation元数据），对接方式与Spark一致。 DLI元数据可在数据湖探索管理控制台的“数据管理

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
与其他云服务的关系 - 数据湖探索 DLI

具体操作请参考《创建用户并授权使用DLI》和《DLI自定义策略》。与云审计服务（CTS）的关系云审计服务（Cloud Trace Service）为DLI提供对应用户的操作审计。云审计服务支持的DLI操作请参考《云审计服务支持的DLI操作列表说明》。与云监控服务（CES）的关系云监控（Cloud Eye

帮助中心 > 数据湖探索 DLI > 产品介绍
Doris维表 - 数据湖探索 DLI
Doris维表 - 数据湖探索 DLI

username -- Y 访问 Doris 的用户名。 password -- Y 访问 Doris 的密码。 lookup.cache.max-rows -1L N 查找缓存的最大行数，超过此值，最旧的行将被删除。如需启用缓存配置则“cache.max-rows”和“cache.ttl”选项都必须指定。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

据输出到关系型数据库中。前提条件 DLI要与实例建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

自定义函数概述 DLI支持三种自定义函数： UDF：自定义函数，支持一个或多个输入参数，返回一个结果值。 UDTF：自定义表值函数，支持一个或多个输入参数，可返回多行多列。 UDAF：自定义聚合函数，将多条记录聚合成一个值。 POM依赖 <dependency>

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
DWS Connector概述 - 数据湖探索 DLI

（废弃，不推荐使用）DLI服务的DWS Connector：支持自定义sink和source函数，允许用户根据具体需求实现相应的sink或source函数，以实现特定的数据读写逻辑。 DLI提供的DWS Connector使用方法请参考表1 表1 DWS Connector支持类别类别操作指导源表 DWS源表（不推荐使用）

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

__HIVE_DEFAULT_PARTITION__”，当前Spark判断分区为空时，则会直接返回null，不返回具体的数据。解决方案登录DLI管理控制台，在“SQL编辑器”中，单击“设置”。在参数设置中，添加参数“spark.sql.forcePartitionPredi

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
DLI作业开发流程 - 数据湖探索 DLI

当需要将来自不同源的数据进行集中存储和处理时，迁移数据至DLI可以提供一个统一的数据平台。您可以参考使用CDM迁移数据至DLI迁移数据至DLI后再提交作业。如果业务需求需要实时访问和处理来自不同数据源的数据，跨源访问可以减少数据的复制和延迟。跨源访问的必要条件包括“DLI与数据源

 帮助中心 > 数据湖探索 DLI > 用户指南
右外连接 - 数据湖探索 DLI
右外连接 - 数据湖探索 DLI

RIGHT OUTER JOIN：返回右表的所有记录，没有匹配值的记录将返回NULL。注意事项所要进行JOIN连接的表必须是已经存在的表，否则会出错。示例右外连接和左外连接相似，但是会将右边表（这里的course_info)中的所有记录返回，没有匹配值的左表记录将返回NULL。 1

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

自定义函数概述 DLI支持三种自定义函数： UDF：自定义函数，支持一个或多个输入参数，返回一个结果值。 UDTF：自定义表值函数，支持一个或多个输入参数，可返回多行多列。 UDAF：自定义聚合函数，将多条记录聚合成一个值。暂不支持通过python写UDF、UDTF、UDAF自定义函数。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数

总条数： 865

上一页
1
...
16
17
18
...
44
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

查看SQL执行计划 - 数据湖探索 DLI

查询指定资源实例的标签信息 - 数据湖探索 DLI

新建Flink Jar作业 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

创建跨源成功但测试网络连通性失败怎么办？ - 数据湖探索 DLI

Flink作业相关 - 数据湖探索 DLI

DLI Hudi元数据 - 数据湖探索 DLI

与其他云服务的关系 - 数据湖探索 DLI

Doris维表 - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

DWS Connector概述 - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

右外连接 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线