搜索_华为云

JDBC - 数据湖探索 DLI
JDBC - 数据湖探索 DLI

url 是无 String 数据库的URL。连接MySQL数据库时，格式为：jdbc:mysql://MySQLAddress:MySQLPort/dbName 。连接PostgreSQL数据库时，格式为：jdbc:postgresql://PostgreSQLAddr

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
对象存储OBS结果表 - 数据湖探索 DLI

Formats在每次创建Checkpoint时进行滚动，并且用户也可以添加基于大小或者时间等的其他条件。更多信息参考文件系统 SQL 连接器在STREAMING模式下使用FileSink需要开启Checkpoint功能。Part文件只在Checkpoint成功时生成。如果没有开启Checkp

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

入与输出是一对多的关系，读入一行数据，输出多个值。约束限制在DLI Console上执行UDTF相关操作时，需要使用自建的SQL队列。不同的IAM用户使用UDTF时，除了创建UDTF函数的用户，其他用户如果需要使用时，需要先进行授权才可使用对应的UDTF函数。授权操作参考如下：

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
权限策略和授权项 - 数据湖探索 DLI

起API请求时，该IAM用户必须具备调用该接口所需的权限，否则，API请求将调用失败。每个接口所需要的权限，与各个接口所对应的授权项相对应，只有发起请求的用户被授予授权项所对应的策略，该用户才能成功调用该接口。例如，用户要创建队列，那么这个IAM用户被授予的策略中必须包含允许"d

帮助中心 > 数据湖探索 DLI > API参考
窗口关联 - 数据湖探索 DLI
窗口关联 - 数据湖探索 DLI

窗口关联需要在 join on 条件中包含两个输入表的 window_start 等值条件和 window_end 等值条件。关联的左右两边必须使用相同的窗口表值函数。窗口关联支持作用在滚动（TUMBLE）、滑动（HOP）和累积（CUMULATE）窗口表值函数之上，但是还不支持会话窗口。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
创建DLI自定义委托权限 - 数据湖探索 DLI

步骤2：在作业中设置委托权限使用Flink 1.15和Spark 3.3及以上版本的引擎执行作业时，需要在作业配置中添加新建的委托信息。否则Spark3.3.1作业不指定委托时，无法使用OBS；Flink1.15作业不指定委托时，无法开启checkpoint、savepoint，作业提交日志无法转储，无法使用OBS、DWS等数据源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

本指导中的OBS桶名都为“dli-test-021”。已创建DLI的SQL队列。创建队列详细介绍请参考创建队列。注意：创建队列时，队列类型必须要选择为：SQL队列。前期准备创建DLI数据库登录DLI管理控制台，选择“SQL编辑器”，在SQL编辑器中“执行引擎”选择“s

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Upsert Kafka - 数据湖探索 DLI
Upsert Kafka - 数据湖探索 DLI

默认情况下，前缀为空。如果定义了自定义前缀，则表架构和'key.fields'都将使用前缀名称。在构造密钥格式的数据类型时，将删除前缀，并在密钥格式中使用无前缀的名称。请注意，此选项要求'value.fields-include' 必须设置为'EXCEPT_KEY'。 value.format 是无 String 用于对

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
ALTER TABLE - 数据湖探索 DLI
ALTER TABLE - 数据湖探索 DLI

table还是external table，如果ADD PARTITION时指定了分区保存路径，那么在DROP PARTITION执行后，分区所在文件夹和数据不会被删除。如果ADD PARTITION时未指定分区保存路径，分区目录将从OBS上删除，数据会移到.Trash/Current文件夹。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

同于SQL中常用的SUM()，AVG()，也是聚合函数。约束限制在DLI Console上执行UDAF相关操作时，需要使用自建的SQL队列。跨账号使用UDAF时，除了创建UDAF函数的用户，其他用户如果需要使用时，需要先进行授权才可使用对应的UDAF函数。授权操作参考如下：登录DLI管理控制台，选择“

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

典型场景示例：配置DLI与内网数据源的网络联通背景信息 DLI与内网数据源的网络联通通常指的是华为云内部服务的场景，例如DLI连接MRS、RDS、CSS、Kafka、DWS时，需要打通DLI和外部数据源之间的网络。使用DLI提供的增强型跨源连接，采用对等连接的方式打通DLI与目的数据源的VPC网络，实现数据互通。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
创建批处理作业 - 数据湖探索 DLI

当用户设置“feature”为“custom”时，该参数生效。用户可通过与“feature”参数配合使用，指定作业运行使用自定义的Spark镜像。关于如何使用自定义镜像，请参考《数据湖探索用户指南》。 catalog_name 否 String 访问元数据时，需要将该参数配置为dli。表3

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

Driver"。 partitionColumn 读取数据时，用于设置并发使用的数值型字段。说明： “partitionColumn”，“lowerBound”，“upperBound”，“numPartitions”4个参数必须同时设置，不支持仅设置其中一部分为了提升并发读取的性能，建议使用自增列。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

调试代码。约束限制使用Notebook实例提交DLI作业必须使用弹性资源池下的通用队列。每一个弹性资源池关联唯一的Notebook实例。 Notebook作业运行过程中产生的临时数据将会存储在DLI作业桶中，且必须使用并行文件系统。请在ModelArts管理控制台管理No

帮助中心 > 数据湖探索 DLI > 用户指南
配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

详细参数说明请参考按全量指标创建。配置告警规则时选择的Prometheus实例应是需要配置告警通知的作业所在的弹性资源池绑定的Prometheus 实例。配置高级设置：仅”全量指标创建”的方式支持该配置项，配置时建议开启无数据处理。即配置监控周期内无指标数据产生或指标数据不足时系统的处理方式。告警通

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

一个企业有多个部门，多个部门不同业务数据分析的时间段可能有所差异，具体场景如下： A部门：在00:00-09:00时间段内资源请求量大，其他时间段有短时间的资源请求量不大的任务运行。 B部门：在10:00-22:00时间段内资源请求量大，其他时间段内也有固定周期的作业请求也需要保障。针对上述场景，弹性资

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
在DLI控制台创建数据库和表 - 数据湖探索 DLI

是路径。说明：如果需要将OBS上的数据导入OBS表，则建表路径必须是文件夹。建表路径是文件时，会导致数据导入失败。 obs://obs1/sampledata.csv 表头:无/有当“数据格式”为“CSV”时，该参数有效。设置导入数据源是否含表头。选中“高级选项”，勾选“

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

注意事项创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。创建HBase源表的列簇必须定义为ROW类型，字段名对应列簇名（column f

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

ip信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。注意事项创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

本节介绍利用Flink来读写Hive的表。Hive源表的定义，以及创建源表时使用的参数和示例代码。详情可参考：Apache Flink Hive Read & Write Flink支持在BATCH 和 STREAMING模式下从Hive读取数据。当作为BATCH应用程序运行时，Flink将在执行查询的时间点对表的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive

总条数： 318

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

JDBC - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

权限策略和授权项 - 数据湖探索 DLI

窗口关联 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

Upsert Kafka - 数据湖探索 DLI

ALTER TABLE - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

创建批处理作业 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线