搜索_华为云

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

初始化完成后，会调用process方法，真正处理在process函数中，在process中，每一次forward()调用产生一行。如果产生多列可以将多个列的值放在一个数组中，然后将该数组传入到forward()函数。 public void process(Object[] args)

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

x：不支持支持datasourcev1表。升级引擎版本后是否对作业有影响：有影响，建议在Spark 2.4.5版本整改到v2表后再升级Spark 3.3.1，具体操作指导可以参考DLI datasourceV1表和datasourceV2表的中的示例。默认情况下空的input split不创建partition

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
DLI对接LakeFormation - 数据湖探索 DLI

请谨慎操作。步骤2：在LakeFormation管理控制台创建Catalog 数据目录（Catalog）是元数据管理对象，它可以包含多个数据库。您可以在LakeFormation中创建并管理多个Catalog，用于不同外部集群的元数据隔离。登录LakeFormation管理控制台。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

读取过程中，redis集群中的CPU使用率还有提升空间，可以调大该参数。 iterator.grouping.size 每批次插入的数据记录数，默认为100。如果在插入过程中，redis集群中的CPU使用率还有提升空间，可以调大该参数。 timeout 连接redis的超时时间，单位ms，默认值2000（2秒超时）。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
Kafka - 数据湖探索 DLI
Kafka - 数据湖探索 DLI

CDC Raw 前提条件确保已创建Kafka集群。该场景作业需要运行在DLI的独享队列上，因此要与kafka集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

建批处理作业》。创建Spark作业完成后，在控制台单击右上角“执行”提交作业，页面显示“批处理作业提交成功”说明Spark作业提交成功，可以在Spark作业管理页面查看提交的作业的状态和日志。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
Print结果表 - 数据湖探索 DLI
Print结果表 - 数据湖探索 DLI

Managers”，单击对应的任务名称，选择“Stdout”查看作业运行日志。方法二：若在提交运行作业前“运行参数”选择了“保存作业日志”，可以通过如下操作查看。登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“O

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。系统响应 Table创建成功，创建的Hudi表可以进入DLI控制台，在左侧菜单栏选择”数据管理”->”库表管理”，随后筛选数据库并点击名称，进入表列表查询。父主题： Hudi DDL语法说明

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

容到内存，然后广播到各个taskmanager，这种方式适合那种需要提前加载的少量变量。方案二：在open里面初始化算子的时候加载文件，可以使用相对路径/绝对路径的方式以kafka sink为例：需要加载两个文件（userData/kafka-sink.conf，userData/client

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

查询弹性云服务器ECS详细信息，获取ECS的“私有IP地址”。使用增强型跨源连接打通DLI队列和Livy实例所在的VPC网络。具体操作可以参考增强型跨源连接。 DLI Livy工具下载及安装本次操作下载的DLI Livy版本为apache-livy-0.7.2.0107-bin

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
DLI支持的Prometheus基础监控指标 - 数据湖探索 DLI

flink_jobmanager_Status_JVM_Memory_Metaspace_Max JobManager MetaSpace内存池中可以使用的最大内存量 flink_jobmanager_Status_JVM_Memory_Direct_Count JobManager direct缓冲池中的缓冲区数

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
数据权限列表 - 数据湖探索 DLI

ION（设置分区的路径） SHOW_PARTITIONS（显示所有分区） SHOW_CREATE_TABLE（查看建表语句） TABLE上可以赋权/回收的权限： DESCRIBE_TABLE（描述表） DROP_TABLE（删除表） SELECT（查询表） INSERT_INTO_TABLE（插入）

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据权限相关
创建DLI表关联DWS - 数据湖探索 DLI

DWS的连接地址，需要先创建跨源连接，管理控制台操作请参考增强型跨源连接。创建经典型跨源连接后，使用经典型跨源连接中返回的连接地址。创建增强型跨源连接后，可以使用DWS提供的"JDBC连接字符串（内网）"，或者内网地址和内网端口访问，格式为"协议头://内网IP:内网端口/数据库名"，例如："j

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DWS表
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

方法一："更多" -> "FlinkUI" -> "Task Managers" -> "Stdout"。方法二：若在提交运行作业前选择了保存日志，则可以从日志的taskmanager.out文件中查看。 +I(202103241000000001,webShop,2021-03-2410:00:00

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

方法一："更多" -> "FlinkUI" -> "Task Managers" -> "Stdout"。方法二：若在提交运行作业前选择了保存日志，则可以从日志的taskmanager.out文件中查看。 +I(111,scooter,Big 2-wheel scooter,5.15) 父主题：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
配置DLI云服务委托权限 - 数据湖探索 DLI

t_agency）在DLI控制台左侧导航栏中单击“全局配置 > 服务授权”。在委托设置页面，按需选择以下场景的权限。单击权限卡片上的可以查看包含的详细的权限策略。委托说明如表1所示。表1 dli_management_agency委托包含的权限适用场景委托名权限说明

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
DWS源表（不推荐使用） - 数据湖探索 DLI

》中“创建集群”章节。请确保已创建DWS数据库表。该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

》中“创建集群”章节。请确保已创建DWS数据库表。该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

景中使用。前提条件确保已创建Kafka集群。该场景作业需要运行在DLI的独享队列上，因此要与kafka集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

持插入覆盖。有关可用配置的完整列表，请参阅流式处理接收器。Streaming sink 前提条件该场景作业需要建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive

总条数： 740

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Kafka - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

Print结果表 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

DLI支持的Prometheus基础监控指标 - 数据湖探索 DLI

数据权限列表 - 数据湖探索 DLI

创建DLI表关联DWS - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

配置DLI云服务委托权限 - 数据湖探索 DLI

DWS源表（不推荐使用） - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线