搜索_华为云

Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

定义源的自定义并行度。默认情况下，如果未定义此选项，使用全局配置来的并行度。示例该示例是从DCS Redis数据源中读取数据，并写入Print到结果表中，其具体步骤如下：参考增强型跨源连接，根据redis所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置Redi

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
JDBC - 数据湖探索 DLI
JDBC - 数据湖探索 DLI

OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

名称。使用跨源认证则无需在作业中配置账号和密码。示例该示例是从DCS Redis数据源中读取数据，并写入Print到结果表中，其具体步骤如下：参考增强型跨源连接，根据redis所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置Redi

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

Redis 表schema的key 示例从Kafka源表中读取数据，将Redis表作为维表，并将二者生成的宽表信息写入Kafka结果表中，其具体步骤如下：参考增强型跨源连接，根据Redis和Kafka所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
创建并提交Flink作业 - 数据湖探索 DLI

查询组内资源包：确认上传的资源包是否正确。创建Flink自定义作业：创建Flink自定义作业。批量运行作业：运行Flink自定义作业。操作步骤创建弹性资源池elastic_pool_dli 接口相关信息 URI格式：POST /v3/{project_id}/elastic-resource-pools

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
将OBS数据导入至DLI - 数据湖探索 DLI

导入文件支持CSV，Parquet，ORC，JSON和Avro格式，且编码格式仅支持UTF-8。前提条件待导入的数据已存储到OBS上。导入数据步骤导入数据的入口有两个，分别在“数据管理”和“SQL编辑器”页面。在“数据管理”页面导入数据。在管理控制台的左侧，选择“数据管理”>“库表管理”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
提交SQL作业（废弃） - 数据湖探索 DLI

（推荐）介绍的API。 URI URI格式： POST /v1.0/{project_id}/queues/{queue_name}/jobs/submit-job 参数说明表1 URI参数名称是否必选说明 project_id 是项目编号，用于资源隔离。获取方式请参考获取项目ID。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。如果JDBC结果表定义了主键，则连接器以upsert模式运行，否则，连接器以Append模式运行。 upser

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

MySql CDC 功能描述 MySQL的CDC源表，即MySQL的流式源表，会先读取数据库的历史全量数据，并平滑切换到Binlog读取上，保证数据的完整读取。表1 支持类别类别详情支持表类型源表前提条件 MySQL CDC要求MySQL版本为5.6，5.7或8.0.x。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
创建队列 - 数据湖探索 DLI
创建队列 - 数据湖探索 DLI

创建队列功能介绍该API用于创建队列，该队列将会绑定用户指定的计算资源。新队列第一次运行作业时，需要一定的时间，通常为5~15分钟。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v1.0/{project_id}/queues 参数说明

 帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
Spark SQL常用配置项说明 - 数据湖探索 DLI

by a1, a2 with cube spark.sql.distinct.aggregator.enabled false dli.jobs.sql.resubmit.enable null 通过设置该参数可以控制在driver故障、队列重启时Spark SQL作业是否重新提交。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

图1 获取kafka source kafka sink可以在initializeState里引入。图2 获取kafka sink 操作步骤从Kafka实例的基本信息页面下载SSL证书，解压后将其中的clinet.jks文件上传到OBS。图3 下载SSL证书在DLI控制台，打开“数据管理

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

如果MRS集群开启了Kerberos认证，创建Spark作业时需要将krb5.conf和user.keytab文件添加到作业的依赖文件中，未开启Kerberos认证该步骤忽略。如图1所示：图1 添加依赖文件在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

如果需要同时设定扩容和缩容，则需要创建两个弹性扩缩容定时任务，分别设定扩容和缩容的“任务名称”、“最终CUs”和“执行时间”，具体请参考表1。操作步骤如下：在DLI管理控制台左侧，选择“资源管理 > 队列管理”。选择需要设置弹性扩缩容定时任务的队列，单击“操作”列“更多”中的“弹性扩缩容定时任务”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

7（EOS）管理作业 DLI配置SparkUI只展示最新的100条作业信息。控制台界面查询结果最多显示1000条作业结果数据，如果需要查看更多或者全量数据，则可以通过该功能将数据导出到OBS获取。导出作业运行日志需要具有OBS桶的权限，请提前在“全局配置 > 工程配置”页面配置DLI作业桶。

帮助中心 > 数据湖探索 DLI > 产品介绍
创建并提交Spark作业 - 数据湖探索 DLI

创建批处理作业：创建并提交Spark批处理作业。查询批处理作业状态：查看批处理作业状态。查询批处理作业日志：查看批处理作业日志。操作步骤创建弹性资源池elastic_pool_dli 接口相关信息 URI格式：POST /v3/{project_id}/elastic-resource-pools

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
DLI弹性资源池与队列简介 - 数据湖探索 DLI

使用方法：先创建弹性资源池，然后在弹性资源池中创建队列并分配计算资源，队列关联到具体的作业和数据处理任务。购买弹性资源池并在弹性资源池中添加队列的具体操作步骤请参考创建弹性资源池并添加队列。全局共享模式：全局共享模式是一种根据SQL查询中实际扫描的数据量来分配计算资源的模式，不支持指定或预留计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
pyspark样例代码 - 数据湖探索 DLI

如果MRS集群开启了Kerberos认证，创建Spark作业时需要将krb5.conf和user.keytab文件添加到作业的其他依赖文件中，未开启Kerberos认证该步骤忽略。如图1所示：图1 添加依赖文件在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

方法创建的数据和read.format() 方法及read.jdbc() 方法查询的数据都为DataFrame对象，可以直接进行查询单条记录等操作（在“步骤4”中，提到将DataFrame数据注册为临时表）。 where where 方法中可传入包含and 和 or 的条件筛选表达式，返回过滤后的DataFrame对象，示例如下：

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

dk-java-x.x.x.zip”压缩包中获取。“dli-sdk-java-x.x.x.zip”压缩包可以参考SDK的获取与安装中的操作步骤获取。父主题： SQL作业相关

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关

总条数： 581

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Redis源表 - 数据湖探索 DLI

JDBC - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

创建并提交Flink作业 - 数据湖探索 DLI

将OBS数据导入至DLI - 数据湖探索 DLI

提交SQL作业（废弃） - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

创建队列 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

创建并提交Spark作业 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线