搜索_华为云

使用JDBC提交作业 - 数据湖探索 DLI

接DLI服务端提交作业。使用JDBC连接DLI提交的作业运行在Spark引擎上。 JDBC版本2.X版本功能重构后，仅支持从DLI作业桶读取查询结果，如需使用该特性需具备以下条件：在DLI管理控制台“全局配置 > 工程配置”中完成作业桶的配置。提交工单申请开启查询结果写入桶特性的白名单。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南 > 使用JDBC提交Spark SQL作业
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

partitionColumn 读取数据时，用于设置并发使用的数值型字段。说明： “partitionColumn”，“lowerBound”，“upperBound”，“numPartitions”4个参数必须同时设置，不支持仅设置其中一部分。为了提升并发读取的性能，建议使用自增列。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
修改表生命周期的时间 - 数据湖探索 DLI

功能描述修改已存在的分区表或非分区表的生命周期。当第一次开启生命周期时，会扫描表/分区会扫描路径下的表数据文件，更新表/分区的LAST_ACCESS_TIME，耗时与分区数和文件数相关。约束限制表生命周期处于公测阶段，如果有需要请联系客服申请开通白名单。表生命周期功能支持Hi

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 表生命周期管理
修改表生命周期的时间 - 数据湖探索 DLI

功能描述修改已存在的分区表或非分区表的生命周期。当第一次开启生命周期时，会扫描表/分区会扫描路径下的表数据文件，更新表/分区的LAST_ACCESS_TIME，耗时与分区数和文件数相关。约束限制表生命周期处于公测阶段，如果有需要请联系客服申请开通白名单。表生命周期功能支持Hi

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

单击所建桶“obs1”，进入“对象”页面。勾选左侧列表中的“对象”，选择“上传对象”，将需要上传的文件“sampledata.csv”上传到指定目录，单击“上传”。 “sampledata.csv”样例文件可以通过新建“sampledata.txt”，复制如下英文逗号分隔的文本内容，再另存为“sampledata

帮助中心 > 数据湖探索 DLI > 快速入门
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

Overwrite).save(); 读取redis中数据 1 sqlContext.read().format("redis").options(map).load().show(); 操作结果提交Spark作业将写好的java代码文件上传至DLI中。控制台操作请参考《数

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
Spark作业开发类 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 Spark jar 如何读取上传文件添加Python包后，找不到指定的Python环境为什么Spark jar 作业一直处于“提交中”？父主题： Spark作业相类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
程序包管理概述 - 数据湖探索 DLI

约束与限制程序包支持删除，但不支持删除程序包组。支持上传的程序包类型： JAR：用户jar文件。 PyFile：用户Python文件。 File：用户文件。 ModelFile：用户AI模型文件。程序包管理页面表1 程序包管理参数参数参数说明分组名称程序包所属分组的名称。如果不分组，则显示“--”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

level=logging.INFO) #import local file test_file_name = "D://test-data_1.txt" out_file_name = "D://test-data_result_1" sc = SparkContext("local"

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
MRS Kafka输入流 - 数据湖探索 DLI

析失败。 start_time 否 kafka数据读取起始时间。当该参数配置时则从配置的时间开始读取数据，有效格式为yyyy-MM-dd HH:mm:ss。start_time要不大于当前时间，若大于当前时间，则不会有数据读取出。 kafka_properties 否可通过该

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输入流
基本语句 - 数据湖探索 DLI
基本语句 - 数据湖探索 DLI

对查询结果进行限制，number参数仅支持INT类型。注意事项所查询的表必须是已经存在的表，否则提示查询错误。在DLI管理控制台提交SQL语句读取binary类型的数据进行展示时，会对binary数据进行Base64转换。示例将表student中，name为Mike的数据记录查询出来，并根据字段score升序排序。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT
SELECT基本语句 - 数据湖探索 DLI

对查询结果进行限制，number参数仅支持INT类型。注意事项所查询的表必须是已经存在的表，否则提示查询错误。在DLI管理控制台提交SQL语句读取binary类型的数据进行展示时，会对binary数据进行Base64转换。示例将表student中，name为Mike的数据记录查询出来，并根据字段score升序排序。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线）
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

Kafka读取数据的启动位点。取值如下： earliest-offset：从Kafka最早分区开始读取。 latest-offset：从Kafka最新位点开始读取。 group-offsets（默认值）：根据Group读取。 timestamp：从Kafka指定时间点读取。配置该

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

Kafka读取数据的启动位点。取值如下： earliest-offset：从Kafka最早分区开始读取。 latest-offset：从Kafka最新位点开始读取。 group-offsets（默认值）：根据Group读取。 timestamp：从Kafka指定时间点读取。配置该

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
创建程序包 - 数据湖探索 DLI
创建程序包 - 数据湖探索 DLI

支持的包类型如下： JAR：用户jar文件 PyFile：用户Python文件 File：用户文件 ModelFile：用户AI模型文件 OBS路径选择对应程序包的OBS路径。说明：程序包需提前上传至OBS服务中保存。只支持选择文件。分组设置可选择“已有分组”，“创建新分组”或“不分组”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
MRS Kafka输入流 - 数据湖探索 DLI

析失败。 start_time 否 kafka数据读取起始时间。当该参数配置时则从配置的时间开始读取数据，有效格式为yyyy-MM-dd HH:mm:ss。start_time要不大于当前时间，若大于当前时间，则不会有数据读取出。 kafka_properties 否可通过该

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输入流
创建DLI表关联HBase - 数据湖探索 DLI

e的时候进行截断。读取HBase上的Rowkey数据时，如果某个属性的实际数据的长度比属性作为Rowkey时指定的长度要短，则会抛出异常（OutofBoundException）；如果某个属性的实际数据的长度比属性作为Rowkey时指定的长度要长，则会在读取时进行截断。示例 1

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

定包年/包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现详解导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
添加分区（只支持OBS表） - 数据湖探索 DLI

LOCATION 'obs_path'。若新增分区指定的路径包含子目录（或嵌套子目录），则子目录下面的所有文件类型及内容也将作为该分区的记录。您需要保证该分区目录下所有文件类型和文件内容与表的字段一致，否则查询将报错。您可以在建表语句OPTIONS中设置“multiLevelDir

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
Doris源表 - 数据湖探索 DLI
Doris源表 - 数据湖探索 DLI

read.field -- 否读取 Doris 表的列名列表，多列之间使用逗号分隔。 doris.filter.query -- 否过滤读取数据的表达式，此表达式透传给 Doris。Doris 使用此表达式完成源端数据过滤。示例该示例是从Doris源表读取数据，并输入到 print

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris

总条数： 420

上一页
1
...
4
5
6
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用JDBC提交作业 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

修改表生命周期的时间 - 数据湖探索 DLI

修改表生命周期的时间 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

程序包管理概述 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

MRS Kafka输入流 - 数据湖探索 DLI

基本语句 - 数据湖探索 DLI

SELECT基本语句 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

创建程序包 - 数据湖探索 DLI

MRS Kafka输入流 - 数据湖探索 DLI

创建DLI表关联HBase - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

添加分区（只支持OBS表） - 数据湖探索 DLI

Doris源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线