搜索_华为云

创建并提交SQL作业 - 数据湖探索 DLI

创建并提交SQL作业 SQL编辑器简介 SQL作业编辑器支持使用SQL语句执行数据查询操作。支持SQL2003，兼容SparkSQL，详细语法描述请参见《数据湖探索SQL语法参考》。在总览页面，单击左侧导航栏中的“SQL编辑器”或SQL作业简介右上角的“创建作业”，可进入“SQL编辑器”页面。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通操作场景公网数据源指的是可以通过互联网访问的数据源。这些数据源资源有一个公网IP地址，配置DLI与公网网络联通可以实现对这些数据源的访问。本节提供了详细的操作指导，介绍如何通过设置SNAT规则和配置路由信息，实现DLI服务与公网的网络连接。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
数组函数和运算符 - 数据湖探索 DLI

array2[, ...]) -> array(row) 描述：将给定数组按元素合并到单个行数组中。第N个自变量的第M个元素将是第M个输出元素的第N个字段。如果参数长度不均匀，则缺少的值将填充为NULL。 SELECT zip(ARRAY[1, 2], ARRAY['1b', null, '3b']);

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
变更普通队列规格 - 数据湖探索 DLI

变更普通队列规格前提条件新创建的包年包月计费队列需要运行作业后才可进行规格变更。本节操作仅适用于普通队列，不适用于弹性资源池队列。注意事项目前只支持64CUs以上规格包年包月队列进行规格变更。如果在“规格变更”页面提示“Status of queue xxx is assigning

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
权限策略和授权项 - 数据湖探索 DLI

权限策略和授权项如果您需要对您所拥有的DLI服务进行精细的权限管理，您可以使用统一身份认证服务（Identity and Access Management，简称IAM），如果华为云账号已经能满足您的要求，不需要创建独立的IAM用户，您可以跳过本章节，不影响您使用DLI服务的其它功能。

帮助中心 > 数据湖探索 DLI > API参考
最新动态 - 数据湖探索 DLI
最新动态 - 数据湖探索 DLI

最新动态本文介绍了数据湖探索DLI各特性版本的功能发布和对应的文档动态，新特性将在各个区域（Region）陆续发布，欢迎体验。 2020年8月序号功能名称功能描述阶段相关文档 1 集成TPC-H测试套件用户可以通过DLI内置的TPC-H测试套件进行简单高效的交互式查

 帮助中心 > 数据湖探索 DLI > 最新动态
Postgres CDC源表 - 数据湖探索 DLI

Postgres CDC源表功能描述 Postgres的CDC源表，即Postgres的流式源表，用于依次读取PostgreSQL数据库全量快照数据和变更数据，保证不多读一条也不少读一条数据。即使发生故障，也能采用Exactly Once方式处理。前提条件 PostgreSQL

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

OPTIONS('MODE'='permissive') PERMISSIVE（默认）：尽可能地解析bad records，如果遇到不能转换的字段，则整行为null DROPMALFORMED：忽略掉无法解析的bad records FAILFAST：遇到无法解析的记录时，抛出异常并使Job失败

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
导出DLI表数据至OBS中 - 数据湖探索 DLI

导出DLI表数据至OBS中支持将数据从DLI表中导出到OBS服务中，导出操作将在OBS服务新建文件夹，或覆盖已有文件夹中的内容。注意事项支持导出json格式的文件，且文本格式仅支持UTF-8。只支持将DLI表（表类型为“Managed”）中的数据导出到OBS桶中，且导出的路径必须指定到文件夹级别。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
在Spark SQL作业中使用UDF - 数据湖探索 DLI

在Spark SQL作业中使用UDF 操作场景 DLI支持用户使用Hive UDF（User Defined Function，用户定义函数）进行数据查询等操作，UDF只对单行数据产生作用，适用于一进一出的场景。约束限制在DLI Console上执行UDF相关操作时，需要使用自建的SQL队列。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

使用DLI提交Spark Jar作业操作场景 DLI允许用户提交编译为Jar包的Spark作业，Jar包中包含了Jar作业执行所需的代码和依赖信息，用于在数据查询、数据分析、机器学习等特定的数据处理任务中使用。在提交Spark Jar作业前，将程序包上传至OBS，并将程序包与数据和作业参数一起提交以运行作业。

帮助中心 > 数据湖探索 DLI > 快速入门
Spark jar 如何读取上传文件 - 数据湖探索 DLI

Spark jar 如何读取上传文件 Spark可以使用SparkFiles读取 –-file中提交上来的文件的本地路径，即：SparkFiles.get("上传的文件名")。 Driver中的文件路径与Executor中获取的路径位置是不一致的，所以不能将Driver中获取到的

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
FileSystem结果表 - 数据湖探索 DLI

这之后，原始的临时文件也会被删除掉。分区功能 Filesystem sink支持分区功能，通过partitioned by语法根据选择的字段进行分区。示例如下： path └── datetime=2022-06-25 └── hour=10 ├── part-0

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

DWS源表功能描述 DLI将Flink作业从数据仓库服务（DWS）中读取数据。DWS数据库内核兼容PostgreSQL，PostgreSQL数据库可存储更加复杂类型的数据，支持空间信息服务、多版本并发控制（MVCC）、高并发，适用场景包括位置应用、金融保险、互联网电商等。数据仓库服务（Data

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

DWS结果表功能描述 DLI将Flink作业的输出数据输出到数据仓库服务（DWS）中。DWS数据库内核兼容PostgreSQL，PostgreSQL数据库可存储更加复杂类型的数据，支持空间信息服务、多版本并发控制（MVCC）、高并发，适用场景包括位置应用、金融保险、互联网电商等。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

使用DLI提交Flink Jar作业操作场景 Flink Jar作业适用于需要自定义流处理逻辑、复杂的状态管理或特定库集成的数据分析场景。需要用户自行编写并构建Jar作业程序包，在提交Flink Jar作业前，将Jar作业程序包上传至OBS，并将程序包与数据和作业参数一起提交以运行作业。

帮助中心 > 数据湖探索 DLI > 快速入门
典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略场景介绍一个企业有多个部门，多个部门不同业务数据分析的时间段可能有所差异，具体场景如下： A部门：在00:00-09:00时间段内资源请求量大，其他时间段有短时间的资源请求量不大的任务运行。 B部门：在10:00-22:00时间段内资

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
普通队列弹性扩缩容 - 数据湖探索 DLI

普通队列弹性扩缩容前提条件新创建的按需计费队列需要运行作业后才可进行弹性扩缩容。本节操作仅适用于普通队列，不适用于弹性资源池队列。约束与限制 16CUs队列不支持扩容和缩容。 64CUs队列不支持缩容。目前只支持计费模式为“按需/CU时”和“按需/专属资源模式”的队列进行弹性扩缩容。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
Hudi数据表Compaction规范 - 数据湖探索 DLI

Hudi数据表Compaction规范 mor表更新数据以行存log的形式写入，log读取时需要按主键合并，并且是行存的，导致log读取效率比parquet低很多。为了解决log读取的性能问题，Hudi通过compaction将log压缩成parquet文件，大幅提升读取性能。规则

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
查询所有作业 - 数据湖探索 DLI

查询所有作业功能介绍该API用于查询当前project下的所有作业的信息。调试您可以在API Explorer中调试该接口。 URI URI格式： GET /v1.0/{project_id}/jobs 参数说明表1 URI 参数参数名称是否必选参数类型说明 project_id

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API

总条数： 350

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建并提交SQL作业 - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

数组函数和运算符 - 数据湖探索 DLI

变更普通队列规格 - 数据湖探索 DLI

权限策略和授权项 - 数据湖探索 DLI

最新动态 - 数据湖探索 DLI

Postgres CDC源表 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

Spark jar 如何读取上传文件 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

普通队列弹性扩缩容 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

查询所有作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线