搜索_华为云

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

列”选择已创建的SQL队列。在编辑器中输入以下语句创建数据库，例如当前创建迁移后的DLI数据库testdb。详细的DLI创建数据库的语法可以参考创建DLI数据库。 create database testdb; 在数据库下创建表。如果是通过在MRS Hive中的“show create

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

在创建Spark作业时，配置了“高级配置”中的参数，此处才会显示对应的内容。创建Spark作业请参考《创建Spark作业》。图1 查看Spark作业原始资源配置查看Spark作业实时运行资源查看Spark作业实时运行资源，即查看有多少CU正在运行。登录DLI 控制台，单击左侧“作业管理”>“Sp

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
查询作业执行计划 - 数据湖探索 DLI

ph 参数说明表1 URI参数说明参数名称是否必选参数类型说明 project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。 job_id 是 Long 作业ID。请求消息无请求参数。响应消息表2 响应参数说明参数名称是否必选

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
删除队列 - 数据湖探索 DLI
删除队列 - 数据湖探索 DLI

如果待删除的队列中有正在提交或正在运行的作业，将不支持删除操作。删除队列不会导致您数据库中的表数据丢失。删除队列步骤在DLI管理控制台左侧，选择“资源管理 > 队列管理”。选择待删除的队列，单击“操作”列的“删除”删除。图1 删除队列如果“操作”列的“删除”为灰色

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
DLI SDK与API的对应关系 - 数据湖探索 DLI

SQL作业相关表4 SQL作业相关API&SDK的对应关系表 Class Method Java Method Python Method API Database 创建数据库 createDatabase create_database POST /v1.0/{project_id}/databases

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

Spark作业在执行shuffle类语句，包括group by、join等场景时，常常会出现数据倾斜的问题，导致作业任务执行缓慢。该问题可以通过设置spark.sql.shuffle.partitions提高shuffle read task的并行度来进行解决。设置spark.sql.shuffle.partitions参数提高并行度

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
JSON Format - 数据湖探索 DLI
JSON Format - 数据湖探索 DLI

out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取.out文件查看结果日志。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

sink 操作步骤从Kafka实例的基本信息页面下载SSL证书，解压后将其中的clinet.jks文件上传到OBS。图3 下载SSL证书在DLI控制台，打开“数据管理 > 程序包管理”，单击“创建”，创建clinet.jks对应的程序包。主要参数的填写说明：包类型：File OBS路径：clinet

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
创建表时指定表的生命周期 - 数据湖探索 DLI

创建表时指定表的生命周期功能描述 DLI提供了表生命周期管理功能，在创建表时指定表的生命周期。DLI会根据每张表的最后修改时间和表的生命周期来判断是否要回收此表。通过设置表的生命周期，可以帮助您更好的管理数目众多的表，自动清理长期不再使用的数据表，简化数据表的回收流程。同时支持数据恢复设置，避免因误操作丢失数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
查看数据库的使用者（废弃） - 数据湖探索 DLI

sers 参数说明表1 URI 参数参数名称是否必选说明 project_id 是项目编号，用于资源隔离。获取方式请参考获取项目ID。 database_name 是被查询的数据库名称。请求消息无请求参数。响应消息表2 响应参数参数名称是否必选参数类型说明

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）
Hudi数据表Compaction规范 - 数据湖探索 DLI

新版本的Parquet文件，那旧版本的文件就不能被Clean清理，增加存储压力。提交Spark jar作业时，CPU与内存比例为1:4~1:8。 Compaction作业是将存量的parquet文件内的数据与新增的log中的数据进行合并，需要消耗较高的内存资源，按照之前的表设计

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Flink作业概述 - 数据湖探索 DLI
Flink作业概述 - 数据湖探索 DLI

Flink作业概述 DLI支持的两种类型的Flink作业： Flink OpenSource SQL类型作业：完全兼容社区版的Flink，确保了作业可以在这些Flink版本上无缝运行。在社区版Flink的基础上，DLI扩展了Connector的支持，新增了Redis、DWS作

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
VACUUM - 数据湖探索 DLI
VACUUM - 数据湖探索 DLI

Delta 管理的所有文件，并删除不再处于表事务日志最新状态且超过保留期阈值的数据文件。默认阈值为 7 天。注意事项 RETAIN num HOURS表示保留期阈值，建议设置为至少 7 天。如果对 Delta 表运行VACUUM，则将无法再回头查看在指定数据保留期之前创建的版本。 Delta

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

SQL类型的队列。数据库名称选择DLI下已创建的数据库。当前示例为在DLI上创建数据库和表中创建的数据库名，即为“testdb”。表名选择DLI下已创建的表名。当前示例为在DLI上创建数据库和表中创建的表名，即为“testdlitable”。导入前清空数据选择导入前是否清空目的表的数据。当前示例选择为“否”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
数学运算函数 - 数据湖探索 DLI

关系运算符所有数据类型都可用关系运算符进行比较，并返回一个BOOLEAN类型的值。关系运算符均为双目操作符，被比较的两个数据类型必须是相同的数据类型或者是可以进行隐式转换的类型。 Flink SQL提供的关系运算符，请参见表1。表1 关系运算符运算符返回类型描述 A = B

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
DESCRIBE DATABASE| SCHEMA - 数据湖探索 DLI

DESCRIBE DATABASE| SCHEMA 语法 DESCRIBE DATABASE|SCHEMA [EXTENDED] schema_name 描述 DATABASE和SCHEMA在此处是等价的，可互换的，它们有这相同的含义。该语法用于显示SCHEMA的名称、注释、还有它在文件系统上的根路径。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 辅助命令语法
SET - 数据湖探索 DLI
SET - 数据湖探索 DLI

TABLE table UNSET TBLPROPERTIES [IF EXISTS] ('comment', 'key') 系统响应通过运行DESCRIBE命令查看表属性修改。父主题： Schema演进语法说明

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Schema演进语法说明
为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

overwrite覆盖分区表数据的时候，覆盖了全量数据？当您使用insert overwrite语句覆盖分区表的数据时，如果发现它覆盖了全量数据而不是预期的分区数据，这可能是因为动态分区覆盖功能没有被启用。如果需要动态覆盖DataSource表指定的分区数据，您需要先配置参数 dli

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Flink OpenSource SQL1.12语法概览 - 数据湖探索 DLI

本章节介绍目前DLI所提供的Flink OpenSource SQL1.12语法列表。参数说明，示例等详细信息请参考具体的语法说明。创建表相关语法表1 创建表相关语法语法分类功能描述创建源表 DataGen源表 DWS源表 Hbase源表 JDBC源表 Kafka源表 MySQL CDC源表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

localFilePath 是 - 存放Spark程序中使用的jar包、Python程序文件、配置文件等的本地目录。程序会自动将Spark程序依赖到的相关文件上传的OBS路径，并加载到DLI服务端资源包。 ak 是 - 用户的Access Key。 sk 是 - 用户的Secret Key。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI

总条数： 1221

上一页
1
...
12
13
14
...
62
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

查询作业执行计划 - 数据湖探索 DLI

删除队列 - 数据湖探索 DLI

DLI SDK与API的对应关系 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

JSON Format - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

查看数据库的使用者（废弃） - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

Flink作业概述 - 数据湖探索 DLI

VACUUM - 数据湖探索 DLI

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

数学运算函数 - 数据湖探索 DLI

DESCRIBE DATABASE| SCHEMA - 数据湖探索 DLI

SET - 数据湖探索 DLI

为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

Flink OpenSource SQL1.12语法概览 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线