搜索_华为云

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

conf 修改DLI Livy工具配置文件上传指定的DLI Livy工具jar资源包到OBS桶路径下。登录OBS控制台，在指定的OBS桶下创建一个存放Livy工具jar包的资源目录。例如：“obs://bucket/livy/jars/”。进入3.a中DLI Livy工具所在E

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
FileSystem源表 - 数据湖探索 DLI
FileSystem源表 - 数据湖探索 DLI

OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。数据类型的使用，请参考Format章节。语法格式 1 2 3 4 5 6 7 create table dataGenSource(

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
创建Bucket索引表调优 - 数据湖探索 DLI

持续大量新增数据的维度表方法一：预留桶数，如使用非分区表则需通过预估较长一段时间内的数据增量来预先增加桶数，缺点是随着数据的增长，文件依然会持续膨胀；方法二：大粒度分区（推荐），如果使用分区表则需要根据数据增长情况来计算，例如使用年分区，这种方式相对麻烦些但是多年后表无需重新导入。方法三：数据

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

location:obs://bucket/user/hive/warehouse/show_schema.db/show_table1 InputFormat:org

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

提供的跨源认证。跨源认证简介及操作方法请参考跨源认证简介。注意事项创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。如果JDB

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

“安全组”章节。 Flink跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证。跨源认证简介及操作方法请参考跨源认证简介。 MySQL已开启了Binlog，并且binlog_row_image设置为FULL。已创建MySQL用户，并授予了SELECT、

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
导出查询结果 - 数据湖探索 DLI

OPTIONS：导出时的属性列表，为可选项。参数表1 INSERT OVERWRITE DIRECTORY参数描述参数描述 path 要将查询结果写入的OBS路径。 file_format 写入的文件格式，支持按CSV、Parquet、ORC、JSON、Avro格式。 file_format为c

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

shuffle.partitions参数提高并行度用户可在JDBC中通过set方式设置dli.sql.shuffle.partitions参数。具体方法如下： Statement st = conn.stamte() st.execute("set spark.sql.shuffle.partitions=20")

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
查看所有表 - 数据湖探索 DLI
查看所有表 - 数据湖探索 DLI

数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 regex_expression 数据库下的表名称。注意事项无。示例参考创建OBS表或者创建DLI表中的示例描述创建对应的表。查看当前所在数据库中的所有表与视图。 1 SHOW TABLES; 查看testdb数据库下所有以test开头的表。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 查看表
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。数据类型的使用，请参考Format章节。 Hive 方言支持的 DDL 语句，Flink 1.15 当前仅支持使用Hive语法创建OBS表和使用hive语法的DLI Lakehouse表。使用Hive语法创建OBS表 defalut方言：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
CLEAN - 数据湖探索 DLI
CLEAN - 数据湖探索 DLI

Hudi表的名称 tablelocation Hudi表的存储路径示例 run clean on h1; run clean on "obs://bucket/path/h1"; 注意事项对表执行clean操作时需要表的owner才可以执行。如果需要修改clean默认的参数

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
认证鉴权 - 数据湖探索 DLI
认证鉴权 - 数据湖探索 DLI

改。使用AK/SK认证时，您可以基于签名算法使用AK/SK对请求进行签名，也可以使用专门的签名SDK对请求进行签名。详细的签名方法和SDK使用方法请参见API签名指南。签名SDK只提供签名功能，与服务提供的SDK不同，使用时请注意。父主题：如何调用API

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
Spark jar 如何读取上传文件 - 数据湖探索 DLI

Executor获取文件路径的时候，仍然需要使用SparkFiles.get(“filename”)的方式获取。 SparkFiles.get()方法需要spark初始化以后才能调用。图1 添加其他依赖文件代码段如下所示 package main.java import org.apache

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
CREATE TABLE AS - 数据湖探索 DLI
CREATE TABLE AS - 数据湖探索 DLI

property_name = expression [, ...] ) ]② [[STORED AS file_format]① [LOCATION 'obs_path']① [TBLPROPERTIES (orc_table_property = value [, ...] ) ] ]① AS

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
SHOW_LOG_FILE - 数据湖探索 DLI
SHOW_LOG_FILE - 数据湖探索 DLI

=> 'obs://bucket/path/hudi_mor/dt=2021-08-28/.*?log.*?'); call show_logfile_records(table => 'hudi_mor', log_file_path_pattern => 'obs://bu

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
Flink作业相关 - 数据湖探索 DLI
Flink作业相关 - 数据湖探索 DLI

job_ids.add(jobId); job_ids.add(jobId2); GetFlinkJobsMetricsBody body = new GetFlinkJobsMetricsBody(); body.jobIds(job_ids); QueryF

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。数据类型的使用，请参考Format章节。 Hive 方言支持的 DDL 语句，Flink 1.15 当前仅支持使用Hive语法创建OBS表和使用hive语法的DLI Lakehouse表。使用Hive语法创建OBS表 defalut方言：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Java SDK概述 - 数据湖探索 DLI
Java SDK概述 - 数据湖探索 DLI

Key)或Token两种认证方式初始化客户端，具体操作请参考初始化DLI客户端 Java SDK列表表1 Java SDK列表类型说明 OBS授权介绍将OBS桶的操作权限授权给DLI的Java SDK使用说明。队列相关介绍创建队列、获取默认队列、查询所有队列、删除队列的Java SDK使用说明。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

"user_name":"Alice","area_id":"330106"} 用户可按下述操作查看输出结果: 方法一："更多" -> "FlinkUI" -> "Task Managers" -> "Stdout"。方法二：若在提交运行作业前选择了保存日志，则可以从日志的taskmanager.out文件中查看。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

schema) // 步骤3：配置写入的表名和OBS路径 val databaseName = "default" val tableName = "hudi_table" val basePath = "obs://bucket/path/hudi_table"

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业

总条数： 561

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

FileSystem源表 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

查看所有表 - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

CLEAN - 数据湖探索 DLI

认证鉴权 - 数据湖探索 DLI

Spark jar 如何读取上传文件 - 数据湖探索 DLI

CREATE TABLE AS - 数据湖探索 DLI

SHOW_LOG_FILE - 数据湖探索 DLI

Flink作业相关 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

Java SDK概述 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线