搜索_华为云

Spark SQL语法概览 - 数据湖探索 DLI

语法分类操作链接数据库相关语法创建数据库删除数据库查看指定数据库查看所有数据库创建OBS表相关语法使用DataSource语法创建OBS表使用Hive语法创建OBS表创建DLI表相关语法使用DataSource语法创建DLI表使用Hive语法创建DLI表删除表相关语法

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
配置DLI作业桶 - 数据湖探索 DLI

操作前准备配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
使用DLI分析电商BI报表 - 数据湖探索 DLI

将数据上传到对象存储服务OBS，为后面使用DLI完成数据分析做准备。下载OBS Browser+。下载地址请参考《对象存储服务工具指南》。安装OBS Browser+。安装步骤请参考《对象存储服务工具指南》。登录OBS Browser+。OBS Browser+支持AK方式登录，以及授

 帮助中心 > 数据湖探索 DLI > 最佳实践
创建DLI表关联RDS - 数据湖探索 DLI

193:3306/postgres"。说明：经典型跨源的连接地址默认格式为："协议头://访问地址:访问端口" 例如：jdbc:mysql://to-rds-1174405119-oLRHAGE7.datasource.com:3306 如果想要访问RDS的postgre集群，需要将连接地址中的协议头修改为"

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接RDS表
ADD CONSTRAINT - 数据湖探索 DLI
ADD CONSTRAINT - 数据湖探索 DLI

成。 table_name Database中的表名，由字母、数字和下划线（_）组成。 bucket_name obs桶名称。 tbl_path Delta表在obs桶中的存储位置。 constraint_name 约束名称。 boolExpression 约束条件表达式。所需权限

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
创建Flink Jar作业 - 数据湖探索 DLI

选择作业运行时使用的队列资源。应用程序选择Jar作业程序包。 Jar包的管理方式：上传OBS管理程序包：提前将对应的jar包上传至OBS桶中。并在此处选择对应的OBS路径。上传DLI管理程序包：提前将对应的jar包上传至OBS桶中，并在DLI管理控制台的“数据管理>程序包管理”中创建程序包，具体操作请参考创建DLI程序包。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
开启或关闭数据多版本 - 数据湖探索 DLI

作丢失数据。其他多版本SQL语法请参考多版本备份恢复数据。 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建表语法可以参考使用Hive语法创建OBS表。语法格式开启多版本功能 ALTER TABLE [db_name.]table_name SET TBLPROPERTIES

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 修改表
VACUUM - 数据湖探索 DLI
VACUUM - 数据湖探索 DLI

成。 table_name Database中的表名，由字母、数字和下划线（_）组成。 bucket_name obs桶名称。 tbl_path Delta表在obs桶中的存储位置。 num 保留期时长所需权限 SQL权限表2 VACUUM所需权限列表权限描述表的UPDATE权限

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
Upsert Kafka源表 - 数据湖探索 DLI

SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。 Upsert Kafka 始终以upsert方式工作，并且需要在DDL中定义主键。在具有相同主键值的消息按序存储在同一个分区的前提下，在 changlog

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
DLI Hudi元数据 - 数据湖探索 DLI
DLI Hudi元数据 - 数据湖探索 DLI

Hudi支持对接DLI元数据和Lakeformation元数据（仅Spark 3.3.1及以上版本支持对接Lakeformation元数据），对接方式与Spark一致。 DLI元数据可在数据湖探索管理控制台的“数据管理 > 库表管理”中查看。 Lakeformation元数据可在湖仓构建

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

table_comment 表的描述信息。 location_path OBS路径，指定该路径Hudi 表会创建为外表。 options_list Hudi table属性列表。表2 CREATE TABLE Options描述参数描述 primaryKey 主键名，多个字段用逗号分隔，该字段为必填字段。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

file：用户文件 modelfile：用户AI模型文件 obs_jar_paths：对应资源包的OBS路径，参数构成为：{bucketName}.{obs域名}/{jarPath}/{jarName}。例如："https://bucketname.obs.cn-north-1.myhuaweicloud

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

编写UDAF函数代码 3 调试，编译代码并导出Jar包 4 上传Jar包到OBS OBS控制台将生成的UDAF函数Jar包文件上传到OBS目录下。 5 创建DLI程序包 DLI控制台选择刚上传到OBS的UDAF函数的Jar文件，由DLI进行纳管。 6 创建DLI的UDAF函数

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Hadoop jar包冲突，导致Flink提交失败 - 数据湖探索 DLI

RuntimeException: java.lang.ClassNotFoundException: Class org.apache.hadoop.fs.obs.metrics.OBSAMetricsProvider not found at org.apache.hadoop.conf.Configuration

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
在Spark SQL作业中使用UDF - 数据湖探索 DLI

参考操作步骤说明，编写UDF函数代码。 2 编写UDF函数代码 3 调试，编译代码并导出Jar包 4 上传Jar包到OBS OBS控制台将生成的UDF函数Jar包文件上传到OBS目录下。 5 创建DLI的UDF函数 DLI控制台在DLI控制台的SQL作业管理界面创建使用的UDF函数。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

用户需要在代码里写入checkpoint才能开启。作业模板内置多个常见Flink SQL通用场景模板，帮助您快速了解和构建作业代码暂无企业安全访问控制与华为云IAM权限打通，支持多角色的访问控制暂无空间隔离支持租户级和项目级的资源和代码隔离，满足多团队协作需求暂无父主题： DLI产品咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
设置多版本备份数据保留周期 - 数据湖探索 DLI

开启和关闭多版本功能SQL语法请参考开启或关闭数据多版本。 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建表SQL语法可以参考使用Hive语法创建OBS表。语法格式 1 2 ALTER TABLE [db_name.]table_name SET TBLPROPERTIES

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
JDBC维表 - 数据湖探索 DLI
JDBC维表 - 数据湖探索 DLI

OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。 Flink跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证。跨源认证简介及操作方法请参考跨源认证简介。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
file - 数据湖探索 DLI
file - 数据湖探索 DLI

file_format 格式 | AVRO | CSV | JSON | ORC | PARQUET 说明目前包含以上6种格式。指定数据格式的方式有两种，一种是USING，可指定以上6种数据格式，另一种是STORED AS，只能指定ORC和PARQUET。 ORC对RCFile做了优

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
Hudi表索引设计规范 - 数据湖探索 DLI

Hudi表索引设计规范规则禁止修改表索引类型。 Hudi表的索引会决定数据存储方式，随意修改索引类型会导致表中已有的存量数据与新增数据之间出现数据重复和数据准确性问题。常见的索引类型如下：布隆索引：Spark引擎独有索引，采用bloomfiter机制，将布隆索引内容写入到Parquet文件的footer中。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范

总条数： 941

上一页
1
...
34
35
36
...
48
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark SQL语法概览 - 数据湖探索 DLI

配置DLI作业桶 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

创建DLI表关联RDS - 数据湖探索 DLI

ADD CONSTRAINT - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

开启或关闭数据多版本 - 数据湖探索 DLI

VACUUM - 数据湖探索 DLI

Upsert Kafka源表 - 数据湖探索 DLI

DLI Hudi元数据 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

Hadoop jar包冲突，导致Flink提交失败 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

设置多版本备份数据保留周期 - 数据湖探索 DLI

JDBC维表 - 数据湖探索 DLI

file - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线