搜索_华为云

CREATE VIEW - 数据湖探索 DLI
CREATE VIEW - 数据湖探索 DLI

述。在HetuEngine中创建的视图，视图的定义以编码方式存储在数据源里。在数据源可以查询到该视图，但无法对该视图执行操作。视图是只读的，不可对它执行LOAD、INSERT操作。视图可以包含ORDER BY和LIMIT子句，如果关联了该视图的查询语句也包含了这些子句，那么查询语句中的ORDER

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
COMPACTION - 数据湖探索 DLI
COMPACTION - 数据湖探索 DLI

在其中执行删除操作的Hudi表的名称。 tablelocation Hudi表的存储路径 instant-time 执行show compaction命令可以看到instant-time 示例 schedule compaction on h1; show compaction on h1; run

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
Hudi数据表Archive规范 - 数据湖探索 DLI

Archive作业每天至少执行一次，可以2~4小时执行一次。 Hudi的MOR表和COW表都需要保证每天至少1次Archive，MOR表的Archive可以参考2.2.1.6小节和Compaction放在一起异步去执行。COW的Archive可以在写数据时自动判断是否执行。父主题：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
复杂类型 - 数据湖探索 DLI
复杂类型 - 数据湖探索 DLI

| {x=1, y=2.0} (1 row) --命名后的字段，可以通过域操作符"."访问 select col1.b from row_tb; -- HetuEngine --命名和未命名的字段，都可以通过位置索引来访问，位置索引从1开始，且必须是一个常量 select col1[1]

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
删除表 - 数据湖探索 DLI
删除表 - 数据湖探索 DLI

成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。注意事项所要删除的表必须是当前数据库下存在的，否则会出错，可以通过添加IF EXISTS来避免出错。示例参考创建OBS表或者创建DLI表中的示例描述创建对应的表。在当前所在数据库下删除名为test的表。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关
全外连接 - 数据湖探索 DLI
全外连接 - 数据湖探索 DLI

JOIN：根据左表与右表的所有记录进行匹配，没有匹配值的记录返回NULL。注意事项所要进行JOIN连接的表必须是已经存在的表，否则会出错。示例利用全外连接可以将两张表中的所有记录返回，没有匹配值的左表及右表记录将返回NULL。 1 2 SELECT student_info.name, course_info

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
表别名 - 数据湖探索 DLI
表别名 - 数据湖探索 DLI

attr_expr_list FROM table_reference [AS] alias; 关键字 table_reference：可以是表，视图或者子查询。 AS：可用于连接table_reference和alias，是否添加此关键字不会影响命令执行结果。注意事项所要查询的表必须是已经存在的，否则会出错。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 别名SELECT
怎样将一个区域中的DLI表数据同步到另一个区域中？ - 数据湖探索 DLI

怎样将一个区域中的DLI表数据同步到另一个区域中？可以使用OBS跨区域复制功能实现，步骤如下：将区域一中的DLI表数据导出到自定义的OBS桶中。具体请参考《数据湖探索用户指南》。通过OBS跨区域复制功能将数据复制至区域二的OBS桶中。具体请参考跨区域复制。根据需要导入或使用对应的数据。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？缺少pymysql模块，可以查看是否有对应的egg包，如果没有，在“程序包管理”页面上传pyFile。具体步骤参考如下：将egg包上传到指定的OBS桶路径下。登录DLI管理控制台，单击“数据管理

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
DLI是否存在Apache Spark 命令注入漏洞（CVE-2022-33891）？ - 数据湖探索 DLI

enable配置项，所以不涉及Apache Spark 命令注入漏洞（CVE-2022-33891）。该漏洞主要影响在启用了ACL（访问控制列表）时，可以通过提供任意用户名来执行命令导致数据安全受到威胁。 DLI在设计时充分考虑了数据安全和数据隔离，因此没有启用相关的配置项，所以不会受到这个漏洞的影响。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

适合在大规模消息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进行对接。且用户可以根据实际所需设置相应安全组规则。注意事项对接的Kafka集群不支持开启SASL_SSL。语法格式 1 2 3 4 5 6

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

适合在大规模消息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进行对接。且用户可以根据实际所需设置相应安全组规则。注意事项对接的Kafka集群不支持开启SASL_SSL。语法格式 1 2 3 4 5 6

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
DML语法定义 - 数据湖探索 DLI
DML语法定义 - 数据湖探索 DLI

对于标识符（表、属性、函数名）有类似于 Java 的词法约定: 不管是否引用标识符，都保留标识符的大小写。且标识符需区分大小写。与 Java 不一样的地方在于，通过反引号，可以允许标识符带有非字母的字符（如："SELECT a AS `my field` FROM t"）。字符串文本常量需要被单引号包起来（如 SELECT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义
Java开发环境配置 - 数据湖探索 DLI

8或更高版本。考虑到后续版本的兼容性，推荐使用1.8版本。在Java运行环境配置好的情况下，打开windows的命令行，执行命令Java -version，可以检查版本信息。操作步骤安装JDK。从Oracle官网下载并安装JDK1.8版本安装包。配置环境变量，在“控制面板”选择“系统”属性，单击“环境变量”。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
内连接 - 数据湖探索 DLI
内连接 - 数据湖探索 DLI

JOIN/INNER JOIN：只显示参与连接的表中满足JOIN条件的记录。注意事项所要进行JOIN连接的表必须是已经存在的表，否则会出错。在一次查询中可以连接两个以上的表。示例通过将student_info与course_info两张表中的课程编号匹配建立JOIN连接，来查看学生姓名及所选课程名称。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

创建函数功能描述 DLI支持创建使用UDF和UDTF等自定义函数应用于Spark作业开发当中。具体使用自定义函数端到端的开发指导可以参考：Spark SQL作业使用UDF和Spark SQL作业使用UDTF。语法格式 1 2 3 4 5 CREATE FUNCTION [db_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

JDBC结果表功能描述 DLI将Flink作业的输出数据输出到关系型数据库中。前提条件要与实例建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
DLI常用跨源分析开发方式 - 数据湖探索 DLI

I跨源分析。本节操作介绍DLI支持的数据源对应的开发方式。使用须知 Flink作业访问DIS，OBS和SMN数据源，无需创建跨源连接，可以直接访问。推荐使用增强型跨源连接打通DLI与数据源之间的网络。跨源分析开发方式表1提供DLI支持的数据源对应的开发方式。表1 跨源分析语法参考

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
怎样管理在DLI上运行的作业 - 数据湖探索 DLI

怎样管理在DLI上运行的作业管理大量的DLI作业时您可以采用以下方案：作业分组：将几万个作业根据不同的类型分组，不同类型的作业通过不同的队列运行。创建IAM子用户或者创建IAM子用户，将不同类型的作业通过不同的用户执行。具体请参考《数据湖探索用户指南》。此外DLI还

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

在SparkUI页面可查看Spark作业实时运行资源。图2 SparkUI 在SparkUI页面还可以查看Spark作业原始资源配置（只对新集群开放）。在SparkUI页面，单击“Environment”，可以查看Driver信息和Executor信息。图3 Driver信息图4 Executor信息

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类

总条数： 795

上一页
1
...
34
35
36
...
40
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CREATE VIEW - 数据湖探索 DLI

COMPACTION - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

复杂类型 - 数据湖探索 DLI

删除表 - 数据湖探索 DLI

全外连接 - 数据湖探索 DLI

表别名 - 数据湖探索 DLI

怎样将一个区域中的DLI表数据同步到另一个区域中？ - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

DLI是否存在Apache Spark 命令注入漏洞（CVE-2022-33891）？ - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

DML语法定义 - 数据湖探索 DLI

Java开发环境配置 - 数据湖探索 DLI

内连接 - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

DLI常用跨源分析开发方式 - 数据湖探索 DLI

怎样管理在DLI上运行的作业 - 数据湖探索 DLI

如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线