搜索_华为云

下载并安装JDBC驱动包 - 数据湖探索 DLI

X版本功能重构后，仅支持从DLI作业桶读取查询结果，如需使用该特性需具备以下条件：在DLI管理控制台“全局配置 > 工程配置”中完成作业桶的配置。 2024年5月起，新用户可以直接使用DLI服务的“查询结果写入桶”功能，无需开通白名单。对于2024年5月之前开通并使用DLI服务的用户，如需使用“查询结果写入桶”功能，必须提交工单申请加入白名单。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

tastore是否存在，如果该数据库存在则会导致Spark作业执行失败。因此当Spark3.x的作业日志中如果出现一条访问catalog查询该数据库，并提示数据库不存在是为了确保Spark作业正常运行，无需执行其他操作。父主题： Spark作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
CREATE TABLE AS - 数据湖探索 DLI
CREATE TABLE AS - 数据湖探索 DLI

创建包含SELECT查询结果的新表。使用CREATE TABLE创建空表。使用IF NOT EXISTS子句时，如果表已经存在则不会报错。可选WITH子句可用于设置新创建的表的属性，如表的存储位置（location）、是不是外表（external）等。示例用指定列的查询结果创建新

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
pyspark样例代码 - 数据湖探索 DLI

插入数据 1 sparkSession.sql("insert into test_dds values('3', 'Ann',23)") 查询数据 1 sparkSession.sql("select * from test_dds").show() 提交Spark作业将写好的python代码文件上传至DLI中。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
SHOW SCHEMAS（DATABASES） - 数据湖探索 DLI

--等价写法: SHOW SCHEMAS IN hive LIKE 't%'; 如果匹配字符串中有字符与通配符冲突，可以指定转义字符来标识，示例为查询hive这个catalog下，schema_name前缀为“pm_”的所有schema，转义字符为“/”： SHOW SCHEMAS IN

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

) CUBE ( column [, ...] ) ROLLUP ( column [, ...] ) 描述从零个或多个表中检索行数据。查询stu表的内容。 SELECT id,name FROM stu; 父主题： DQL 语法

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

已创建DLI访问DEW的委托并完成委托授权。该委托需具备以下权限： DEW中的查询凭据的版本与凭据值ShowSecretVersion接口权限，csms:secretVersion:get。 DEW中的查询凭据的版本列表ListSecretVersions接口权限，csms:secretVersion:list。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
按列GROUP BY - 数据湖探索 DLI
按列GROUP BY - 数据湖探索 DLI

以使用多个聚合函数，比如count()，sum()，聚合函数中可以包含其他字段。多列GROUP BY：指GROUP BY子句中不止一列，查询语句将按照GROUP BY的所有字段分组，所有字段都相同的记录将被放在同一组中，同样，GROUP BY中出现的字段必须在attr_expr

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
生成Flink SQL作业的静态流图 - 数据湖探索 DLI

\"[PROCESS, UDF]\",\n \"input_operators_id\" : [ ]\n } ]\n}" } 为了便于查看返回体信息，我们将stream_graph格式化后如下所示： "jid": "65b6a7b0c1ad95b1722a92b49d2f6eba"

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

obs://bucket/checkpoint 编译运行应用程序开发完成后，参考Flink Jar作业开发基础样例将编译打包的JAR包上传到DLI运行，查看对应OBS路径下是否有相关的数据信息。父主题： Flink作业开发指南

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
还原Delta表到早期状态 - 数据湖探索 DLI

timestamp_expression 时间戳，不能晚于当前时间，格式'yyyy-MM-ddTHH:mm:ss.SSS' version_code 1.3.1中查询结果中的版本号示例 RESTORE delta_table0 TO TIMESTAMP AS OF '2020-10-18T22:15:12

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta Time Travel
JOINS - 数据湖探索 DLI
JOINS - 数据湖探索 DLI

nation ,region WHERE nation.name=region.name; OUTER JOIN OUTER JOIN返回符合查询条件的行的同时也返回不符合的行，分为以下三类：左外连接：LEFT JOIN或LEFT OUTER JOIN，表示以左表（nation）为

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

算的随机值之间的比较）。结果中包含一行的概率与任何其他行无关。这不会减少从磁盘读取采样表所需的时间。如果进一步处理采样输出，则可能会影响总查询时间。 SELECT * FROM users TABLESAMPLE BERNOULLI (50); SYSTEM 此采样方法将表划分为

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
Spark 3.1.1版本说明 - 数据湖探索 DLI

【SPARK-21492】：修复排序合并加入中的内存泄漏。【SPARK-27812】：K8S客户端版本提升到4.6.1。 DLI从Spark 3.x版本开始不支持内置地理空间查询函数。父主题：版本支持公告

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

dPayload。 useCache 是否在Spark中缓存表的relation，无需用户配置。为支持SparkSQL中对COW表增量视图查询，默认将COW表中该值置为false。示例创建非分区表 create table if not exists hudi_table0 (

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
创建数据库 - 数据湖探索 DLI
创建数据库 - 数据湖探索 DLI

创建数据库功能描述创建数据库。语法格式 1 2 3 CREATE [DATABASE | SCHEMA] [IF NOT EXISTS] db_name [COMMENT db_comment] [WITH DBPROPERTIES (property_name=property_value

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
SHOW TABLES - 数据湖探索 DLI
SHOW TABLES - 数据湖探索 DLI

Table ------------- show_table1 show_table2 (2 rows) --同时满足多个条件，查询default中'show_'开头或者'in'开头的表 show tables in default like 'show$_%|in%'

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
字符类型 - 数据湖探索 DLI
字符类型 - 数据湖探索 DLI

binary_tb(col1 BINARY); -- 插入数据 INSERT INTO binary_tb values (X'63683F'); --查询数据 select * from binary_tb ; -- 63 68 3f 在做CHAR 数值比较的时候，在对两个仅尾部空格数不

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
Python SDK环境配置 - 数据湖探索 DLI

Python SDK环境配置操作场景在进行二次开发时，要准备的开发环境如表1所示。表1 开发环境准备项说明操作系统 Windows系统，推荐Windows 7及以上版本。安装Python Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
SparkSQL建表参数规范 - 数据湖探索 DLI

hive_sync.enable指定为false。指定为false将导致新写入的分区无法同步到Hive Metastore中。由于缺失新写入的分区信息，查询引擎读取该时会丢数。禁止指定Hudi的索引类型为INMEMORY类型。该索引仅是为了测试使用。生产环境上使用该索引将导致数据重复。建表示例

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范

总条数： 776

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

下载并安装JDBC驱动包 - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

CREATE TABLE AS - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

SHOW SCHEMAS（DATABASES） - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

按列GROUP BY - 数据湖探索 DLI

生成Flink SQL作业的静态流图 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

还原Delta表到早期状态 - 数据湖探索 DLI

JOINS - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

Spark 3.1.1版本说明 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

创建数据库 - 数据湖探索 DLI

SHOW TABLES - 数据湖探索 DLI

字符类型 - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线