搜索_华为云

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

是 - OBS上的桶名称。该桶用于存放Spark程序中使用的jar包、Python程序文件、配置文件等。 obsPath 是 dli-spark-submit-resources OBS上存放jar包、Python程序文件、配置文件等的目录，该目录在bucketName指定的桶下。如果该目录不存在，程序会自动创建。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
DLI SDK简介 - 数据湖探索 DLI
DLI SDK简介 - 数据湖探索 DLI

自研SDK的使用方法。相关开发包请从华为云DLI 开发工具包（SDK）获取。 Java SDK操作指导请参考Java SDK Python SDK操作指导请参考Python SDK DLI SDK调用接口使用https进行访问，有服务端使用证书。

帮助中心 > 数据湖探索 DLI > SDK参考
程序包管理概述 - 数据湖探索 DLI

程序包使用约束限制限制项说明程序包程序包支持删除，但不支持删除程序包组。支持上传的程序包类型： JAR：用户jar文件。 PyFile：用户Python文件。 File：用户文件。 ModelFile：用户AI模型文件。程序包管理页面表2 程序包管理参数参数参数说明分组名称

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
Over聚合 - 数据湖探索 DLI
Over聚合 - 数据湖探索 DLI

ROW 范围内的窗口、FOLLOWING 所描述的区间并未支持。 ORDER BY 必须指定于单个的时间属性。可以在一个 SELECT 子句中定义多个 OVER 窗口聚合。然而，对于流式查询，由于目前的限制，所有聚合的 OVER 窗口必须是相同的。 OVER 窗口需要数据是有序的。因为表没有固定的排序，所以

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
RDS表有自增主键时怎样在DLI插入数据？ - 数据湖探索 DLI

个唯一的id值。使用NULL值：如果您需要在插入数据时明确指定某些字段由数据库自动填充，可以在这些字段的位置填写NULL。这样，数据库会识别到这些字段应该由系统自动生成值，而不是由用户指定。父主题：增强型跨源连接类

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
查询批处理作业状态 - 数据湖探索 DLI

无请求参数。响应消息表2 响应参数说明参数名称是否必选参数类型说明 id 否 String 批处理作业的ID，采用UUID（通用唯一识别码）格式。 state 否 String 批处理作业的状态，请参见创建批处理作业中的表7。请求示例无响应示例 {"id":"0a32

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
怎样获取DLI作业样例（Demo） - 数据湖探索 DLI

读取和写入OBS数据。 “dli-spark-demo-redis”读取和写入Redis数据。 dli-pyspark-demo：使用Python语言开发Spark作业。例如，样例包中的样例代码实现创建Redis表的功能。父主题： DLI产品咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
分组聚合 - 数据湖探索 DLI
分组聚合 - 数据湖探索 DLI

“MIN”（最小）。对于流式查询，用于计算查询结果的状态可能无限膨胀。状态的大小大多数情况下取决于去重行的数量和分组持续的时间，持续时间较短的 group 窗口不会产生状态过大的问题。可以提供一个合适的状态 time-to-live (TTL) 配置来防止状态过大。注意：这可能会影响查询结果的正确性。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

module_name 否 String 资源模块名 module_type 否 String 资源模块类型。 jar：用户jar文件; pyFile：用户python文件; file：用户文件。表4 details参数说明参数名称是否必选参数类型说明 create_time 否 Long

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 - 数据湖探索 DLI

接数，例如，non-active为508，说明当前有大量的空闲连接。解决方案出现该问题时建议通过以下操作步骤解决。登录DWS命令执行窗口，执行以下SQL命令，临时将所有non-active的连接释放掉。 SELECT PG_TERMINATE_BACKEND(pid) from

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

有影响，jar需要升级scala版本编译。 PySpark支持python版本变更说明： PySpark支持python版本变更。 Spark2.4.x：PySpark支持python版本范围2.6+版本到3.7+版本。 Spark3.3.x：PySpark支持Python版本范围3.6及以上版本。升级引擎版本后是否对作业有影响：

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
使用DataSource语法创建DLI表 - 数据湖探索 DLI

示例4：创建DLI非分区表，并自定义列字段数据类型示例说明：创建名为table2的DLI非分区表，您可以根据业务需求自定义列子段的原生数据类型：与文字字符有关可以使用STRING、CHAR或者VARCHAR。与时间有关的可以使用TIMESTAMP、DATE。与整数有关的可以使用INT

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
DLI内置依赖包 - 数据湖探索 DLI

jar log4j-over-slf4j-1.7.26.jar deeplearning4j-core-0.9.1.jar flink-python_2.11-1.10.0.jar logback-classic-1.2.3.jar deeplearning4j-nlp-0.9.1

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
JSON函数 - 数据湖探索 DLI
JSON函数 - 数据湖探索 DLI

如果值为NULL，则ON NULL行为定义要执行的操作。如果省略，则默认为ABSENT ON NULL。目前在OVER窗口、无界session窗口或hop窗口中不支持此功能。 -- '["Apple","Banana","Orange"]' SELECT JSON_ARRAYAGG(product)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

在“设置”页输入驱动相关参数说明，单击“确定”创建驱动。驱动参数配置说明请参考表2。图2 编辑驱动连接表2 驱动相关参数说明参数说明驱动名称命名为便于识别的名称，例如GaussDB Driver。驱动类型驱动类型选择Generic。类名类名 URL模板 DLI JDBC驱动连接的格式：

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

见表1。 # 以下参数均支持在提交作业时覆盖。 spark.yarn.isPython=true spark.pyspark.python=python3 # 当前参数值为生产环境web地址 spark.dli.user.uiBaseAddress=https://console

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

spark.sql(sql).show() } spark.close() } } Python样例代码 #!/usr/bin/python # -*- coding: UTF-8 -*- from __future__ import print_function

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Hudi Clustering操作说明 - 数据湖探索 DLI

调度Clustering：使用可插拔的Clustering策略创建Clustering计划。识别符合Clustering条件的文件：根据所选的Clustering策略，调度逻辑将识别符合Clustering条件的文件。根据特定条件对符合Clustering条件的文件进行分组。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
数据操作语句DML - 数据湖探索 DLI

数据操作语句DML SELECT 集合操作窗口 JOIN OrderBy & Limit Top-N 去重父主题： Flink Opensource SQL1.10语法参考

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考
数据操作语句DML - 数据湖探索 DLI

数据操作语句DML SELECT 集合操作窗口 JOIN OrderBy & Limit Top-N 去重父主题： Flink Opensource SQL1.12语法参考

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考

总条数： 174

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

DLI SDK简介 - 数据湖探索 DLI

程序包管理概述 - 数据湖探索 DLI

Over聚合 - 数据湖探索 DLI

RDS表有自增主键时怎样在DLI插入数据？ - 数据湖探索 DLI

查询批处理作业状态 - 数据湖探索 DLI

怎样获取DLI作业样例（Demo） - 数据湖探索 DLI

分组聚合 - 数据湖探索 DLI

上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

DLI内置依赖包 - 数据湖探索 DLI

JSON函数 - 数据湖探索 DLI

配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

数据操作语句DML - 数据湖探索 DLI

数据操作语句DML - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线