搜索_华为云

新建Flink Jar作业 - 数据湖探索 DLI

String 标签的键。说明：标签的键的最大长度为128个字符，标签的键可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格，不能以_sys_开头。 value 是 String 标签的值。说明：标签值的最大长度为255个字符，标签的值可以包含任意语种字母、数字、空格和_

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
lag - 数据湖探索 DLI
lag - 数据湖探索 DLI

当offset指定的范围越界时的缺省值，需要与expr对应的数据类型相同。如果expr非常量，则基于当前行进行求值。 partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。返回值说明

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

选择左侧导航栏的“总览”，单击页面右上角的“登录指令”，在弹出的页面中单击复制登录指令。在安装容器引擎的虚拟机中执行上一步复制的登录指令。创建容器镜像组织。如果已创建组织则本步骤可以忽略。登录SWR管理控制台。选择左侧导航栏的“组织管理”，单击页面右上角的“创建组织”。填写组织名称，单击“确定”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

”栏可查看到连接的数据库信息。通过新建的连接即可对DLI执行后续的数据查询相关工作。步骤3：在DBeaver编写SQL查询在DBeaver建立与DLI的连接后，即可在DBeaver编写SQL查询：您可以在左侧的数据库导航面板中选择数据库对象，然后在中间的查询编辑器中编写SQL语句。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

返回string中从integer1位置开始的长度为integer2的子字符串。若integer2未配置，则默认返回从integer1开始到末尾的子字符串 REPLACE(string1, string2, string3) STRING 用string3代替string1中的string2后的字符串，并返回替换后的string1字符串

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
开启Flink作业动态扩缩容 - 数据湖探索 DLI

开启Flink作业动态扩缩容后，系统将根据Flink作业的实际资源需求动态调整资源分配。当弹性资源池中剩余的Pod资源足以支持作业的最小资源需求时，系统将自动减少作业所在节点的数量，确保作业高效运行，同时提高资源的利用效率。当前仅Flink 1.12版本的作业支持开启动态扩缩容。使用须知在F

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现导入依赖。涉及到的mvn依赖库 1 2 3 4 5 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
Spark SQL常用配置项说明 - 数据湖探索 DLI

剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Hudi Clustering操作说明 - 数据湖探索 DLI

调度Clustering：使用可插拔的Clustering策略创建Clustering计划。识别符合Clustering条件的文件：根据所选的Clustering策略，调度逻辑将识别符合Clustering条件的文件。根据特定条件对符合Clustering条件的文件进行分组。每个组的数据大小应为t

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
pyspark样例代码 - 数据湖探索 DLI

stripMargin).collect().foreach(println) 提交Spark作业将写好的python代码文件上传至OBS桶中。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。如果选择spark版本为2.3.2（即将下线）或2.4.5提交

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
Hudi结果表 - 数据湖探索 DLI
Hudi结果表 - 数据湖探索 DLI

field：进行分桶时计算Hash值的字段，必须为主键的子集，默认为Hudi表的主键。该参数不填则默认为recordkey.field。创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
pyspark样例代码 - 数据湖探索 DLI

南》中的“选择依赖资源参数说明”。通过API提交作业请参考《数据湖探索API参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码通过DataFrame API访问认证用的password硬编码到代码中或者明文存储都有很大的安全风

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Beeline是数据分析师和数据工程师的重要工具之一，适用于大规模数据处理的场景。Beeline提供了的SQL引擎，使得用户可以使用SQL的语言来执行数据查询、数据分析和管理任务。 Kyuubi是一个分布式 SQL 查询引擎，它提供了标准的SQL接口，使用户能够方便地访问和分析存储在大数据平台中的数据。通

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

uri uri的格式为：mongodb://username:pwd@host:8635/db 其中以下参数需要修改为实际值： “username”为创建的mongo（DDS）数据库用户名。 “pwd”为创建的mongo（DDS）数据库用户名对应的密码。 “host”为创建的mongo（DDS）数据库实例IP。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Power BI提供了数据集成、数据仓库、报告和数据可视化等功能，能够将复杂的数据转换为易于理解和交互的可视化图表和仪表板，从而帮助企业做出基于数据的决策。 Kyuubi是一个分布式SQL查询引擎，它允许用户通过标准的SQL接口来访问和分析数据。将Power BI与Kyuubi对接，通

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

在开始页面的“连接”窗格中，选择你想要连接的数据源类型。本例选择Hive类型的数据连接。配置数据连接信息。连接：Hive 服务器：Kyuubi主机的IP地址。端口：连接Kyuubi的端口，Hive Thrift协议对接，默认端口10009。身份验证：本例选择用户名的认证方式。用户名：Kyuubi用户名。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

驱动：选择2.a中的驱动。数据库名称：DLI的数据库名称。主机：安装Kyuubi主机IP地址。端口：访问Kyuubi主机的端口。端口默认10009 认证方式：本例选择密码认证方式。用户名：Kyuubi数据库的访问凭证，Kyuubi用户名。密码：Kyuubi数据库的访问凭证，Kyuubi访问密码。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
使用DataSource语法创建DLI表 - 数据湖探索 DLI

示例3：使用CTAS将源表的全部数据或部分数据创建新的DLI表示例说明：根据示例1：创建DLI非分区表中创建的DLI表table1，使用CTAS语法将table1中的数据复制到table1_ctas表中。在使用CTAS建表的时候，可以忽略被复制的表在建表时所使用的语法，即不论在创建t

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表4 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

x支持自定义k8s的调度器。升级引擎版本后是否对作业有影响：功能增强，支持自定义调度器管理资源的分配和调度。 Spark将不可为null的模式转换为可空说明：在Spark 2.4.x版本中，当用户指定的schema包含不可为空的字段时，Spark会将这些不可为null的模式转换为可空的。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比

总条数： 581

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新建Flink Jar作业 - 数据湖探索 DLI

lag - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Hudi结果表 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线