搜索_华为云

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

点击执行后会跳转到”Spark作业”界面，此处可以看到作业的执行状态。点击对应作业右侧的更多，可以在下拉菜单中跳转日志选单：归档日志：跳转OBS界面，可以看到该作业的全部日志归档地址，包含提交日志，Driver日志和Executor日志，在此处可以下载日志。提交日志：跳转到提交日志的聚合展示界面，可以查看任务提交中的日志信息。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
正则表达式函数 - 数据湖探索 DLI

\ n被识别为行终止符。此外，不支持（？d）标志，因此不能使用。大小写区分模式（通过（？i）标志启用）时，总是以unicode的模式去实现。同时，不支持上下文敏感匹配和局部敏感匹配。此外，不支持（？u）标志。不支持Surrogate Pair编码方式。例如，\ uD800 \

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Flink作业怎样设置“异常自动重启”？ - 数据湖探索 DLI

登录DLI控制台，选择“作业管理”>“Flink作业”。在Flink作业编辑页面，勾选“异常自动重启”。例如，图1所示。图1 Flink SQL作业编辑界面父主题： Flink作业咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
显示函数详情 - 数据湖探索 DLI

[EXTENDED] [db_name.] function_name; 关键字 EXTENDED：显示扩展使用信息。注意事项返回已有函数的元数据（实现类和用法），如果函数不存在，则系统报错。示例查看函数mergeBill的相关信息。 1 DESCRIBE FUNCTION mergeBill;

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

编写UDAF函数代码。UDAF函数实现，主要注意以下几点：自定义UDAF需要继承org.apache.hadoop.hive.ql.exec.UDAF和org.apache.hadoop.hive.ql.exec.UDAFEvaluator类。函数类需要继承UDAF类，计算类Evaluator实现UDAFEvaluator接口。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在Spark SQL作业中使用UDF - 数据湖探索 DLI

Class文件编写UDF函数代码。UDF函数实现，主要注意以下几点：自定义UDF需要继承org.apache.hadoop.hive.ql.exec.UDF。需要实现evaluate函数，evaluate函数支持重载。详细UDF函数实现，可以参考如下样例代码： package com

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
为什么DLI增强型跨源连接要创建对等连接？ - 数据湖探索 DLI

DLI增强型跨源连接创建对等连接的主要原因是为了实现DLI与不同VPC中的数据源之间的网络连通。当DLI需要访问外部数据源，而这些数据源位于不同的VPC中时，由于网络隔离，DLI默认无法直接读取这些数据源的数据。通过创建增强型跨源连接，可以采用对等连接的方式打通DLI与数据源的VPC网络，从而实现数据的互通和跨源分析。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

更多弹性资源池计费信息请参考弹性资源池计费。怎样创建“弹性资源池队列”？购买弹性资源池。在DLI管理控制台，单击“资源管理 > 弹性资源池 ”。在弹性资源池管理界面，单击界面右上角的“购买弹性资源池”。按需配置弹性资源池的相关参数，完成弹性资源池的购买。在弹性资源池中创建队列。创建完弹性资源池后，弹性

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

安全组规则的描述信息，非必填项。 _ 步骤4：创建增强型跨源连接登录DLI管理控制台，在左侧导航栏单击“跨源管理”，在跨源管理界面，单击“增强型跨源”，单击“创建”。在增强型跨源创建界面，配置具体的跨源连接参数。具体参考如下。连接名称：设置具体的增强型跨源名称。弹性资源池：选择DLI的队列。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
获取账号ID - 数据湖探索 DLI
获取账号ID - 数据湖探索 DLI

在调用接口的时候，部分URL中需要填入账号ID（domain-id），所以需要先在管理控制台上获取到账号ID。账号ID获取步骤如下：登录管理控制台。鼠标指向界面右上角的登录用户名，在下拉列表中单击“我的凭证”。在“API凭证”页面查看账号ID。图1 获取账号ID 父主题：公共参数

 帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
DataGen源表 - 数据湖探索 DLI
DataGen源表 - 数据湖探索 DLI

TABLE语句中的“COMPUTED COLUMN”来进行类似功能构造。创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。语法格式

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
DataGen - 数据湖探索 DLI
DataGen - 数据湖探索 DLI

TABLE语句中的“COMPUTED COLUMN”来进行类似功能构造。创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。认证用

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

提交作业并检查Flink UI和日志：直接点击界面右上角的”提交”，在跳转界面再次确认参数无误后，点击底部”立即启动”。完成提交后自动跳转至Flink作业界面，此处可以筛选刚才提交的Flink作业并检查执行状态。点击作业的名称，可以跳转至作业界面，此处可以点击”提交日志”或”运行日志”

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
创建Flink Jar作业 - 数据湖探索 DLI

k 1.15及历史Flink版本。在DLI管理控制台的Jar作业配置界面开启Checkpoint，适用于Flink 1.15及更高的引擎版本。 Flink 1.15版本请勿重复在作业代码和Jar作业配置界面配置Checkpoint相关参数，作业代码中的配置项优先级更高，重复配置

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
GROUPING SETS - 数据湖探索 DLI
GROUPING SETS - 数据湖探索 DLI

GROUPING SETS 功能描述 GROUPING SETS生成交叉表格行，可以实现GROUP BY字段的交叉统计。语法格式 1 2 3 SELECT attr_expr_list FROM table_reference GROUP BY col_name_list

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
配置SQL防御规则 - 数据湖探索 DLI

低质量的SQL会对数据分析平台系统带来不可预料的冲击，影响系统的性能或者平台稳定性。 DLI在Spark SQL引擎中增加SQL防御能力，基于用户可理解的SQL防御策略，实现对典型大SQL、低质量SQL的主动防御，包括事前提示、拦截和事中熔断，并不强制改变用户的SQL提交方式、SQL语法，对业务零改动且易落地。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Flink Jar作业开发基础样例 - 数据湖探索 DLI

Flink Jar作业开发基础样例概述用户可以基于Flink的API进行二次开发，构建自己的应用Jar包，提交到DLI队列运行，实现与MRS Kafka、HBase、Hive、HDFS，DWS，DCS等数据源的交互。本章节以通过自定义作业与MRS进行交互为例进行说明。更多样例代码请通过DLI样例代码获取。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。 CSS非安全集群开发说明代码实现构造依赖信息，创建SparkSession 导入依赖涉及到的mvn依赖库 <dependency> <groupId>org

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

rownum = 1 | rownum <=1 | rownum < 2 来识别查询能否被翻译成窗口去重。注意事项 Flink 只支持在滚动窗口、滑动窗口和累积窗口的窗口表值函数后进行窗口去重窗口去重只支持根据事件时间属性进行排序示例本示例展示了在10分钟的滚动窗口上保持最后一条记录。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
创建增强型跨源连接 - 数据湖探索 DLI

创建增强型跨源连接功能介绍该API用于创建与其他服务的增强型跨源连接。如果需要了解Console界面的使用方法，可参考《数据湖探索用户指南》中的“增强型跨源连接”。系统default队列不支持创建跨源连接。调试您可以在API Explorer中调试该接口。 URI URI格式

 帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API

总条数： 255

上一页
1
2
3
4
5
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

正则表达式函数 - 数据湖探索 DLI

Flink作业怎样设置“异常自动重启”？ - 数据湖探索 DLI

显示函数详情 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

为什么DLI增强型跨源连接要创建对等连接？ - 数据湖探索 DLI

DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

获取账号ID - 数据湖探索 DLI

DataGen源表 - 数据湖探索 DLI

DataGen - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

GROUPING SETS - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线