搜索_华为云

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新建集群环境均已默认为Python3环境。父主题： Spark作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
CREATE FUNCTION语句 - 数据湖探索 DLI

JAVA|SCALA Language tag 用于指定 Flink runtime 如何执行这个函数。目前，只支持 JAVA 和 SCALA，且函数的默认语言为 JAVA。示例创建一个名为STRINGBACK的函数 create function STRINGBACK as 'com.dli

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
DLI对接AOM Prometheus监控的配置项 - 数据湖探索 DLI

Prometheus监控的配置项中的参数配置。如果这些默认配置不满足您的需求，您可以在Flink作业的“自定义配置”中手动配置以下参数，且优先以您的配置为准。表1 DLI对接AOM Prometheus监控的配置项参数是否必选默认值数据类型默认值说明 metrics.reporter

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

增强型跨源创建完成后，在跨源列表中，对应的跨源连接状态会显示为“已激活”。单击跨源连接的名称，详情页面显示连接状态为“ACTIVE”。图12 跨源连接状态图13 详情测试队列与RDS、DMS实例连通性。单击“队列管理”，选择您所使用的队列，单击“操作”列中的“更多”>“测试地址连通性”。

帮助中心 > 数据湖探索 DLI > 最佳实践
终端节点 - 数据湖探索 DLI
终端节点 - 数据湖探索 DLI

终端节点终端节点（Endpoint）即调用API的请求地址，不同服务不同区域的终端节点不同，您可以从地区和终端节点中查询所有服务的终端节点。数据湖探索的终端节点如下表所示，请您根据业务需要选择对应区域的终端节点。表1 数据湖探索的终端节点区域名称区域终端节点（Endpoint）

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
CLEAN - 数据湖探索 DLI
CLEAN - 数据湖探索 DLI

on "obs://bucket/path/h1"; 注意事项对表执行clean操作时需要表的owner才可以执行。如果需要修改clean默认的参数，需要在执行SQL时，在设置中配置需要保留的commit数量等参数，参见Hudi常见配置参数。使用由DLI提供的元数据服务时，本命令不支持使用OBS路径。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
INSERT INTO - 数据湖探索 DLI
INSERT INTO - 数据湖探索 DLI

写入模式：Hudi对于设置了主键的表支持三种写入模式，用户可以设置参数hoodie.sql.insert.mode来指定Insert模式，默认为upsert。 hoodie.sql.insert.mode = upsert strict模式，Insert 语句将保留 COW 表的

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进行对接。且用户可以根据实际所需设置相应安全组规则。注意事项对接的Kafka集群不支持开启SASL_SSL。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
SQL作业使用咨询 - 数据湖探索 DLI

同功能。DLI支持的SQL语法可以参考创建DLI表。可以本地连接DLI吗?支持远程工具连接吗？暂不支持。请在控制台提交作业。详细操作请参考数据湖探索快速入门。 DLI SQL作业超过12h会被kill掉吗？默认情况下，为了保障队列的稳定运行，超过12h的SQL作业会被系统按超时取消处理。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

行处的表达式值。offset 的默认值为 1，default 的默认值为 NULL。 LAG(expression [, offset] [, default]) 返回窗口中当前行之前第 offset 行处的表达式值。offset 的默认值为 1，default 的默认值为 NULL。 FI

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
SHOW VIEWS - 数据湖探索 DLI
SHOW VIEWS - 数据湖探索 DLI

database_name] [ LIKE pattern [ESCAPE escapeChar] ] 描述列举指定Schema中所有满足条件的视图。默认使用当前Schema，也可以通过in/from子句来指定Schema。通过可选子句“LIKE”，筛选视图名满足规则运算表达式的视图，如果

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

缺少pymysql模块，可以查看是否有对应的egg包，如果没有，在“程序包管理”页面上传pyFile。具体步骤参考如下：将egg包上传到指定的OBS桶路径下。登录DLI管理控制台，单击“数据管理 > 程序包管理”。在“程序包管理”页面，单击右上角“创建”可创建程序包。在“创建程序包”对话框，配置如下参数：

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
更新跨源目的端源表后，未同时更新对应跨源表，导致insert作业失败怎么办？ - 数据湖探索 DLI

更新跨源目的端源表后，未同时更新对应跨源表，导致insert作业失败怎么办？问题现象客户在DLI中创建了DWS跨源连接和DWS跨源表，然后对DWS中的源表schema进行更新，执行DLI作业，发现DWS中源表schema被修改为更新前的形式，导致schema不匹配，作业执行失败。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。 CSS非安全集群开发说明代码实现详解 import相关依赖包 1 2 3 from __future__ import print_function from pyspark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
创建表时指定表的生命周期 - 数据湖探索 DLI

创建表时指定表的生命周期功能描述 DLI提供了表生命周期管理功能，在创建表时指定表的生命周期。DLI会根据每张表的最后修改时间和表的生命周期来判断是否要回收此表。通过设置表的生命周期，可以帮助您更好的管理数目众多的表，自动清理长期不再使用的数据表，简化数据表的回收流程。同时支持数据恢复设置，避免因误操作丢失数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

L。在缓存过期后，将重新扫描Hive表以加载最新的数据。参数默认值类型说明 lookup.join.cache.ttl 60 min Duration 查找连接中构建表的缓存 TTL（例如 10 分钟）。默认情况下，TTL 为 60 分钟。该选项仅在查找有界的 hive

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

ce表和Sink表，并指定它们的连接器类型以及相关的属性。如果需要将数据写入到不同的Elasticsearch集群，您需要为每个集群配置不同的连接参数，并确保Flink作业能够正确地将数据路由到各个集群。例如本例中分别对es1和es2定义连接器类型以及相关的属性。在对应的Flink作业中添加如下SQL语句。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
修改表分区位置（只支持OBS表） - 数据湖探索 DLI

obs_path OBS存储路径。注意事项所要修改位置的表分区必须是已经存在的，否则将报错。 “partition_specs”中的参数默认带有“( )”，例如：PARTITION (dt='2009-09-09',city='xxx')。所指定的新的OBS路径必须是已经存在的绝对路径，否则将报错。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
Upsert Kafka结果表 - 数据湖探索 DLI

统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进行对接。且用户可以根据实际所需设置相应安全组规则。注意事项对接的Kafka集群不支持开启SASL_SSL。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
提交SQL作业时，返回“unsupported media Type”信息 - 数据湖探索 DLI

在DLI提供的REST API中，可以在请求URI中附加请求消息头，例如：Content-Type。 “Content-Type”为消息体的类型（格式），默认取值为“application/json”。提交SQL作业的URI为：POST /v1.0/{project_id}/jobs/submit-job

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类

总条数： 791

上一页
1
...
14
15
16
...
40
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

CREATE FUNCTION语句 - 数据湖探索 DLI

DLI对接AOM Prometheus监控的配置项 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

终端节点 - 数据湖探索 DLI

CLEAN - 数据湖探索 DLI

INSERT INTO - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

SQL作业使用咨询 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

SHOW VIEWS - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

更新跨源目的端源表后，未同时更新对应跨源表，导致insert作业失败怎么办？ - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

修改表分区位置（只支持OBS表） - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

提交SQL作业时，返回“unsupported media Type”信息 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线