搜索_华为云

Map函数和运算符 - 数据湖探索 DLI

map_concat(map1(K, V), map2(K, V), ..., mapN(K, V)) 描述：合并多个map，当key值一样时，取最后一个map的value来构造键值对。如下示例中，a就使用了最后一个map的value值10。 select map_concat(map(ARRAY['a'

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
DLI请求条件 - 数据湖探索 DLI
DLI请求条件 - 数据湖探索 DLI

DLI请求条件您可以在创建自定义策略时，通过添加“请求条件”（Condition元素）来控制策略何时生效。请求条件包括条件键和运算符，条件键表示策略语句的 Condition 元素，分为全局级条件键和服务级条件键。全局级条件键（前缀为g:）适用于所有操作，服务级条件键（前缀为服

 帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
程序包管理概述 - 数据湖探索 DLI

（推荐使用）上传至OBS管理程序包：提前将对应的jar包上传至OBS桶中，在作业配置时选择对应的OBS路径。（DLI程序包功能即将停用）上传至DLI管理程序包：提前将对应的jar包上传至OBS桶中，并在DLI管理控制台的“数据管理>程序包管理”中创建程序包，在作业配置时选择对应的DLI程序包。本节操作介绍在DLI管理控制台上传并管理程序包的方式。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

n文件”处选择已上传的egg程序包，重新运行Spark作业。 pyspark作业对接MySQL，需要创建跨源链接，打通DLI和RDS之间的网络。通过管理控制台创建跨源连接请参考《数据湖探索用户指南》。通过API创建跨源连接请参考《数据湖探索API参考》。父主题： Spark作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
DLI程序包标签管理 - 数据湖探索 DLI

成。 DLI支持对程序包组或程序包添加标签。在DLI管理控制台单击“数据管理 > 程序包管理”。选择程序包，单击操作列的“更多 > 标签”，显示当前程序包组或程序包的标签信息。单击“添加/编辑标签”，弹出“添加/编辑标签”对话框。在“添加/编辑标签”对话框中配置标签参数。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

startup.mode 否 initial String 消费数据时的启动模式。 initial（默认）：在第一次启动时，会先扫描历史全量数据，然后读取最新的Binlog数据。 latest-offset：在第一次启动时，不会扫描历史全量数据，直接从Binlog的末尾（最新的Binl

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
SQL作业开发类 - 数据湖探索 DLI

SQL作业如何指定表的部分字段进行表数据的插入 SQL作业运行慢如何定位怎样查看DLI SQL日志？怎样查看DLI的执行SQL记录？执行SQL作业时产生数据倾斜怎么办？ SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中为什么SQL作业一直处于“提交中”？父主题： SQL作业类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类
创建并提交Spark作业 - 数据湖探索 DLI

本章节指导用户通过API创建并提交Spark作业。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。涉及接口创建弹性资源池：创建弹性资源池。创建队列：在弹性资源池中添加队列。上传分组资源：上传Spark作业所需的资源包。查询组内资源包：确认上传的资源包是否正确。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
创建并提交Flink作业 - 数据湖探索 DLI

本章节指导用户通过API创建并运行Flink自定义作业。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。涉及接口创建弹性资源池：创建弹性资源池。创建队列：在弹性资源池中添加队列。上传分组资源：上传Flink自定义作业所需的资源包。查询组内资源包：确认上传的资源包是否正确。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
计费相关问题 - 数据湖探索 DLI

按需计费的弹性资源池，如果没提交作业运行就不计费？想要使用扫描套餐包计费，购买队列还要额外收费吗？超出套餐包额度的使用量怎么收费？弹性资源池的实际CUs、CU范围、规格的含义包年包月弹性资源池设置了定时扩缩容时，怎样计费？

帮助中心 > 数据湖探索 DLI > 计费说明
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

PERMISSIVE：选择PERMISSIVE模式时，如果某一列数据类型与目标表列数据类型不匹配，则该行数据将被设置为null。 DROPMALFORMED：选择DROPMALFORMED模式时，如果某一列数据类型与目标表列数据类型不匹配，则不导入该行数据。 FAILFAST：选择FAILFAST模式时，如果某一列类型不匹配，则会抛出异常，导入失败。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

同于SQL中常用的SUM()，AVG()，也是聚合函数。约束限制在DLI Console上执行UDAF相关操作时，需要使用自建的SQL队列。跨账号使用UDAF时，除了创建UDAF函数的用户，其他用户如果需要使用时，需要先进行授权才可使用对应的UDAF函数。授权操作参考如下：登录DLI管理控制台，选择“

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
删除分区 - 数据湖探索 DLI
删除分区 - 数据湖探索 DLI

分区表分为两种，OBS表和DLI表。在删除分区时，DLI表和OBS表都支持利用指定条件删除分区表的一个或多个分区。OBS表还支持按指定筛选条件删除分区。注意事项所要删除分区的表必须是已经存在的表，否则会出错。所要删除的分区必须是已经存在的，否则会出错，可通过语句中添加“IF EXISTS”避免该错误。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
删除增强型跨源连接的路由信息 - 数据湖探索 DLI

本节操作指导用户删除不再使用的路由信息。约束限制当自定义路由表被关联至子网时，则无法删除。请先通过更换子网关联的路由表将子网关联到其他的路由表，然后尝试删除。操作步骤登录DLI管理控制台。在左侧导航栏中，选择“跨源管理 > 增强型跨源 ”。选择待添加路由的增强型跨源连接，并删除路由。方法一：选

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

件做数据过滤及在字段映射页面添加新字段的需求，选择HDFS方式即可。 HDFS文件方式读取数据时，性能较好，但不支持使用WHERE条件做数据过滤及在字段映射页面添加新字段。 JDBC方式读取数据时，支持使用WHERE条件做数据过滤及在字段映射页面添加新字段。更多参数的详细配置可以参考：CDM配置Hive源端参数。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
从Kafka读取数据写入到DWS - 数据湖探索 DLI

在“连接信息”中获取该Kafka的“内网连接地址”，在“基本信息”的“网络”中获取获取该实例的“虚拟私有云”和“子网”信息，方便后续操作步骤使用。单击“网络”中的安全组名称，在“入方向规则”中添加放通队列网段的规则。例如，本示例队列网段为“10.0.0.0/16”，则规则添加为：优先级选择：1，策略选择：允许，

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

在“连接信息”中获取该Kafka的“内网连接地址”，在“基本信息”的“网络”中获取获取该实例的“虚拟私有云”和“子网”信息，方便后续操作步骤使用。单击“网络”中的安全组名称，在“入方向规则”中添加放通队列网段的规则。例如，本示例队列网段为“10.0.0.0/16”，则规则添加为：优先级选择：1，策略选择：允许，

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

该配置项用于启用或禁用动态分区修剪。在执行SQL查询时，动态分区修剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

在“连接信息”中获取该Kafka的“内网连接地址”，在“基本信息”的“网络”中获取该实例的“虚拟私有云”和“子网”信息，方便后续操作步骤使用。单击“网络”中的安全组名称，在“入方向规则”中添加放通队列网段的规则。例如，本示例队列网段为“10.0.0.0/16”，则规则添加为：优先级选择：1，策略选择：允许，协

 帮助中心 > 数据湖探索 DLI > 快速入门
在DLI使用Delta提交Spark Jar作业 - 数据湖探索 DLI

在DLI使用Delta提交Spark Jar作业 1. 添加如下依赖 <dependency> <groupId>io.delta</groupId> <artifactId>delta-core_2.12</artifactId> <version>2.3

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > DLI中使用Delta开发作业

总条数： 332

上一页
1
...
4
5
6
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Map函数和运算符 - 数据湖探索 DLI

DLI请求条件 - 数据湖探索 DLI

程序包管理概述 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

DLI程序包标签管理 - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

SQL作业开发类 - 数据湖探索 DLI

创建并提交Spark作业 - 数据湖探索 DLI

创建并提交Flink作业 - 数据湖探索 DLI

计费相关问题 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

删除分区 - 数据湖探索 DLI

删除增强型跨源连接的路由信息 - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

从Kafka读取数据写入到DWS - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

在DLI使用Delta提交Spark Jar作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线