搜索_华为云

增强型跨源连接概述 - 数据湖探索 DLI

Flink作业访问DIS，OBS和SMN数据源，无需创建跨源连接，可以直接访问。增强型跨源仅支持包年包月队列、按需计费模式下的专属队列。权限要求增强型跨源连接需要使用VPC、子网、路由、对等连接功能，因此需要获得VPC（虚拟私有云）的VPC Administrator权限。可在服务授权中进行设置。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
导出DLI表数据至OBS中 - 数据湖探索 DLI

作。覆盖指定路径：在指定目录下新建文件，会删除已有文件。表头:无/有设置导出数据是否含表头。单击“确定”即可导出数据。（可选）您可以在“作业管理”>“SQL作业”页面查看导出作业的“状态”、“执行语句”等信息。在“作业类型”中选择“EXPORT”，输入导出数据的时间段，即可查询出对应条件下的作业列表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
Upsert Kafka结果表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与Kafka集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接配置跨

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

考：Apache Flink Hive 方言使用HiveCatalog，Apache Flink可以用于统一处理Apache Hive表的BATCH和STREAM。Flink可以作为Hive批处理引擎的更高效的替代方案，或者用于连续读写Hive表，以支持实时数据仓库应用程序。Apache

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
BlackHole - 数据湖探索 DLI
BlackHole - 数据湖探索 DLI

内置的Connector。例如，如果您在注册其他类型的Connector结果表时报错，但您不确定是系统问题还是结果表WITH参数错误，您可以将WITH参数修改为'connector' = 'blackhole'后，单击运行。如果不再报错，则证明系统没有问题，您需要排查确认修改WITH参数是否正确。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
管理DLI全局变量 - 数据湖探索 DLI

管理DLI全局变量什么是全局变量 DLI支持在管理控制台设置全局变量，将作业开发过程中频繁使用的变量设置为全局变量，可以避免在编辑作业过程中重复定义，减少开发与维护成本。通过使用全局变量可以替换长难复杂变量，简化复杂参数，提升SQL语句可读性。本节操作为您介绍如何创建全局变量。创建全局变量

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
Flink作业常用操作 - 数据湖探索 DLI

> 停止”。也可以在作业列表中，勾选一个作业，单击作业列表左上方的“停止”。批量停止作业勾选多个需要停止作业，单击作业列表左上方的“停止”。可以停止多个作业。在弹出的“停止作业”窗口中，单击“确认”，停止作业。图1 停止作业在停止作业之前，用户可以触发保存点，保存作

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
配置Flink作业权限 - 数据湖探索 DLI

配置Flink作业权限 Flink作业权限操作场景针对不同用户，可以通过权限设置分配不同的作业，不同用户之间的作业效率互不影响，保障作业性能。管理员用户和作业的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其作业权限。给新用户设置作业权限时，该用户所在用户组的所属区域需具有Tenant

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
Python开发环境配置 - 数据湖探索 DLI

”，可能是由于缺少C++编译器导致的报错，建议您根据提示信息安装相应版本的Visual Studio编译器解决。部分操作系统Visual Studio安装后需重启才可以生效。父主题： Python SDK环境配置

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
费用账单 - 数据湖探索 DLI
费用账单 - 数据湖探索 DLI

单。这里设置的统计维度为“按资源名称/ID”，统计周期为“按账期”，您也可以设置其他统计维度和周期，详细介绍请参见流水与明细账单。查看数据存储的资源账单 DLI控制台并未展示数据存储的相关信息，您可以在费用中心查询DLI数据存储的资源账单。在控制台顶部菜单栏中选择“费用与成本

 帮助中心 > 数据湖探索 DLI > 计费说明
DLI弹性资源池与队列简介 - 数据湖探索 DLI

弹性资源池是DLI计算资源的一种池化管理模式，可以看做DLI计算资源的集合。DLI支持在弹性资源池中创建多个队列，且这些队列可以共享弹性资源池中的资源。队列是DLI中被实际使用和分配的基本单元，即队列是执行作业所需的具体的计算资源。您可以为不同的作业或数据处理任务创建不同的队列，并

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

准备工作已注册华为账号并开通华为云，且在使用DLI前检查账号状态，账号不能处于欠费或冻结状态。配置DLI委托访问授权 DLI使用过程中涉及到OBS、VPC、SMN等服务交互，首次使用DLI需要用户配置委托授权，允许访问这些依赖服务。使用华为云账号登录DLI管理控制台，在左侧导航栏单击“全局配置

 帮助中心 > 数据湖探索 DLI > 快速入门
CLUSTERING - 数据湖探索 DLI
CLUSTERING - 数据湖探索 DLI

CLUSTERING 命令功能对Hudi表进行clustering操作，具体作用可以参考Hudi Clustering操作说明章节。命令格式执行clustering： call run_clustering(table=>'[table]', path=>'[path]',

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
DataGen源表 - 数据湖探索 DLI
DataGen源表 - 数据湖探索 DLI

参数值可以是 'sequence' 或 'random'，具体含义如下： random是默认的生成器，您可以通过“fields.#.max”和“fields.#.min”参数指定随机生成的最大和最小值。当指定的字段类型为char、varchar、string时，可以同时通过“fields

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

同时因为spark.sql.shuffle.partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。解决方案建议可以尝试调小spark.sql.shuffle.partitions参数值来解决缓冲区不足问题。具体该参数设置步骤如下：登录DLI管理控制台，单击“作业管理

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
创建弹性资源池 - 数据湖探索 DLI

标签的键的最大长度为128个字符，标签的键可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格，不能以_sys_开头。 value 是 String 标签的值。说明：标签值的最大长度为255个字符，标签的值可以包含任意语种字母、数字、空格和_ . : =+-@

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
续费概述 - 数据湖探索 DLI
续费概述 - 数据湖探索 DLI

包年/包月的DLI资源从购买到被自动删除之前，您可以随时在DLI控制台为队列或弹性资源池续费，以延长资源的使用时间。自动续费开通自动续费后，DLI资源会在每次到期前自动续费，避免因忘记手动续费而导致资源被自动删除。在DLI资源生命周期的不同阶段，您可以根据需要选择一种方式进行续费，具体如图1所示。

帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
INSERT INTO - 数据湖探索 DLI
INSERT INTO - 数据湖探索 DLI

在提交Spark SQL作业时，用户可以在设置中配置以下参数，切换bulk insert作为Insert语句的写入方式。 hoodie.sql.bulk.insert.enable = true hoodie.sql.insert.mode = non-strict 也可以设置hoodie.datasource

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
创建Bucket索引表调优 - 数据湖探索 DLI

区，这种方式相对麻烦些但是多年后表无需重新导入。方法三：数据老化，按照业务逻辑分析大的维度表是否可以通过数据老化清理无效的维度数据从而降低数据规模。数据量非常小的事实表这种可以在预估很长一段时间的数据增长量的前提下使用非分区表预留稍宽裕一些的桶数来提升读写性能。确认表内桶数

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
CLEAN - 数据湖探索 DLI
CLEAN - 数据湖探索 DLI

对表执行clean操作时需要表的owner才可以执行。如果需要修改clean默认的参数，需要在执行SQL时，在设置中配置需要保留的commit数量等参数，参见Hudi常见配置参数。使用由DLI提供的元数据服务时，本命令不支持使用OBS路径。系统响应可以检查任务状态是否成功，查看任务日志确认有无异常。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明

总条数： 1014

上一页
1
...
18
19
20
...
51
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

增强型跨源连接概述 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

BlackHole - 数据湖探索 DLI

管理DLI全局变量 - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

配置Flink作业权限 - 数据湖探索 DLI

Python开发环境配置 - 数据湖探索 DLI

费用账单 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

CLUSTERING - 数据湖探索 DLI

DataGen源表 - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

创建弹性资源池 - 数据湖探索 DLI

续费概述 - 数据湖探索 DLI

INSERT INTO - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

CLEAN - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线