搜索_华为云

Hudi表使用约束 - 数据湖探索 DLI

Write 写时复制表也简称COW表，使用parquet文件存储数据，内部的更新操作需要通过重写原始parquet文件完成。优点：读取时，只读取对应分区的一个数据文件即可，较为高效。缺点：数据写入的时候，需要复制一个先前的副本再在其基础上生成新的数据文件，这个过程比较耗时。且由于耗时，读请求读取到的数据相对就会滞后。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
创建IAM用户并授权使用DLI - 数据湖探索 DLI

创建IAM用户并授权使用DLI 如果您需要对您所拥有的DLI资源进行精细的权限管理，您可以使用统一身份认证服务（Identity and Access Management，简称IAM），具体IAM使用场景可以参考权限管理概述。如果华为云账号已经能满足您的要求，不需要创建独立的IAM用户，您

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
变更普通队列规格 - 数据湖探索 DLI

which is not available”，表示需要等待队列资源分配完毕才可进行扩缩容。扩容当前队列规格不满足业务需要时，可以通过手动变更队列规格来扩容当前队列。扩容属于耗时操作，在DLI“规格变更”页面执行扩容操作后，需要等待大约10分钟，具体时长和扩容的CU值有关，等待

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

、按组批量启动作业、按分组导出作业等操作。是否定时执行：如果需要配置作业定时自动执行，请参见配置定时任务。这里保持默认值“否”。抽取并发数：设置同时执行的抽取任务数。这里保持默认值“1”。是否写入脏数据：如果需要将作业执行过程中处理失败的数据、或者被清洗过滤掉的数据写入OB

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
表相关 - 数据湖探索 DLI
表相关 - 数据湖探索 DLI

as e: print(e) return print(table) 创建OBS表需要指定OBS路径，且该路径需要提前创建。完整样例代码和依赖包说明请参考：Python SDK概述。删除表 DLI提供删除表的接口。您可以使用该接口删除数据库下的所有表。示例代码如下：

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
手动续费 - 数据湖探索 DLI
手动续费 - 数据湖探索 DLI

所有需手动续费的资源都可归置到“手动续费项”页签，具体操作请参见如何恢复为手动续费。手动续费资源。单个续费：在资源页面找到需要续费的资源，单击操作列的“续费”。批量续费：在资源页面勾选需要续费的资源，单击列表左上角的“批量续费”。选择续费时长，判断是否勾选“统一到期日”，将到期时间统一到各个

 帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

show databases 切换到需要迁移的Hive数据库 use Hive数据库名显示当前数据库下所有的表信息 show tables 查询Hive表的建表语句 show create table Hive表名查询出来的建表语句需要做一些处理，建表语句要符合DLI的建表语法，再到具体的DLI上执行。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

、按组批量启动作业、按分组导出作业等操作。是否定时执行：如果需要配置作业定时自动执行，请参见配置定时任务。这里保持默认值“否”。抽取并发数：设置同时执行的抽取任务数。这里保持默认值“1”。是否写入脏数据：如果需要将作业执行过程中处理失败的数据、或者被清洗过滤掉的数据写入OB

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
SDK的获取与安装 - 数据湖探索 DLI

云 Java SDK：安装服务级SDK依赖首先您需要在您的操作系统中下载并安装Maven 。安装配置完成后，输入命令“mvn -v”,显示如下图 Maven版本信息表示成功。 Maven安装完成后，可根据开发需要，直接引入依赖到已有的Maven工程或先用开发工具创建Maven工程。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
获取项目ID - 数据湖探索 DLI
获取项目ID - 数据湖探索 DLI

获取项目ID 操作场景在调用接口的时候，部分URL中需要填入项目ID，所以需要获取到项目ID。有如下两种获取方式：调用API获取项目ID 从控制台获取项目ID 调用API获取项目ID 项目ID可以通过调用查询指定条件下的项目信息API获取。获取项目ID的接口为“GET ht

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
创建DLI表关联DWS - 数据湖探索 DLI

密码泄露的风险，优先推荐您使用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。前提条件创建DLI表关联DWS之前需要创建跨源连接。管理控制台操作请参考增强型跨源连接。语法格式 1 2 3 4 5 6 CREATE TABLE [IF NOT EXISTS]

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DWS表
提交作业时提示作业桶权限不足怎么办？ - 数据湖探索 DLI

问题描述已经配置DLI作业桶，且完成Flink桶授权后在提交作业时仍然提示桶未授权怎么办？根因分析使用DLI作业桶需要确保已完成DLI作业桶的权限配置。您需要在OBS管理控制台中检查DLI作业桶的桶策略，确保策略中包含了允许DLI服务进行必要操作的授权信息。确保没有任何策略

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI权限管理类
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

”。其他参数保持默认值或根据需要选择。创建OBS桶时，需要选择与DLI管理控制台相同的区域，不可跨区域执行操作。单击“立即创建”。单击所建桶“dli-test-obs01”，进入“对象”页面。选择左侧列表中的“对象”，选择“上传对象”，将需要上传的文件，例如“flink-examples

帮助中心 > 数据湖探索 DLI > 快速入门
窗口Top-N - 数据湖探索 DLI
窗口Top-N - 数据湖探索 DLI

与普通Top-N不同，窗口Top-N只在窗口最后返回汇总的Top-N数据，不会产生中间结果。窗口 Top-N 会在窗口结束后清除不需要的中间状态。窗口 Top-N 适用于用户不需要每条数据都更新Top-N结果的场景，相对普通Top-N来说性能更好。通常，窗口 Top-N 直接用于窗口表值函数（Windowing

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
自定义函数类型推导 - 数据湖探索 DLI

自定义函数类型推导操作场景类型推导包含了验证输入值、派生参数和返回值数据类型。从逻辑角度看，Planner需要知道数据类型、精度和小数位数；从 JVM 角度来看，Planner 在调用自定义函数时需要知道如何将内部数据结构表示为JVM对象。 Flink 自定义函数实现了自动的类型推导提取，通过

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
设置Flink作业优先级 - 数据湖探索 DLI

设置Flink作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Flink作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

端口 RDS实例的端口。选择数据库服务器后自动自动关联。数据库名称当前需要迁移的RDS MySQL数据库名称。当前示例为3中创建的数据库“testrdsdb”。用户名待连接数据库的用户。该数据库用户需要有数据表的读写权限，以及对元数据的读取权限。本示例使用创建RDS My

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Flink作业运行异常，如何定位 - 数据湖探索 DLI

击“编辑”按钮，在作业运行界面确认作业是否勾选“保存作业日志”参数。图1 保存作业日志是，则执行3。否，则运行日志不会转储OBS桶，需要先执行2保存作业运行日志。在作业运行界面勾选“保存作业日志”，在“OBS桶”参数选择存储运行日志的OBS桶。单击“启动”重新运行作业。作业重新运行完成后再执行3及后续步骤。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
自定义函数类型推导 - 数据湖探索 DLI

自定义函数类型推导操作场景类型推导包含了验证输入值、派生参数和返回值数据类型。从逻辑角度看，Planner需要知道数据类型、精度和小数位数；从 JVM 角度来看，Planner 在调用自定义函数时需要知道如何将内部数据结构表示为JVM对象。 Flink 自定义函数实现了自动的类型推导提取，通过

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境自定义镜像应用场景通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，以此改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作

总条数： 596

上一页
1
2
3
4
5
...
30
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表使用约束 - 数据湖探索 DLI

创建IAM用户并授权使用DLI - 数据湖探索 DLI

变更普通队列规格 - 数据湖探索 DLI

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

表相关 - 数据湖探索 DLI

手动续费 - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

获取项目ID - 数据湖探索 DLI

创建DLI表关联DWS - 数据湖探索 DLI

提交作业时提示作业桶权限不足怎么办？ - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

窗口Top-N - 数据湖探索 DLI

自定义函数类型推导 - 数据湖探索 DLI

设置Flink作业优先级 - 数据湖探索 DLI

典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

Flink作业运行异常，如何定位 - 数据湖探索 DLI

自定义函数类型推导 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线