搜索_华为云

怎样配置DLI队列与数据源的网络连通？ - 数据湖探索 DLI

怎样配置DLI队列与数据源的网络连通？配置DLI队列与内网数据源的网络连通 DLI在创建运行作业需要连接外部其他数据源，如：DLI连接MRS、RDS、CSS、Kafka、DWS时，需要打通DLI和外部数据源之间的网络。 DLI提供的增强型跨源连接功能，底层采用对等连接的方式打通与目的数据源的vpc网络，通过点对点的方式实现数据互通。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
INSERT INTO - 数据湖探索 DLI
INSERT INTO - 数据湖探索 DLI

INSERT INTO参数参数描述 tableIndentifier 需要执行INSERT命令的Hudi表的名称。 select query 查询语句。注意事项写入模式：Hudi对于设置了主键的表支持三种写入模式，用户可以设置参数hoodie.sql.insert.mode来指定Insert模式，默认为upsert。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
查询所有队列 - 数据湖探索 DLI

AI增强型即队列加载了AI镜像，该镜像在基础镜像的基础上集成了AI相关的算法包。 resource_type 否 String 队列所属资源类型。 vm：ecf集群 container：容器化集群（k8s） cu_spec 否 Integer 队列的规格大小。对于包周期队列，表示包周期部分的CU值；对于按需队列，表示用户购买队列时的初始值。

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

使用Temporal join关联维表的最新分区功能描述对于随时间变化的分区表，我们可以将其读取为无界流，如果每个分区包含某个版本的完整数据，则该分区可以被视为时间表的一个版本，时间表的版本保留了分区的数据。Flink支持在处理时间关联中自动跟踪时间表的最新分区（版本）。最新分区（版本）由

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Spark SQL常用配置项说明 - 数据湖探索 DLI

并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full GC。在这种情况下，可以

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
查询所有作业 - 数据湖探索 DLI

Insert作业执行过程中扫描的记录条数。 bad_row_count 否 Long Insert作业执行过程中扫描到的错误记录数。 input_size 是 Long 作业执行过程中扫描文件的大小。 result_count 是 Integer 当前作业返回的结果总条数或insert作业插入的总条数。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

账号A将1创建的增强型跨源连接授权给账号B使用。账号A在增强型跨源连接的列表页面，单击操作列下的“更多 > 权限管理”。选择赋权，输入账号B所在的项目ID，将该连接共享给账号B，授予账号B使用连接访问共享VPC资源的权限。获取项目ID请参考获取项目ID。账号B在共享的增强型跨源连接上绑定DLI弹性资源池。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

台可感知内部状态的精确一致，但对于自定义Source/Sink或者有状态算子，需要合理实现ListCheckpointed接口，来保证业务数据需要的可靠性。为了避免因业务修改等需要，手动重启作业后，不丢失数据：对于无内部状态的作业，您可以配置kafka数据源的启动时间或者消费位点到作业停止之前。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
配置DLI读写外部数据源数据的操作流程 - 数据湖探索 DLI

配置DLI读写外部数据源数据的操作流程 DLI执行作业需要读写外部数据源时需要具备两个条件：打通DLI和外部数据源之间的网络，确保DLI队列与数据源的网络连通。妥善保存数据源的访问凭证确保数据源认证的安全性，便于DLI安全访问数据源。本节操作介绍配置DLI读写外部数据源数据操作流程。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

典型场景示例：配置DLI与内网数据源的网络联通背景信息 DLI与内网数据源的网络联通通常指的是华为云内部服务的场景，例如DLI连接MRS、RDS、CSS、Kafka、DWS时，需要打通DLI和外部数据源之间的网络。使用DLI提供的增强型跨源连接，采用对等连接的方式打通DLI与目的数据源的VPC网络，实现数据互通。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
Hudi数据表Archive规范 - 数据湖探索 DLI

Archive（归档）是为了减轻Hudi读写元数据的压力，所有的元数据都存放在这个路径：Hudi表根目录/.hoodie目录，如果.hoodie目录下的文件数量超过10000就会发现Hudi表有非常明显的读写时延。规则 Hudi表必须执行Archive。对于Hudi的MOR类型和COW类型的表，都需要开启Archive。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

已经成为了数据仓库生态系统中的核心。它不仅仅是一个用于大数据分析和ETL场景的SQL引擎，同样它也是一个数据管理平台，可用于发现，定义，和演化数据。 Flink与Hive的集成包含两个层面，一是利用了Hive的MetaStore作为持久化的Catalog，二是利用Flink来读写Hive的表。Overview

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

分组函数在流处理表中的 SQL 查询中，分组窗口函数的 time_attr 参数必须引用一个合法的时间属性，且该属性需要指定行的处理时间或事件时间。对于批处理的 SQL 查询，分组窗口函数的 time_attr 参数必须是一个 TIMESTAMP 类型的属性。表1 分组函数表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
DLI弹性资源池与队列简介 - 数据湖探索 DLI

弹性资源池模式：计算资源的池化管理模式，提供计算资源的动态扩缩容能力，同一弹性资源池中的队列共享计算资源。通过合理设置队列的计算资源分配策略，可以提高计算资源利用率，应对业务高峰期的资源需求。适用场景：适合业务量有明显波动的场合，如周期性的数据批处理任务或实时数据处理需求。支持的队列类型：

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

时，指定字符串文字以替换空键。支持的Connector Kafka 示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Hudi数据表Compaction规范 - 数据湖探索 DLI

jar作业时，CPU与内存比例为1:4~1:8。 Compaction作业是将存量的parquet文件内的数据与新增的log中的数据进行合并，需要消耗较高的内存资源，按照之前的表设计规范以及实际流量的波动结合考虑，建议Compaction作业CPU与内存的比例按照1:4~1:8配置，保证Compaction作

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
自定义函数参数传递 - 数据湖探索 DLI

SQL编辑页面，自定义配置中修改该参数值，即可达到快速修改UDF参数值的目的。操作步骤自定义函数中提供了可选的open(FunctionContext context)方法，FunctionContext具备参数传递功能，自定义配置项通过此对象来传递。自定义函数的参数传递操作步骤如下：在Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
自定义函数参数传递 - 数据湖探索 DLI

SQL编辑页面，自定义配置中修改该参数值，即可达到快速修改UDF参数值的目的。操作步骤自定义函数中提供了可选的open(FunctionContext context)方法，FunctionContext具备参数传递功能，自定义配置项通过此对象来传递。自定义函数的参数传递操作步骤如下：在Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
分组聚合 - 数据湖探索 DLI
分组聚合 - 数据湖探索 DLI

以计算一组行的 “COUNT”、“SUM”、“AVG”（平均）、“MAX”（最大）和 “MIN”（最小）。对于流式查询，用于计算查询结果的状态可能无限膨胀。状态的大小大多数情况下取决于去重行的数量和分组持续的时间，持续时间较短的 group 窗口不会产生状态过大的问题。可以提供一个合适的状态

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
字符串函数和运算符 - 数据湖探索 DLI

这些函数假定输入字符串包含有效的UTF-8编码的Unicode代码点。不会显式检查UTF-8数据是否有效，对于无效的UTF-8数据，函数可能会返回错误的结果。可以使用from_utf8来更正无效的UTF-8数据。此外，这些函数对Unicode代码点进行运算，而不是对用户可见的字符（或字形群集

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符

总条数： 342

上一页
1
2
3
4
5
...
18
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

怎样配置DLI队列与数据源的网络连通？ - 数据湖探索 DLI

INSERT INTO - 数据湖探索 DLI

查询所有队列 - 数据湖探索 DLI

使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

查询所有作业 - 数据湖探索 DLI

建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

配置DLI读写外部数据源数据的操作流程 - 数据湖探索 DLI

典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

分组聚合 - 数据湖探索 DLI

字符串函数和运算符 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线