搜索_华为云

窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

0秒内的订单数量，并根据窗口的订单id和窗口开启时间作为主键，将结果实时统计到JDBC中：根据MySQL和kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据MySQL和kafka的地址测试队列连通

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

已创建DLI的SQL队列。创建DLI队列的操作可以参考创建DLI队列。创建DLI队列时队列类型需要选择为“SQL队列”。已创建包含Kafka组件的MRS安全集群。具体创建MRS集群的操作可以参考创建MRS集群。本示例创建的MRS集群版本为：MRS 3.1.0。本示例创建的MRS集群开启了Kerberos认证。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

iii. 此外，您还必须确保该云服务的实例与CDM集群所属的企业项目必须相同，如果不同，需要修改工作空间的企业项目。本示例CDM集群的虚拟私有云、子网以及安全组和RDS MySQL实例保持一致。步骤一：数据准备 RDS的MySQL的数据库实例上创建数据库和表。登录RDS

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
pyspark样例代码 - 数据湖探索 DLI

指南》中的“选择依赖资源参数说明”。通过API提交作业请参考《数据湖探索API参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码通过DataFrame API 访问认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
Spark 3.1.1版本说明 - 数据湖探索 DLI

Spark 3.1.1版本说明数据湖探索（DLI）遵循开源Spark计算引擎的发布一致性。本文介绍Spark 3.1.1版本所做的变更说明。更多Spark 3.1.1版本说明请参考Spark Release Notes。 Spark 3.1.1版本发布时间版本名称发布时间

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Spark 2.4.5版本说明 - 数据湖探索 DLI

表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释修改非分区表或分区表的列注释。支持统计SQL作业的CPU消耗支持在控制台查看“CPU累计使用量”。支持容器集群Spark日志跳转查看需要在容器查看日志。支持动态加载UDF（公测）

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Flink 1.12版本说明 - 数据湖探索 DLI

Flink 1.12版本说明数据湖探索（DLI）遵循开源Flink计算引擎的发布一致性。本文介绍Flink 1.12版本所做的变更说明。更多Flink 1.12版本说明请参考Release Notes - Flink 1.12。 Flink 1.12版本发布时间版本名称发布时间

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
使用DEW管理数据源访问凭证 - 数据湖探索 DLI

RDS实例的用户名。第二行凭据值的键为MySQLPassword，值为RDS实例的密码。图1 设置凭据值按需完成其他参数的配置后，单击“确定”保存凭据。了解更多请参考创建通用凭据。在DLI作业中使用DEW中创建的凭据以Flink作业为例介绍使用DEW凭据的方法。参考Flink

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
Spark 3.3.1版本说明 - 数据湖探索 DLI

提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
字符串函数和运算符 - 数据湖探索 DLI

这些函数假定输入字符串包含有效的UTF-8编码的Unicode代码点。不会显式检查UTF-8数据是否有效，对于无效的UTF-8数据，函数可能会返回错误的结果。可以使用from_utf8来更正无效的UTF-8数据。此外，这些函数对Unicode代码点进行运算，而不是对用户可见的字符（或字形群集

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
配置SQL防御规则 - 数据湖探索 DLI

同一个队列，同一个动作的防御规则仅支持创建一条。系统默认创建的规则会分别创建每个支持动作的规则。例如：创建队列时，会分别创建“提示”和“拦截”动作的Scan files number规则。不同的引擎版本支持的防御规则不同。如需查看队列的引擎版本，您可以在队列资源的资源列表页面，通

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Hudi表分区设计规范 - 数据湖探索 DLI

为各个分区的数据量是会有波动的，分区下桶的个数设计一般会按照最大分区数据量计算，这样会出现越细粒度的分区，桶的个数会冗余越多。例如：采用天级分区，平均的日增数据量是3GB，最多一天的日志是8GB，这个会采用Bucket桶数= 8GB/2GB = 4 来创建表；每天的更新数据占比

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务弹性扩缩容定时任务使用场景通常，用户业务繁忙的场景是有周期性的，在某个周期内，用户需要更多的计算资源来处理业务，过了这个周期，则不需要那么多资源。如果用户购买的队列规格比较小，在业务繁忙时会存在资源不足的情况；而如果购买的队列规格比较大，又可能会存在资源浪费的情况。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
DLI是否支持导入其他租户共享OBS桶的数据？ - 数据湖探索 DLI

DLI是否支持导入其他租户共享OBS桶的数据？ DLI支持将同一个租户下子账户共享OBS桶中的数据导入，但是租户级别共享OBS桶中的数据无法导入。 DLI不支持导入其他租户共享的OBS桶中的数据，主要是为了确保数据的安全性和数据隔离。对于需要跨租户共享和分析数据的场景，建议先将数据脱敏后上

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
认证鉴权 - 数据湖探索 DLI
认证鉴权 - 数据湖探索 DLI

Token认证 Token在计算机系统中代表令牌（临时）的意思，拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头，从而通过身份认证，获得操作API的权限。 Token的有效期为24小时，需要使用一个Token鉴权时，可以先缓存起来，避免频繁调用。

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
全局变量的使用中，一个子账号是否可以使用其他子账号创建的全局变量 - 数据湖探索 DLI

如果同账号同项目下存在多个相同名称的全局变量时，需要将多余相同名称的全局变量删除，保证同账号同项目下唯一，此时具备该全局变量修改权限的用户均可以修改对应的变量值。如果同账号同项目下存在多个相同名称的全局变量，优先删除用户自建的。如果仅存在唯一名称的全局变量，则具备删除权限即的用户均可删除该全局变量。父主题：

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
创建Hive Catalog - 数据湖探索 DLI

Hive兼容表是以Hive兼容的方式存储的，他们的元数据和实际的数据都在分层存储中。因此，通过flink创建的与hive兼容的表，可以通过hive查询。 Hive通用表是特定于Flink的。当使用HiveCatalog创建通用表时，只是使用HMS来持久化元数据。虽然这些表对Hive来说是可见的，但Hi

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Flink作业性能调优 - 数据湖探索 DLI

出，说明的是该消费组当前待消费的数据总量。如果Flink作业对接的是kafka专享版，则可通过云监控服务(CES)进行查看。具体可选择“云服务监控 > 分布式消息服务 > kafka专享版” ，单击“kafka实例名称 > 消费组” ，选择具体的消费组名称，查看消费组的指标信息。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
更新管理 - 数据湖探索 DLI
更新管理 - 数据湖探索 DLI

3）等。一旦发现服务模块涉及漏洞影响，会迅速通过官方解决方案升级现网更新漏洞。更新配置 DLI云服务通过版本更新升级更新配置，确保服务的安全性和稳定性。父主题：安全

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
队列标签管理 - 数据湖探索 DLI

标签是用户自定义的、用于标识云资源的键值对，它可以帮助用户对云资源进行分类和搜索。标签由标签“键”和标签“值”组成。如果用户在其他云服务中使用了标签，建议用户为同一个业务所使用的云资源创建相同的标签键值对以保持一致性。 DLI支持以下两类标签：资源标签：在DLI中创建的非全局的标签。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列

总条数： 300

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

窗口 - 数据湖探索 DLI

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Spark 3.1.1版本说明 - 数据湖探索 DLI

Spark 2.4.5版本说明 - 数据湖探索 DLI

Flink 1.12版本说明 - 数据湖探索 DLI

使用DEW管理数据源访问凭证 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

字符串函数和运算符 - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

DLI是否支持导入其他租户共享OBS桶的数据？ - 数据湖探索 DLI

认证鉴权 - 数据湖探索 DLI

全局变量的使用中，一个子账号是否可以使用其他子账号创建的全局变量 - 数据湖探索 DLI

创建Hive Catalog - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

更新管理 - 数据湖探索 DLI

队列标签管理 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线