搜索_华为云

Hudi Clustering操作说明 - 数据湖探索 DLI

了能够在文件大小和入湖速度之间进行权衡，Hudi提供了一个hoodie.parquet.small.file.limit配置来设置最小文件大小。用户可以将该配置设置为“0”，以强制新数据写入新的文件组，或设置为更高的值以确保新数据被“填充”到现有小的文件组中，直到达到指定大小为止，但其会增加摄取延迟。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
队列相关 - 数据湖探索 DLI
队列相关 - 数据湖探索 DLI

队列相关前提条件已参考Java SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化。创建队列 DLI提供创建队列的接口，您可以使用该接口创建队列。示例代码如下： 1 2 3 4 5 6 7 8 9 private static

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Flink作业配置参数对于Flink Jar作业，您需要在代码中开启Checkpoint，同时如果有自定义的状态需要保存，您还需要实现ListCheckpointed接口，并为每个算子设置唯一ID。然后在作业配置中，勾选“从Checkpoint恢复”，并准确配置Checkpoint路径。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

Connector。详细操作请参考Flink OpenSource SQL1.15语法概览。 Flink 1.15需要配置租户面自定义委托，并在作业中配置委托信息。委托的权限需要根据作业具体的业务场景需求进行配置。详情操作请参考DLI自定义委托。 Flink 1.15作业管理凭据的方法： Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
提交SQL作业（推荐） - 数据湖探索 DLI

纯数字，且不能以下划线开头。 conf 否 Array of Strings 用户以“key/value”的形式设置用于此作业的配置参数。目前支持的配置项请参考表3。 tags 否 Array of Objects 作业的标签。具体请参考表4。 engine_type 否 String

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

table_name 需要导入数据的DLI表的名称。以下是可以在导入数据时使用的配置选项： DATA_TYPE: 指定导入的数据类型，当前支持CSV、Parquet、ORC、JSON、Avro类型，默认值为“CSV”。配置项为OPTIONS('DATA_TYPE'='CSV') 导入CSV和JSON文件时，有三种模式可以选择：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
DROP TABLE - 数据湖探索 DLI
DROP TABLE - 数据湖探索 DLI

Database名称。如果未指定，将选择当前database。 table_name 需要删除的Table名称。注意事项在该命令中，IF EXISTS和db_name是可选配置。在使用本语句删除外表时，OBS目录的数据不会自动删除。删除MOR表时，后缀_rt表和后缀_ro表不会自动删除，如需删除需要额外执行DROP语句。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
导入数据（废弃） - 数据湖探索 DLI

partition_spec 否 Object 表示需要导入到哪个分区。不配置表示动态导入整表数据，导入的数据需要包含分区列的数据；如果导入时，配置所有分区信息，则表示导入数据到指定分区，导入的数据不能包含分区列的数据；如果导入时，配置了部分分区信息，而导入的数据必须包含非指定的分区数据，不能

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
服务韧性 - 数据湖探索 DLI
服务韧性 - 数据湖探索 DLI

障数据的持久性和可靠性。流量限制：DLI通过设置流量控制机制，防止服务过载并保持服务的稳定性。跨AZ容灾：DLI云服务采用跨可用区容灾部署，减少单点故障的风险，提高系统的可用性和弹性。备份恢复：DLI自动化的备份策略和恢复计划，确保在发生故障时可以迅速恢复服务和数据。父主题：

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
创建DLI表关联DDS - 数据湖探索 DLI

创建DLI表关联DDS 功能描述使用CREATE TABLE命令创建DLI表并关联DDS上已有的collection。 Spark跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。前提条件创建DLI

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DDS表
为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

盖了全量数据而不是预期的分区数据，这可能是因为动态分区覆盖功能没有被启用。如果需要动态覆盖DataSource表指定的分区数据，您需要先配置参数 dli.sql.dynamicPartitionOverwrite.enabled=true，然后通过insert overwrite语句实现。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
迁移数据场景概述 - 数据湖探索 DLI

具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。图1 迁移数据至DLI 常见迁移场景与迁移方案指导表1 常见迁移场景与迁移方案指导数据类型迁移工具迁移方案

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

DATE_FORMAT (order_time, 'yyyyMMdd') from orderSource; 配置作业运行参数：选择队列，并配置Flink版本至少为1.15。配置权限足够的委托。配置OBS桶。开启Checkpoint，使用Hudi时必须开启Checkpoint。提交作业并检查Flink

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
新建跨源连接，显示已激活，但使用时提示communication link failure错误怎么办？ - 数据湖探索 DLI

检查安全组网络（vpc）配置。若按照步骤1重建跨源连接后还是报错“communication link failure”，则检查vpc配置。经典型跨源：入方向规则：检查本安全组内的入方向网段及端口是否已开放，若没有则添加。检查网段及端口是否配置。图2 检查网段及端口是否配置如果不存在，则进行添加。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
权限管理概述 - 数据湖探索 DLI

队列使用权限数据权限数据库权限请参考在DLI控制台配置数据库权限和在DLI控制台配置表权限请参考《权限列表》。表权限列权限作业权限 Flink作业请参考配置Flink作业权限无程序包权限程序包组权限请参考配置DLI程序包权限无程序包权限跨源认证权限跨源认证权限

 帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
设置多版本备份数据保留周期 - 数据湖探索 DLI

设置多版本备份数据保留周期功能描述在DLI数据多版本功能开启后，备份数据默认保留7天，您可以通过配置系统参数“dli.multi.version.retention.days”调整保留周期。保留周期外的多版本数据后续在执行insert overwrite或者truncate语

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
故障处理 - 数据湖探索 DLI
故障处理 - 数据湖探索 DLI

on: Message stream modified (41) 解决方案编辑“krb5.conf” 配置文件，将文件中所有“renew_lifetime = xxx”配置删除。重新创建和提交Spark作业。父主题：对接HBase

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
创建批处理作业 - 数据湖探索 DLI

Object batch配置项，参考Spark Configuration。 name 否 String 创建时用户指定的批处理名称，不能超过128个字符。 driverMemory 否 String Spark应用的Driver内存，参数配置例如2G, 2048M。该配置项会替换“sc_

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
导出查询结果 - 数据湖探索 DLI

gb2312 gbk quote_char 否 String 用户自定义引用字符。默认值: 英文双引号（"）仅在数据格式为csv格式时支持配置引用字符。引用字符在导出作业结果时用于标识文本字段的开始和结束，即用于分割字段。仅支持设置一个字符。主要用于处理包含空格、特殊字符或与分隔符相同字符的数据。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
对象存储OBS结果表 - 数据湖探索 DLI

完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subtask，每个桶将至少包含一个Part文件。将根据配置的滚动策略来创建其他Part文件。对于Row

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS

总条数： 886

上一页
1
...
8
9
10
...
45
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi Clustering操作说明 - 数据湖探索 DLI

队列相关 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

DROP TABLE - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

服务韧性 - 数据湖探索 DLI

创建DLI表关联DDS - 数据湖探索 DLI

为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

新建跨源连接，显示已激活，但使用时提示communication link failure错误怎么办？ - 数据湖探索 DLI

权限管理概述 - 数据湖探索 DLI

设置多版本备份数据保留周期 - 数据湖探索 DLI

故障处理 - 数据湖探索 DLI

创建批处理作业 - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线