搜索_华为云

CLEANARCHIVE - 数据湖探索 DLI
CLEANARCHIVE - 数据湖探索 DLI

CLEANARCHIVE 命令功能用于对Hudi表的归档文件进行清理，以减少Hudi表的数据存储及读写压力。命令格式按文件容量进行清理，需要配置参数： hoodie.archive.file.cleaner.policy = KEEP_ARCHIVED_FILES_BY_SIZE;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

图1 创建CSS数据源配置源端CSS的数据源连接，具体参数配置如下。详细参数配置可以参考CDM上配置CSS连接。表1 CSS数据源配置参数值名称自定义CSS数据源名称。例如当前配置为“source_css”。 Elasticsearch服务器列表单击输入框旁边的“选

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
迁移数据场景概述 - 数据湖探索 DLI

为了将分散在不同系统中的数据迁移到DLI，确保数据可以在DLI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。图1 迁移数据至DLI 常见迁移场景与迁移方案指导

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

space_consumed 返回文件/目录在集群中占用的实际空间，即它考虑了为集群设置的复制因子 quota 名称配额（名称配额是对当前目录树中的文件和目录名称数量的硬性限制） space_quota 空间配额（空间配额是对当前目录树中的文件所使用的字节数量的硬性限制）注意事项使用由DLI提供的元数据服务时，不支持本命令。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
Json函数和运算符 - 数据湖探索 DLI

'null'] 在从JSON转换为ROW时，支持JSON数组和JSON对象。 JSON数组可以具有混合元素类型，JSON Map可以有混合值类型。这使得在某些情况下无法将其转换为SQL数组和Map。为了解决该问题，HetuEngine支持对数组和Map进行部分转换： SELECT CAST(JSON'[[1

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
提交作业时提示作业桶权限不足怎么办？ - 数据湖探索 DLI

略名称是否与2一致。效力：允许授权资源：按需授权桶和对象。授权操作：与2中Action一致常用检查项：检查是否配置了所有账号的某些拒绝操作，且这些操作是上述DLI所需要的授权操作。检查是否对DLI的被授权用户配置了某些拒绝操作，且这些操作是上述DLI所需要的授权操作。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI权限管理类
Flink SQL作业运行失败，日志中有connect to DIS failed java.lang.IllegalArgumentException: Access key cannot be null错误 - 数据湖探索 DLI

Access key cannot be null 问题根因该Flink SQL作业在配置作业运行参数时，有选择保存作业日志或开启Checkpoint，配置了OBS桶保存作业日志和Checkpoint。但是运行该Flink SQL作业的IAM用户没有OBS写入权限导致该问题。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？问题描述 Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为不一致根因分析该问题的根因是数据库设置的时区不合理，通常该问题出现时Flink读取的时间和RDS数据库的时间会相差13小时。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

当为大型数据库创建初始一致快照时，您建立的连接可能会在读取表时碰到超时问题。您可以通过在MySQL侧配置 interactive_timeout 和 wait_timeout来解决此类问题。 interactive_timeout: 服务器在关闭交互连接之前等待活动的秒数。更多信息请参考 MySQL Documentations

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
更新管理 - 数据湖探索 DLI
更新管理 - 数据湖探索 DLI

D-2022-40233）等。一旦发现服务模块涉及漏洞影响，会迅速通过官方解决方案升级现网更新漏洞。更新配置 DLI云服务通过版本更新升级更新配置，确保服务的安全性和稳定性。父主题：安全

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
怎样将老版本的Spark队列切换成通用型队列 - 数据湖探索 DLI

怎样将老版本的Spark队列切换成通用型队列当前DLI服务包括“SQL队列”和“通用队列”两种队列类型。其中，“SQL队列”用于运行SQL作业，“通用队列”兼容老版本的Spark队列，用于运行Spark作业和Flink作业。通过以下步骤，可以将老版本的“Spark队列”转换为新的“通用队列”。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

（推荐）方案1：使用临时AK/SK 建议使用临时AK/SK，获取方式可参见统一身份认证服务_获取临时AK/SK。认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。表1 DLI获取访问凭据相关开发指南类型操作指导说明

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
创建弹性资源池和队列 - 数据湖探索 DLI

创建弹性资源池和队列 DLI弹性资源池与队列简介创建弹性资源池并添加队列管理弹性资源池管理队列典型场景示例：创建弹性资源池并运行作业典型场景示例：配置弹性资源池队列扩缩容策略创建非弹性资源池队列（废弃，不推荐使用）

帮助中心 > 数据湖探索 DLI > 用户指南
DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

DLI datasourceV1表和datasourceV2表什么是DLI datasourcev1表和DLI datasourcev2表？ DLI datasource v1表（以下简称V1表）：DLI的Datasource表格式，建表/插入/truncate命令使用DLI自

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
Spark增量读取Hudi参数规范 - 数据湖探索 DLI

8'; // 结果必须根据start.timestamp和end.timestamp进行过滤，如果没有指定end.timestamp，则只需要根据start.timestamp进行过滤。提交其他SQL时，需要清除上述配置参数，避免影响其他任务执行结果。父主题： Spark on

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

OpenSource SQL作业。单击操作列的“编辑”，进入作业编辑页面。在右侧的“运行参数”配置区域，选择新的Flink版本。使用Flink 1.15以上版本的引擎执行作业时，需要在自定义配置中配置委托信息，其中key为"flink.dli.job.agency.name"，valu

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Hudi Clustering操作说明 - 数据湖探索 DLI

t/bulk_insert来将数据写入Hudi表。为了能够在文件大小和入湖速度之间进行权衡，Hudi提供了一个hoodie.parquet.small.file.limit配置来设置最小文件大小。用户可以将该配置设置为“0”，以强制新数据写入新的文件组，或设置为更高的值以确保新数

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Spark作业访问OBS数据时报ResponseCode: 403和ResponseStatus: Forbidden错误 - 数据湖探索 DLI

Spark作业访问OBS数据时报ResponseCode: 403和ResponseStatus: Forbidden错误问题现象 Spark程序访问OBS数据时上报如下错误。 Caused by: com.obs.services.exception.ObsException:

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

弹性资源池上可以添加多个不同队列用于作业运行，具体添加弹性资源池添加队列的操作可以参考创建弹性资源池并添加队列。添加完队列后，可以根据不同队列计算资源使用量的波峰和波谷和优先级来配置要扩缩容的CU数，从而来保障作业的稳定运行。注意事项建议对流批业务实施资源池的精细化管理，将Flink实时流类型的作业与SQL

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
了解数据目录、数据库和表 - 数据湖探索 DLI

在DLI数据目录库下创建数据库和表请参考在DLI控制台创建数据库和表。数据库数据库是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。数据库通常用于存储、检索和管理结构化数据，由多个数据表组成，这些数据表通过键和索引相互关联。表表是数据库最重要的组成部分之一，它由行和列组成。每

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表

总条数： 690

上一页
1
...
6
7
8
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CLEANARCHIVE - 数据湖探索 DLI

典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

Json函数和运算符 - 数据湖探索 DLI

提交作业时提示作业桶权限不足怎么办？ - 数据湖探索 DLI

Flink SQL作业运行失败，日志中有connect to DIS failed java.lang.IllegalArgumentException: Access key cannot be null错误 - 数据湖探索 DLI

Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

更新管理 - 数据湖探索 DLI

怎样将老版本的Spark队列切换成通用型队列 - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

创建弹性资源池和队列 - 数据湖探索 DLI

DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

Spark增量读取Hudi参数规范 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

Spark作业访问OBS数据时报ResponseCode: 403和ResponseStatus: Forbidden错误 - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线