搜索_华为云

Hudi Archive操作说明 - 数据湖探索 DLI

Archive用户清理Hudi表的元数据文件（位于.hoodie目录下，格式为 ${时间戳}.${操作类型}.${操作状态}，比如20240622143023546.deltacommit.request）。对Hudi表进行的每次操作都会产生元数据文件，而元数据文件过多会导致性能问题，所以元数据文件数量最好控制在1000以内。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
MRS配置 - 数据湖探索 DLI
MRS配置 - 数据湖探索 DLI

用户”，选择新建用户，选择“更多 > 下载认证凭据”，保存后解压得到用户的keytab文件与krb5.conf文件。创建MRS HBase表创建DLI表关联MRS HBase表之前确保HBase的表是存在的。以样例代码为例，具体的流程是：远程登录ECS，通过hbase shell命令查看表信息。其中，“hbtest”是要查询的表名。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

步骤2：创建弹性资源池并添加队列本例创建弹性资源池“dli_resource_pool”、队列“dli_queue_01”。登录DLI管理控制台。在左侧导航栏单击“资源管理 > 弹性资源池”，可进入弹性资源池管理页面。在弹性资源池管理界面，单击界面右上角的“购买弹性资源池”。

帮助中心 > 数据湖探索 DLI > 快速入门
怎样将老版本的Spark队列切换成通用型队列 - 数据湖探索 DLI

将在旧的“Spark队列”中的作业迁移到新的“通用型队列”中，即在提交Spark作业时指定新的队列。释放旧的“Spark队列”，即删除或退订队列。父主题： DLI弹性资源池和队列类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
Hudi - 数据湖探索 DLI
Hudi - 数据湖探索 DLI

Hudi Hudi是一种数据湖的存储格式，在Hadoop文件系统之上提供了更新数据和删除数据的能力以及消费变化数据的能力。支持多种计算引擎，提供IUD接口，在HDFS的数据集上提供了插入更新和增量拉取的功能。表1 支持类别类别详情支持Flink表类型源表、结果表支持hudi表类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
CSS安全集群配置 - 数据湖探索 DLI

此处设置keystore.jks文件的位置以及进入这个文件的密钥。在准备工作中生成的keystore.jks文件需要先放到OBS桶中，然后填入ak和sk以及jks文件的具体位置。最后在“es.net.ssl.keystore.pass”填入进入文件的密钥。 .option("es

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
Flink作业运行异常，如何定位 - 数据湖探索 DLI

单击OBS桶，获取对应作业的完整运行日志。图2 查看运行日志下载最新“jobmanager.log”文件，搜索“RUNNING to FAILED”关键字，通过上下文的错误栈，确认失败原因。如果“jobmanager.log”文件中的信息不足以定位，可以在运行日志中找到对应的“taskmanager.log”日志，搜索“RUNNING

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
数据迁移与传输方式概述 - 数据湖探索 DLI

数据迁移与传输方式概述导入数据至OBS DLI支持在不迁移数据的情况下，直接访问OBS中存储的数据进行查询分析。您只需将本地数据导入OBS即可开始使用DLI进行数据分析。导入数据的具体操作请参考上传对象。迁移数据至DLI 为了将分散在不同系统中的数据迁移到DLI，确保数据

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
产品规格 - 数据湖探索 DLI
产品规格 - 数据湖探索 DLI

DLI弹性资源池之间为物理集群隔离，同一个弹性资源池中的队列之间为逻辑隔离。建议您对测试业务场景和生产业务场景分别创建弹性资源池，通过资源物理隔离的方式，保障资源管理的独立性和安全性。 DLI提供的弹性资源池规格如表1所示。表1 弹性资源池规格类型规格约束限制适用场景基础版

 帮助中心 > 数据湖探索 DLI > 产品介绍
Spark作业开发类 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中通用队列操作OBS表如何设置AK/SK 如何查看DLI Spark作业的实际资源使用情况将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？如何在DLI中运行复杂PySpark程序？如何通过JDBC设置spark

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
更新表分区信息（只支持OBS表） - 数据湖探索 DLI

SERDEPROPERTIES：Serde属性。参数说明表1 参数描述参数描述 table_name 表名称。 partition_specs 分区字段。 obs_path OBS存储路径。注意事项该命令的主要应用场景是针对分区表，如当手动在OBS上面添加分区目录时，再通过上述命令将该新增的分区信息刷新到元数据库中，通过“SHOW

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 Maven工程的pom.xml文件配置请参考JAVA样例代码（Flink 1.12）中“pom文件配置”说明。确保本地编译环境可以正常访问公网。约束与限制需要在DLI控制台下“全局配置 > 服务授权”开启Tenant

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
IEF系统事件上报（废弃） - 数据湖探索 DLI

调试您可以在API Explorer中调试该接口。 URI URI格式 POST /v1/{project_id}/edgesrv/system-events 参数说明表1 URI参数说明参数名称是否必选参数类型说明 project_id 是 String 项目编号，

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > IEF相关API（废弃）
SHOW PARTITIONS - 数据湖探索 DLI
SHOW PARTITIONS - 数据湖探索 DLI

PARTITIONS [catalog_name.][db_name.]table_name [PARTITION (partitionSpecs)]; 描述这个表达式用于列出指定的的所有分区。示例 SHOW PARTITIONS test PARTITION(hr = '12'

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

常大，在bulk存储设置的数据条数前提前到达了单次batch的总数据量上限，则停止存储数据，以batch.size.bytes为准，提交该批次的数据。 batch.size.bytes 单次batch的总数据量上限，默认为1mb。如果单条数据非常小，在bulk存储到总数据量前提前

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

OBS，为了确保AKSK数据安全，您可以通过数据加密服务（Data Encryption Workshop，DEW）、云凭据管理服务（Cloud Secret Management Service，CSMS），对AKSK统一管理，有效避免程序硬编码或明文配置等问题导致的敏感信息泄露以及权限失控带来的业务风险。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
包年/包月计费模式的DLI资源可以和按需计费模式相互转换吗？ - 数据湖探索 DLI

或购买套餐包的形式更加优惠。自建队列购买方式如下：购买队列请参考创建队列。弹性资源池购买方式如下：具体弹性资源池的购买和添加队列操作可以参考《数据湖探索用户指南》中的“创建弹性资源池”和“弹性资源池添加队列”相关章节。父主题：计费相关问题

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
增强型跨源连接绑定弹性资源池 - 数据湖探索 DLI

增强型跨源连接绑定弹性资源池操作场景如果其他弹性资源池想要通过已创建的增强型跨源连接来连接数据源，可以在增强型跨源连接页面绑定弹性资源池。本节的操作指导介绍增强型跨源连接绑定弹性资源池的操作指导。约束限制增强型跨源仅支持包年包月队列和按需专属的弹性资源池/队列。绑定跨源的DLI队列网段和数据源网段不能重合。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

partition-name。 create-time 比较分区/文件创建时间，这不是 Hive metaStore 中的分区创建时间，而是文件系统中的文件夹/文件修改时间，如果分区文件夹以某种方式更新，例如将新文件添加到文件夹中，可能会影响数据的使用方式。 partition-time

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager.out文件查看结果日志。父主题： Hudi

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi

总条数： 621

上一页
1
...
15
16
17
...
32
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi Archive操作说明 - 数据湖探索 DLI

MRS配置 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

怎样将老版本的Spark队列切换成通用型队列 - 数据湖探索 DLI

Hudi - 数据湖探索 DLI

CSS安全集群配置 - 数据湖探索 DLI

Flink作业运行异常，如何定位 - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

产品规格 - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

更新表分区信息（只支持OBS表） - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

IEF系统事件上报（废弃） - 数据湖探索 DLI

SHOW PARTITIONS - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

包年/包月计费模式的DLI资源可以和按需计费模式相互转换吗？ - 数据湖探索 DLI

增强型跨源连接绑定弹性资源池 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线