搜索_华为云

Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

NAME primary-keys ARRAY<STRING> NULL 保存源表的主键的列名的数组。如果includePrimaryKeys配置属性设置为true，则仅在JSON输出中包含primary-keys字段。 ingestion-timestamp TIMESTAMP_LTZ(6)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
创建DLI程序包 - 数据湖探索 DLI

创建DLI程序包 DLI支持用户通过批处理方式将程序包提交至通用队列中运行。如果用户需要更新程序包，可以使用相同的程序包或文件上传至DLI的同一个位置（同一个分组），直接覆盖原有的程序包或文件。前提条件所使用的程序包需提前上传至OBS服务中保存。创建程序包步骤在管理控制

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

fka写入重复的改动消息，Flink将获得重复的消息。这可能会导致Flink查询得到错误的结果或意外的异常。因此，在这种情况下，建议将作业配置table.exec.source.cdc-events-duplicate设置为true，并在源表上定义PRIMARY KEY。Fram

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
区域和可用区 - 数据湖探索 DLI

地理位置一般情况下，建议就近选择靠近您或者您的目标用户的区域，这样可以减少网络时延，提高访问速度。不过，在基础设施、BGP网络品质、资源的操作与配置等方面，中国大陆各个区域间区别不大，如果您或者您的目标用户在中国大陆，可以不用考虑不同区域造成的网络时延问题。香港、曼谷等其他地区和国家

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

thon程序也有依赖一些第三方库，尤其是基于PySpark的融合机器学习相关的大数据分析程序。传统上，通常是直接基于pip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DL

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用CTS审计DLI服务 - 数据湖探索 DLI

使用CTS审计DLI服务通过云审计服务，您可以记录与DLI服务相关的操作事件，便于日后的查询、审计和回溯。表1 云审计服务支持的DLI操作列表操作名称资源类型事件名称创建数据库 database createDatabase 删除数据库 database deleteDatabase

帮助中心 > 数据湖探索 DLI > 用户指南
弹性资源池权限管理 - 数据湖探索 DLI

控制台。权限设置更新：当前用户可更新弹性资源池的描述信息。资源管理：当前用户可在弹性资源池上添加队列、删除队列、操作队列的扩缩容策略配置。删除：当前用户可删除此弹性资源池。规格变更：当前用户对于包年包月的弹性资源池可以执行规格变更操作。赋权：当前用户可将弹性资源池的操作权限赋予其他用户。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
DLI SDK与API的对应关系 - 数据湖探索 DLI

DLI SDK与API的对应关系 OBS授权表1 OBS授权相关API&SDK的对应关系表 Class Method Java Method Python Method API Authorize OBS授权 authorizeBucket - POST /v1.0/{proj

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
分区相关 - 数据湖探索 DLI
分区相关 - 数据湖探索 DLI

分区相关添加分区（只支持OBS表）重命名分区（只支持OBS表）删除分区指定筛选条件删除分区（只支持OBS表）修改表分区位置（只支持OBS表）更新表分区信息（只支持OBS表） REFRESH TABLE刷新表元数据父主题：表相关

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关
（推荐）DLI SDK V3 - 数据湖探索 DLI

K，列举了最新版本SDK的获取地址。 SDK列表表1提供了DLI云服务支持的SDK列表，您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。表1 SDK列表编程语言 Github地址参考文档视频指导 Java huaweicloud-sdk-java-v3

帮助中心 > 数据湖探索 DLI > SDK参考
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据应用场景 Parquet是面向分析型业务的列式存储格式，这种格式可以加快查询速度，查询Parquet格式数据时，只检查所需要的列并对它们的值执行计算，也就是说，只读取一个数据文件或表的一小部分数据。Parquet还支持灵活的压缩选项

 帮助中心 > 数据湖探索 DLI > 最佳实践
创建增强型跨源连接 - 数据湖探索 DLI

系统提示信息，执行成功时，信息可能为空。 connection_id String 连接ID，用于标识跨源连接的UUID。请求示例为队列创建增强型跨源连接，并配置主机信息。 { "name": "test", "dest_vpc_id": "22094d8f-c310-4621-913d-4c4d655d8495"

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
查询所有表（废弃） - 数据湖探索 DLI

查询所有表（废弃）功能介绍该API用于查询指定数据库下符合过滤条件的或所有的表信息。当前接口已废弃，不推荐使用。 URI URI格式： GET /v1.0/{project_id}/databases/{database_name}?keyword=tb&with-detail=true

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 表相关API（废弃）
SQL作业运维类 - 数据湖探索 DLI

SQL作业运维类用户导表到OBS报“path obs://xxx already exists”错误对两个表进行join操作时，提示：SQL_ANALYSIS_ERROR: Reference 't.id' is ambiguous, could be: t.id, t.id

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类
入门实践 - 数据湖探索 DLI
入门实践 - 数据湖探索 DLI

入门实践我们整理了从队列网络连通、不同类型的作业分析、数据迁移场景的常用开发指南和最佳实践内容，帮助您更好的使用DLI进行大数据分析和处理。表1 DLI常用开发指南与最佳实践场景操作指导描述 Spark SQL作业开发使用Spark SQL作业分析OBS数据介绍使用Spark

帮助中心 > 数据湖探索 DLI > 快速入门
了解数据目录、数据库和表 - 数据湖探索 DLI

了解数据目录、数据库和表数据库和表是SQL作业、Spark作业场景开发的基础，在执行作业前您需要根据业务场景定义数据库和表。 Flink支持动态数据类型，可以在运行时定义数据结构，不需要事先定义元数据。数据目录数据目录（Catalog）是元数据管理对象，它可以包含多个数据库。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
查询所有表（废弃） - 数据湖探索 DLI

查询所有表（废弃）功能介绍该API用于查询指定数据库下符合过滤条件的或所有的表信息。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： GET /v1.0/{project_id}/databases/{database_name}/tables

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

schema-include 否 false Boolean 设置 Debezium Kafka Connect 时，用户可以启用 Kafka 配置 'value.converter.schemas.enable' 以在消息中包含 schema。此选项表明 Debezium JSON 消息是否包含

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
分组聚合 - 数据湖探索 DLI
分组聚合 - 数据湖探索 DLI

量和分组持续的时间，持续时间较短的 group 窗口不会产生状态过大的问题。可以提供一个合适的状态 time-to-live (TTL) 配置来防止状态过大。注意：这可能会影响查询结果的正确性。更多介绍和使用请参考开源社区文档：分组聚合。 DISTINCT 聚合 DISTINCT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

Spark作业相关完整样例代码和依赖包说明请参考：Python SDK概述。提交批处理作业 DLI提供执行批处理作业的接口。您可以使用该接口执行批处理作业。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK

总条数： 662

上一页
1
...
27
28
29
...
34
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Ogg Format - 数据湖探索 DLI

创建DLI程序包 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

区域和可用区 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

使用CTS审计DLI服务 - 数据湖探索 DLI

弹性资源池权限管理 - 数据湖探索 DLI

DLI SDK与API的对应关系 - 数据湖探索 DLI

分区相关 - 数据湖探索 DLI

（推荐）DLI SDK V3 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

查询所有表（废弃） - 数据湖探索 DLI

SQL作业运维类 - 数据湖探索 DLI

入门实践 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

查询所有表（废弃） - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

分组聚合 - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线