搜索_华为云

使用前必读 - 数据湖探索 DLI
使用前必读 - 数据湖探索 DLI

使用前必读使用须知 DLI HetuEngine功能为白名单功能，如需使用，请在管理控制台右上角，选择“工单 > 新建工单”，提交申请。使用前您需要先创建一个HetuEngine类型的SQL队列，具体操作请参考创建弹性资源池并添加队列。 HetuEngine SQL需搭配lakefor

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

怎样将OBS表映射为DLI的分区表？场景概述用户使用Flink SQL作业时，需要创建OBS分区表，用于后续进行批处理。操作步骤该示例将car_info数据，以day字段为分区字段，parquet为编码格式，转储数据到OBS。更多内容请参考《数据湖探索Flink SQL语法参考》。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
自定义函数参数传递 - 数据湖探索 DLI

起来。参考k2。如果key或value中含有半角冒号(:)，则需要用双引号(")将key或value包围起来。参考k3。如果key或value中含有双引号(")，则需要通过连写两个双引号("")进行转义，也需要用双引号(")将key:value整个包围起来。参考k4。在自定

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
自定义函数参数传递 - 数据湖探索 DLI

起来。参考k2。如果key或value中含有半角冒号(:)，则需要用双引号(")将key或value包围起来。参考k3。如果key或value中含有双引号(")，则需要通过连写两个双引号("")进行转义，也需要用双引号(")将key:value整个包围起来。参考k4。在自定

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
创建DLI自定义委托权限 - 数据湖探索 DLI

15和Spark 3.3及以上版本的引擎执行作业时，当您所需的委托没有包含在DLI系统委托dli_management_agency时，您需要在IAM页面创建相关委托，并在作业配置中添加新建的委托信息。dli_management_agency包含跨源操作、消息通知、用户授权操作

 帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

Spark、Apache Flink、trino生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。用户不需要管理任何服务器，即开即用。支持标准SQL/Spark SQL/Flink SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
终端节点 - 数据湖探索 DLI
终端节点 - 数据湖探索 DLI

的请求地址，不同服务不同区域的终端节点不同，您可以从地区和终端节点中查询所有服务的终端节点。数据湖探索的终端节点如下表所示，请您根据业务需要选择对应区域的终端节点。表1 数据湖探索的终端节点区域名称区域终端节点（Endpoint）华北-北京四 cn-north-4 dli

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
CSS安全集群配置 - 数据湖探索 DLI

ssl", "true") 如果CSS安全集群开启了HTTPS访问，此处需要设置为“true”，并且需要继续设置后面的安全证书、文件地址等参数。如果CSS安全集群未开启HTTPS访问，此处需要设置为“false”，则不需要设置后面安全证书、文件地址等参数。 .option("es.net

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端使用DLI Python SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Token两种认证方式初始化客户端，示例代码如下。完整样例代码和依赖包说明请参考：Python

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

Spark作业的实际资源使用情况查看Spark作业原始资源配置登录DLI 控制台，单击左侧“作业管理”>“Spark作业”，在作业列表中找到需要查看的Spark作业，单击“作业ID”前的，即可查看对应Spark作业的原始资源配置参数。在创建Spark作业时，配置了“高级配置”中的

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Print结果表 - 数据湖探索 DLI
Print结果表 - 数据湖探索 DLI

打印内容条件1 条件2 标识符:任务 ID> 输出数据需要提供前缀打印标识符，即创建Print表时在with参数中指定print-identifier。 parallelism > 1 标识符> 输出数据需要提供前缀打印标识符，即创建Print表时在with参数中指定print-identifier。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
创建增强型跨源连接 - 数据湖探索 DLI

dest_network_id 是 String 对应服务的子网网络ID，即为需要建立连接的服务所在的子网。具体请参考《虚拟私有云API参考》。 elastic_resource_pools 否 Array of Strings 需要使用跨源的弹性资源池列表。 queues 否 Array of

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

15，Spark计算引擎推荐版本： Spark 3.3.1。本节操作介绍如何升级作业的引擎版本。 SQL作业： SQL作业不支持配置引擎版本，需要您重新新建队列执行SQL作业，新创建的队列会默认使用新版本的Spark引擎。 Flink OpenSource SQL作业：登录DLI管理控制台。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
身份认证与访问控制 - 数据湖探索 DLI

用户访问DLI的方式主要有两种，包括DLI Console界面、DLI Open API等，其本质都是通过DLI提供的REST API接口进行请求。 DLI的接口均需要通过认证鉴权才能访问，控制台发送的请求与调用API接口的请求均支持Token认证鉴权。访问控制您可以使用统一身份认证服务（Identity

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
Print - 数据湖探索 DLI
Print - 数据湖探索 DLI

打印内容条件1 条件2 标识符:任务 ID> 输出数据需要提供前缀打印标识符，即创建Print表时在with参数中指定print-identifier。 parallelism > 1 标识符> 输出数据需要提供前缀打印标识符，即创建Print表时在with参数中指定print-identifier。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Hudi数据表Archive规范 - 数据湖探索 DLI

对于Hudi的MOR类型和COW类型的表，都需要开启Archive。 Hudi表在写入数据时会自动判断是否需要执行Archive，因为Archive的开关默认打开(hoodie.archive.automatic默认为true)。 Archive操作并不是每次写数据时都会触发，至少需要满足以下两个条件： Hudi表满足hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

API语法说明设置写入方式 Hudi通过hoodie.datasource.write.operation参数设置写入模式。 insert：该操作不需要通过索引去查询具体更新的文件分区，因此它的速度比upsert快。当不包含更新数据时建议使用该操作，如果存在更新数据使用该操作会出现重复数据。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
Spark jar 如何读取上传文件 - 数据湖探索 DLI

路径作为参数传给Executor去执行。 Executor获取文件路径的时候，仍然需要使用SparkFiles.get(“filename”)的方式获取。 SparkFiles.get()方法需要spark初始化以后才能调用。图1 添加其他依赖文件代码段如下所示 package

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

问题现象手动在OBS表的分区目录下上传了分区数据，但是在SQL编辑器中查询该表新增的分区数据时却查询不到。解决方案手动添加分区数据后，需要刷新OBS表的元数据信息。具体操作如下： MSCK REPAIR TABLE table_name; 执行完上述命令后，再执行对应OBS分区表的数据查询即可。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Hudi数据表Compaction规范 - 数据湖探索 DLI

对于MOR表，不管是流式写入还是批量写入，需要保证每天至少完成1次Compaction操作。如果长时间不做compaction，Hudi表的log将会越来越大，这必将会出现以下问题： Hudi表读取很慢，且需要很大的资源。这是由于读MOR表涉及到log合并，大log合并需要消耗大量的资源并且速度很慢。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范

总条数： 596

上一页
1
...
6
7
8
...
30
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用前必读 - 数据湖探索 DLI

怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

终端节点 - 数据湖探索 DLI

CSS安全集群配置 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

Print结果表 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

身份认证与访问控制 - 数据湖探索 DLI

Print - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

Spark jar 如何读取上传文件 - 数据湖探索 DLI

手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线