搜索_华为云

Hudi表索引设计规范 - 数据湖探索 DLI

实时入湖都是需要分钟内或者分钟级的高性能入湖，索引的选择会影响到写Hudi表的性能。在性能方面各个索引的区别如下： Bucket索引优点：写入过程中对主键进行hash分桶写入，性能比较高，不受表的数据量限制。Flink和Spark引擎都支持，Flink和Spark引擎可以实现交叉混写同一张表。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
权限策略和授权项 - 数据湖探索 DLI

对应API接口：自定义策略实际调用的API接口。授权项：自定义策略中支持的Action，在自定义策略中的Action中写入授权项，可以实现授权项对应的权限功能。依赖的授权项：部分Action存在对其他Action的依赖，需要将依赖的Action同时写入授权项，才能实现对应的权限功能。 IAM

帮助中心 > 数据湖探索 DLI > API参考
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

步骤1：创建队列：创建DLI作业运行的队列。步骤2：创建RDS Postgres数据库：创建RDS Postgres的数据库和表。步骤3：创建DWS数据库和表：创建用于接收数据的DWS数据库和表。步骤4：创建增强型跨源连接：DLI上创建连接RDS和DWS的跨源连接，打通网络。步骤5

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

0支持弹性资源池和队列使用DLI提交作业前，您需要为提交作业准备所需的计算资源。 · 弹性资源池和队列：弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存），灵活应对业务对计算资源变化的需求。同一弹性资源池中，队列之间的计算资源支持共享。通过合理设置队列的计算资源分配策略，可以提高计算资源利用率。

帮助中心 > 数据湖探索 DLI > 功能总览
自定义函数类型推导 - 数据湖探索 DLI

然而以反射方式提取数据类型并不总是成功的，比如UDTF中常见的Row类型。由于 Flink 1.11 起引入了新的自定义函数注册接口，使用了新的自定义函数类型推断机制，因此原先1.10 重载 getResultType 声明返回字段类型的方式将不再可用。继续使用会抛出如下异常：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

user.regionName DLI队列所在的区域名。从地区和终端节点获取，对应“区域”列就是regionName。 spark.dli.user.dliEndPoint DLI队列所在的终端节点。从地区和终端节点获取，对应的“终端节点（Endpoint）”就是该参数取值。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存），用于灵活应对业务对计算资源变化的需求。创建弹性资源池后，您可以在弹性资源池中创建多个队列，队列关联到具体的作业和数据处理任务，是资源池中资源被实际使用和分配的基本单元，即队列是执行作业所需的具体的计算资源。同一弹性资源池中，队列之间的计算资源支持共享。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

该字段的map的value需要为double类型，表示score，该字段的map的key表示redis的set中的值。当data-type为sorted-set，且schema-syntax为array-scores时，除主键字段外，只能有两个非主键字段，且这两个字段的类型需要为array。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库问题描述 Spark3.x的作业日志中提示找不到global_temp数据库。根因分析 global_temp数据库是Spark3.x默认内置的数据库，是Spark的全局临时视图。通常在Spark作业执行注册view

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

该字段的map的value需要为double类型，表示score，该字段的map的key表示redis的set中的值。当data-type为sorted-set，且schema-syntax为array-scores时，除主键字段外，只能有两个非主键字段，且这两个字段的类型需要为array。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

详细的DLI创建数据库的语法可以参考创建DLI数据库。 create database testdb; 后续章节操作都需要在testdb数据库下进行操作。 DataSource和Hive两种语法创建OBS表的区别 DataSource语法和Hive语法主要区别在于支持的表数据存

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
DWS维表 - 数据湖探索 DLI
DWS维表 - 数据湖探索 DLI

和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。设置DWS和Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性分别根据DWS和Kafka的地址测试队列连通性。若能连通，则表示跨源已经绑定成功，否则表示未成功。连接DWS

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

安全CSS集群的证书，生成的keystore文件在OBS上的地址。 es.net.ssl.keystore.pass 安全CSS集群的证书，生成的keystore文件时的密码。 es.net.ssl.truststore.location 安全CSS集群的证书，生成的truststore文件在OBS上的地址。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
查看表的用户权限（废弃） - 数据湖探索 DLI

项目编号，用于资源隔离。获取方式请参考获取项目ID。 database_name 是 String 被查询的表所在的数据库名称。 table_name 是 String 被查询的表名称。 user_name 是 String 被查询的用户名称。请求消息无请求参数。响应消息表2 响应参数参数名称是否必选

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）
如何获取项目ID？ - 数据湖探索 DLI

如何获取项目ID？项目ID是系统所在区域的ID。用户在调用API接口进行云资源管理（如创建集群）时，需要提供项目ID。查看项目ID步骤如下：注册并登录华为云管理控制台。将鼠标移动到右上角用户名上，在下拉列表中单击“我的凭证”。在“我的凭证”页面的项目列表中查看项目ID。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
数据湖探索简介 - 数据湖探索 DLI

开源生态：通过增强型跨源连接建立与其他VPC的网络连接后，用户可以在数据湖探索的租户授权的队列中访问所有Flink和Spark支持的数据源与输出源，如Kafka、Hbase、ElasticSearch等。具体内容请参见《数据湖探索开发指南》。存算分离用户将数据存储到OBS后，DLI可以直接和OBS对接进行

 帮助中心 > 数据湖探索 DLI > 产品介绍
REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

该场景下就需要使用REFRESH TABLE来解决该问题。REFRESH TABLE是用于重新整理某个分区的文件，重用之前的表元数据信息，能够检测到表的字段的增加或者减少，主要用于表中元数据未修改，表的数据修改的场景。语法格式 1 REFRESH TABLE [db_name.]table_name;

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

数据，非结构化的空间位置数据、三维建模数据；在大体量的地理大数据中，通过高效的挖掘工具或者挖掘方法实现价值提炼，是用户非常关注的话题。优势提供地理专业算子：支持全栈Spark能力，具备丰富的Spark空间数据分析算法算子，全面支持结构化的遥感影像数据、非结构化的三维建模、激光

 帮助中心 > 数据湖探索 DLI > 产品介绍
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

分组函数在流处理表中的 SQL 查询中，分组窗口函数的 time_attr 参数必须引用一个合法的时间属性，且该属性需要指定行的处理时间或事件时间。对于批处理的 SQL 查询，分组窗口函数的 time_attr 参数必须是一个 TIMESTAMP 类型的属性。表1 分组函数表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

方法创建的数据和read.format() 方法及read.jdbc() 方法查询的数据都为DataFrame对象，可以直接进行查询单条记录等操作（在“步骤4”中，提到将DataFrame数据注册为临时表）。 where where 方法中可传入包含and 和 or 的条件筛选表

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS

总条数： 808

上一页
1
...
7
8
9
...
41
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表索引设计规范 - 数据湖探索 DLI

权限策略和授权项 - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

自定义函数类型推导 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

DWS维表 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

查看表的用户权限（废弃） - 数据湖探索 DLI

如何获取项目ID？ - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线