搜索_华为云

Hudi数据表Clean规范 - 数据湖探索 DLI

具体可以按照下面的计算公式来保留2个小时的历史版本数据：版本数设置为3600*2/版本interval时间，版本interval时间来自于flink作业的checkpoint周期，或者上游批量写入的周期。 COW表如果业务没有历史版本数据保留的特殊要求，保留版本数设置为1。 COW表的每个版本都是表的全量数据

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Spark SQL常用配置项说明 - 数据湖探索 DLI

并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full GC。在这种情况下，可以

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
查看队列的基本信息 - 数据湖探索 DLI

在列表页面上方的搜索区域，您可以名称和标签筛选需要的队列资源。单击查看队列的详细信息。关于队列引擎相关字段的含义：执行引擎：负责执行队列中任务的引擎类型。默认版本：执行引擎的默认配置版本，或者是在没有指定特定版本时系统将使用的版本。支持版本：执行引擎支持的所有版本列表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
权限管理 - 数据湖探索 DLI
权限管理 - 数据湖探索 DLI

制他们对华为云资源的访问范围。例如您的员工中有负责软件开发的人员，您希望他们拥有DLI的使用权限，但是不希望他们拥有删除DLI等高危操作的权限，那么您可以使用IAM为开发人员创建用户，通过授予仅能使用DLI，但是不允许删除DLI的权限策略，控制他们对DLI资源的使用范围。如果账

 帮助中心 > 数据湖探索 DLI > 产品介绍
JSON Format - 数据湖探索 DLI
JSON Format - 数据湖探索 DLI

Map 中的空 key 值。示例该示例是从kafka的一个topic中读取数据，并使用kafka sink将数据写入到kafka的另一个topic中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组入向规则，使其对当前将要使用的队列放开

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
DLI经典型跨源连接下线（EOL）公告 - 数据湖探索 DLI

该功能的作业有哪些影响？如果您正在使用DLI经典型跨源连接的功能，请尽快更换使用增强型跨源连接。否则使用经典型跨源连接操作过程中出现的错误，不再提供该功能的任何技术服务支持。 DLI经典型跨源连接停止服务后，可以使用哪个功能替换？推荐使用增强型跨源连接。 DLI提供的增强型

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

队列，队列关联到具体的作业和数据处理任务，是资源池中资源被实际使用和分配的基本单元，即队列是执行作业所需的具体的计算资源。同一弹性资源池中，队列之间的计算资源支持共享。通过合理设置队列的计算资源分配策略，可以提高计算资源利用率。发布区域：以用户指南中的说明为准 DLI对接LakeFormation

帮助中心 > 数据湖探索 DLI > 功能总览
典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

操作场景公网数据源指的是可以通过互联网访问的数据源。这些数据源资源有一个公网IP地址，配置DLI与公网网络联通可以实现对这些数据源的访问。本节提供了详细的操作指导，介绍如何通过设置SNAT规则和配置路由信息，实现DLI服务与公网的网络连接。操作流程图1 配置DLI队列访问公网流程

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
LIMIT | FETCH FIRST - 数据湖探索 DLI

TIES控制结果集中包含哪些行。如果指定了ONLY参数，则结果集将限制为包含参数数量的前若干行。如果指定了WITH TIES参数，则要求必须带ORDER BY子句。其结果集中包含符合条件的前若干行基本结果集以及额外的行。这些额外的返回行与基本结果集中最后一行的ORDER BY的参数一样： CREATE

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
常用操作与系统权限关系 - 数据湖探索 DLI

SHOW_USERS 显示所有角色和用户的绑定关系 √ × √ √ GRANT_PRIVILEGE 数据库的赋权 √ × √ √ REVOKE_PRIVILEGE 数据库权限的回收 √ × √ √ SHOW_PRIVILEGES 查看其他用户具备的数据库权限 √ × √ √ DISPLAY_ALL_TABLES

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
CSS安全集群配置 - 数据湖探索 DLI

此处设置keystore.jks文件的位置以及进入这个文件的密钥。在准备工作中生成的keystore.jks文件需要先放到OBS桶中，然后填入ak和sk以及jks文件的具体位置。最后在“es.net.ssl.keystore.pass”填入进入文件的密钥。 .option("es.net

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
DLI作业开发流程 - 数据湖探索 DLI

您还可以通过自定义镜像增强DLI的计算环境，通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，可以改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相关的Python

帮助中心 > 数据湖探索 DLI > 用户指南
入门实践 - 数据湖探索 DLI
入门实践 - 数据湖探索 DLI

入门实践我们整理了从队列网络连通、不同类型的作业分析、数据迁移场景的常用开发指南和最佳实践内容，帮助您更好的使用DLI进行大数据分析和处理。表1 DLI常用开发指南与最佳实践场景操作指导描述 Spark SQL作业开发使用Spark SQL作业分析OBS数据介绍使用Spark

帮助中心 > 数据湖探索 DLI > 快速入门
使用DLI分析账单消费数据 - 数据湖探索 DLI

几乎是在持续使用的，建议通过购买包周期队列来降低使用成本。另外，对于明确需要使用多少CU时的作业，也可以提前购买对应的CU时套餐包，来降低使用成本。企业中的业务模式较多且经常变化，成本管理员通常并不能全面及时了解花销较大的业务在哪里，哪些是合理的，哪些是不合理的，通过在DLI中

 帮助中心 > 数据湖探索 DLI > 最佳实践
查询经典型跨源连接列表 - 数据湖探索 DLI

String 连接ID，用于标识跨源连接的UUID。 destination 否 String 创建连接时，用户填写的队列的访问地址。 state 否 String 连接状态，具体状态请参见表4。 process 否 Double 正在创建的跨源连接进度，显示0.0至1.0代表0%至100%。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 经典型跨源连接相关API（废弃）
数学运算函数 - 数据湖探索 DLI

所有数字类型返回A的自然对数（基数e）。 LOG10(A) 所有数字类型返回A的基数10对数。 LOG2(A) 所有数字类型返回A的基数2对数。 LOG(B) LOG(A, B) 所有数字类型当只有一个参数，返回B的自然对数（基数e）。当有两个参数，返回B以A为基数的对数。 B必须大于0，且A必须大于1。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
查询经典型跨源连接 - 数据湖探索 DLI

String 连接ID，用于标识跨源连接的UUID。 destination 否 String 创建连接时，用户填写的队列的访问地址。 state 否 String 连接状态，具体状态请参见表4。 process 否 Double 正在创建的跨源连接进度，显示0.0至1.0代表0%至100%。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 经典型跨源连接相关API（废弃）
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？什么是数据倾斜？数据倾斜是在SQL作业执行中常见的问题，当数据分布不均匀的情况下，一部分计算节点处理的数据量远大于其他节点，从而影响整个计算过程的处理效率。例如观察到SQL执行时间较长，进入SparkUI查看对应SQL的执行状态，如图1所示，查看到一个stage运行时间超过

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
在Spark SQL作业中使用UDF - 数据湖探索 DLI

上传Jar包到OBS OBS控制台将生成的UDF函数Jar包文件上传到OBS目录下。 5 创建DLI的UDF函数 DLI控制台在DLI控制台的SQL作业管理界面创建使用的UDF函数。 6 验证和使用DLI的UDF函数 DLI控制台在DLI作业中使用创建的UDF函数。操作步骤新建Ma

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
创建Bucket索引表调优 - 数据湖探索 DLI

方法三：数据老化，按照业务逻辑分析大的维度表是否可以通过数据老化清理无效的维度数据从而降低数据规模。数据量非常小的事实表这种可以在预估很长一段时间的数据增长量的前提下使用非分区表预留稍宽裕一些的桶数来提升读写性能。确认表内桶数 Hudi表的桶数设置，关系到表的性能，需要格外引起注意。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例

总条数： 274

上一页
1
2
3
4
5
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi数据表Clean规范 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

查看队列的基本信息 - 数据湖探索 DLI

权限管理 - 数据湖探索 DLI

JSON Format - 数据湖探索 DLI

DLI经典型跨源连接下线（EOL）公告 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

LIMIT | FETCH FIRST - 数据湖探索 DLI

常用操作与系统权限关系 - 数据湖探索 DLI

CSS安全集群配置 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

入门实践 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

查询经典型跨源连接列表 - 数据湖探索 DLI

数学运算函数 - 数据湖探索 DLI

查询经典型跨源连接 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线