搜索_华为云

窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

窗口去重功能描述窗口去重是一种特殊的去重，它根据指定的多个列来删除重复的行，保留每个窗口和分区键的第一个或最后一个数据。对于流式查询，与普通去重不同，窗口去重只在窗口的最后返回结果数据，不会产生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
DLI产品咨询类 - 数据湖探索 DLI

Flink有什么区别？ DLI中的Spark组件与MRS中的Spark组件有什么区别？怎样升级DLI作业的引擎版本 DLI的数据可存储在哪些地方 DLI是否支持导入其他租户共享OBS桶的数据？区域和可用区全局变量的使用中，一个子账号是否可以使用其他子账号创建的全局变量怎样获取DLI作业样例（Demo）

帮助中心 > 数据湖探索 DLI > 常见问题
rand - 数据湖探索 DLI
rand - 数据湖探索 DLI

rand函数用于返回大于或等于0且小于1的平均分布随机数。命令格式 rand(INT seed) 参数说明表1 参数说明参数是否必选参数类型说明 seed 否 INT类型。参数seed的格式包括浮点数格式、整数格式、字符串格式。如果指定种子seed，在相同运行环境下，将会得到一个稳定的随机数序列。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
DLI SDK与API的对应关系 - 数据湖探索 DLI

DLI SDK与API的对应关系 OBS授权表1 OBS授权相关API&SDK的对应关系表 Class Method Java Method Python Method API Authorize OBS授权 authorizeBucket - POST /v1.0/{proj

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
计费相关问题 - 数据湖探索 DLI

计费相关问题 DLI的计费模式有哪些？包年/包月计费模式的DLI资源可以和按需计费模式相互转换吗？数据湖队列什么情况下是空闲状态？怎样排查DLI计费异常？已购买套餐包，为什么仍然产生按需计费？怎样查看套餐包资源的使用情况？怎样查看DLI的数据扫描量？按需计费的弹性资源池，如果没提交作业运行就不计费？

帮助中心 > 数据湖探索 DLI > 计费说明
标示符 - 数据湖探索 DLI
标示符 - 数据湖探索 DLI

output_format_classname partition_col_name partition_col_value partition_specs property_name property_value regex_expression result_expression row_format

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Spark作业开发类 - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK 如何查看DLI Spark作业的实际资源使用情况将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？如何在DLI中运行复杂PySpark程序？如何通过JDBC设置spark.sql

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
RENAME COLUMN - 数据湖探索 DLI
RENAME COLUMN - 数据湖探索 DLI

表示嵌套列全路径，嵌套列具体规则见ADD COLUMNS。修改列名后自动同步到列comment中，comment的形式为：rename oldName to newName。系统响应通过运行DESCRIBE命令查看表列修改。父主题： Schema演进语法说明

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Schema演进语法说明
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？问题现象 DLI分区内表导入了CSV文件数据，导入的文件数据没有包含对应分区列的字段数据。分区表查询时需要指定分区字段，导致查询不到表数据。问题根因 DLI分区内表在导入数据时，如果文件数据没

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
创建增强型跨源连接 - 数据湖探索 DLI

数据源所使用的虚拟私有云。子网数据源所使用的子网。路由表显示子网实际绑定的路由表。说明：此处的路由表为目的数据源子网关联的路由表，不同于“路由信息”中的路由。“路由信息”中的路由为所绑定的队列下子网关联的路由表中的路由。目的数据源子网与队列所在子网为不同的子网，否则会造成网段冲突。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库问题描述 Spark3.x的作业日志中提示找不到global_temp数据库。根因分析 global_temp数据库是Spark3.x默认内置的数据库，是Spark的全局临时视图。通常在Spark作业执

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
更新表分区信息（只支持OBS表） - 数据湖探索 DLI

partition_specs 分区字段。 obs_path OBS存储路径。注意事项该命令的主要应用场景是针对分区表，如当手动在OBS上面添加分区目录时，再通过上述命令将该新增的分区信息刷新到元数据库中，通过“SHOW PARTITIONS table_name”命令查看新增的分区。分

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
DELETE - 数据湖探索 DLI
DELETE - 数据湖探索 DLI

boolExpression] 参数描述表1 DELETE参数参数描述 tableIdentifier 在其中执行删除操作的Hudi表的名称。 boolExpression 删除项的过滤条件示例示例1： delete from h0 where column1 = 'country'; 示例2：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
导出SQL作业结果 - 数据湖探索 DLI

那么导出的作业结果的路径为obs://bucket/src1/test.csv 导出方式是随导出创建指定路径：该方式导出作业结果时，会创建一个新的文件夹路径，并将作业结果保存在这个路径中。适用于当您希望在新的路径下保存本次的导出结果的场景，方便作业结果的管理的回溯。选择

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

该字段对应的值作为redis的hash数据类型的value。而当使用map时，会将flink中该字段值的key作为redis的hash数据类型的field，该字段值的value作为redis hash数据类型的value。其具体示例如下：对于fields：创建的Flink作业运行脚本如下：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
DLI Hudi元数据 - 数据湖探索 DLI
DLI Hudi元数据 - 数据湖探索 DLI

Lakeformation元数据可在湖仓构建Lakeformation服务的管理控制台中查看。相关操作 DLI SQL队列对接DLI元数据方法：在DLI管理控制台的SQL编辑器页面的“数据目录”中选择“dli”。在“数据库”选项中选择要对接的DLI元数据中的数据库，即可对接到DLI元数据。 DLI通用队列对接DLI元数据方法：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
身份认证与访问控制 - 数据湖探索 DLI

Management，简称IAM）进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能，可以帮助您安全的控制华为云资源的访问。关于IAM的详细介绍，请参见IAM产品介绍。权限根据授权精细程度分为角色和策略。角色：IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。该机

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
配置DLI读写外部数据源数据的操作流程 - 数据湖探索 DLI

配置DLI读写外部数据源数据的操作流程 DLI执行作业需要读写外部数据源时需要具备两个条件：打通DLI和外部数据源之间的网络，确保DLI队列与数据源的网络连通。妥善保存数据源的访问凭证确保数据源认证的安全性，便于DLI安全访问数据源。本节操作介绍配置DLI读写外部数据源数据操作流程。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
更新SQL作业 - 数据湖探索 DLI
更新SQL作业 - 数据湖探索 DLI

当“checkpoint_enabled”为“true”时，该参数是用户授权保存快照的OBS桶名称。当“log_enabled” 为“true”时，该参数是用户授权保存作业日志的OBS桶名称。 log_enabled 否 Boolean 是否开启作业的日志上传到用户的OBS功能。默认为“false”。 smn_topic

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API

总条数： 499

上一页
1
...
20
21
22
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

窗口去重 - 数据湖探索 DLI

DLI产品咨询类 - 数据湖探索 DLI

rand - 数据湖探索 DLI

DLI SDK与API的对应关系 - 数据湖探索 DLI

计费相关问题 - 数据湖探索 DLI

标示符 - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

RENAME COLUMN - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

更新表分区信息（只支持OBS表） - 数据湖探索 DLI

DELETE - 数据湖探索 DLI

导出SQL作业结果 - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

DLI Hudi元数据 - 数据湖探索 DLI

身份认证与访问控制 - 数据湖探索 DLI

配置DLI读写外部数据源数据的操作流程 - 数据湖探索 DLI

更新SQL作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线