搜索_华为云

Hudi Clustering操作说明 - 数据湖探索 DLI

根据特定条件对符合Clustering条件的文件进行分组。每个组的数据大小应为targetFileSize的倍数。分组是计划中定义的"策略"的一部分。此外还有一个选项可以限制组大小，以改善并行性并避免混排大量数据。将Clustering计划以avro元数据格式保存到时间线。执行Clustering：使用执行策略处理计划以创建新文件并替换旧文件。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

地区与终端节点，即云服务在不同Region有不同的访问域名。获取EndPoint DLI所在的项目ID 项目编号，用于资源隔离。获取项目ID DLI区域信息 DLI所属区域信息地区和终端节点步骤1：配置YongHong BI新建DLI数据连接启动YongHong BI。在YongHong BI界面的单击“添加数据源”。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
DLI使用SMN主题，提示SMN主题不存在，怎么处理？ - 数据湖探索 DLI

份认证服务（IAM），选择对应子账户所在的用户组，确保该用户组已添加相应Region的SMN策略。确认主题名称和区域。确保您在DLI中配置的SMN主题名称和区域与实际创建的SMN主题一致。如果SMN主题名称不一致也会导致系统提示SMN主题不存在。父主题： Flink作业咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

Flink作业”，在作业列表中选择待操作的Flink OpenSource SQL作业。单击操作列的“编辑”，进入作业编辑页面。在右侧的“运行参数”配置区域，选择新的Flink版本。使用Flink 1.15以上版本的引擎执行作业时，需要在自定义配置中配置委托信息，其中key为"flink.dli

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Spark SQL常用配置项说明 - 数据湖探索 DLI

默认值描述 spark.sql.files.maxRecordsPerFile 0 要写入单个文件的最大记录数。如果该值为零或为负，则没有限制。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。 spark.sql.dyn

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
产品规格 - 数据湖探索 DLI
产品规格 - 数据湖探索 DLI

DLI提供的弹性资源池规格如表1所示。表1 弹性资源池规格类型规格约束限制适用场景基础版 16-64CUs规格不支持高可靠与高可用。不支持设置队列属性和作业优先级。不支持对接Notebook实例。其他弹性资源池使用相关约束限制请参考弹性资源池使用约束限制。适用于对资源消耗不高、对资源高可靠性和高可用性要求不高的测试场景。

帮助中心 > 数据湖探索 DLI > 产品介绍
更新模板 - 数据湖探索 DLI
更新模板 - 数据湖探索 DLI

否 String 模板名称。长度限制：0-57个字符。 desc 否 String 模板描述。长度限制：0-512个字符。 sql_body 否 String Stream SQL语句，至少包含source，query，sink三个部分。长度限制：0-1024*1024个字符。响应消息

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业模板相关API
增强型跨源连接概述 - 数据湖探索 DLI

信息，为您解决数据安全、密钥安全、密钥管理复杂等问题。具体操作请参考使用DEW管理数据源访问凭证。约束和限制表1 增强型跨源连接约束限制限制项说明适用场景约束限制在同一队列中，如果同时使用了经典型跨源连接和增强型跨源连接，则经典型跨源连接优先于增强型跨源连接。推荐使用增强型跨源连接。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
DIS结果表 - 数据湖探索 DLI
DIS结果表 - 数据湖探索 DLI

connector.type 是数据源类型，“dis”表示数据源为数据接入服务，必须为dis。 connector.region 是数据所在的DIS区域。 connector.ak 否访问密钥ID(Access Key ID)，需与sk同时设置 connector.sk 否 Secret

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
rank - 数据湖探索 DLI
rank - 数据湖探索 DLI

rank rank函数用于计算一个值在一组值中的排位。如果出现并列的情况，RANK函数会在排名序列中留出空位。使用限制窗口函数的使用限制如下：窗口函数只能出现在select语句中。窗口函数中不能嵌套使用窗口函数和聚合函数。窗口函数不能和同级别的聚合函数一起使用。命令格式

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
row - 数据湖探索 DLI
row - 数据湖探索 DLI

row_number row_number函数用于计算行号。从1开始递增。使用限制窗口函数的使用限制如下：窗口函数只能出现在select语句中。窗口函数中不能嵌套使用窗口函数和聚合函数。窗口函数不能和同级别的聚合函数一起使用。命令格式 row_number() ove

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
cume - 数据湖探索 DLI
cume - 数据湖探索 DLI

cume_dist cume_dist函数用于求累计分布，相当于求分区中大于等于或小于等于当前行的数据在分区中的占比。使用限制窗口函数的使用限制如下：窗口函数只能出现在select语句中。窗口函数中不能嵌套使用窗口函数和聚合函数。窗口函数不能和同级别的聚合函数一起使用。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
number - 数据湖探索 DLI
number - 数据湖探索 DLI

number 格式无。说明 LIMIT限制输出的行数，只支持INT类型。父主题：标示符

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

在JupyterLab中编写和调试代码。进入JupyterLab主页后，可在“Notebook”区域下编辑和调试代码。步骤8：使用Notebook实例编写和调试代码。约束限制使用Notebook实例提交DLI作业必须使用弹性资源池下的通用队列。每一个弹性资源池关联唯一的Notebook实例。

帮助中心 > 数据湖探索 DLI > 用户指南
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

在“购买弹性资源池”界面，填写具体的弹性资源池参数。本例在华东-上海二区域购买按需计费的弹性资源池。相关参数说明如表3所示。表3 参数说明参数名称参数说明配置样例计费模式选择弹性资源池计费模式。按需计费区域选择弹性资源池所在区域。华东-上海二项目每个区域默认对应一个项目，由系统预置。系统默认项目

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

Executor CPU核数 0-16 0-4 Executor个数无限制无限制 driver CPU核数 0-16 0-4 driver内存 450MB-64GB 450MB-16GB 作业CU配额无限制无限制完成作业的参数配置后，单击Spark作业编辑页面右上方“执行”，提交作业。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
窗口关联 - 数据湖探索 DLI
窗口关联 - 数据湖探索 DLI

和相同滚动窗口的数据会被关联在一起。这里给出一个基于 TUMBLE Window TVF 的窗口连接的例子。在下面的例子中，通过将 join 的时间区域限定为固定的 5 分钟，数据集被分成两个不同的时间窗口：[12:00,12:05) 和 [12:05,12:10)。L2 和 R2 不能 join

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
权限管理 - 数据湖探索 DLI
权限管理 - 数据湖探索 DLI

DLI部署时通过物理区域划分，为项目级服务。授权时，“作用范围”需要选择“区域级项目”，然后在指定区域对应的项目中设置相关权限，并且该权限仅对此项目生效；如果在“所有项目”中设置权限，则该权限在所有区域项目中都生效。访问DLI时，需要先切换至授权区域。权限类别：根据授权精程度分为角色和策略。

帮助中心 > 数据湖探索 DLI > 产品介绍
DLI产品咨询类 - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？怎样升级DLI作业的引擎版本 DLI的数据可存储在哪些地方 DLI是否支持导入其他租户共享OBS桶的数据？区域和可用区全局变量的使用中，一个子账号是否可以使用其他子账号创建的全局变量怎样获取DLI作业样例（Demo） DLI是否存在Apache

帮助中心 > 数据湖探索 DLI > 常见问题
使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

用户自定义的依赖文件。其他依赖文件需要自行在代码中引用。在选择依赖文件之前需要将对应的文件上传至OBS桶中，并在“数据管理>程序包管理”中创建程序包，包类型没有限制。具体操作请参考创建程序包。通过在应用程序中添加以下内容可访问对应的依赖文件。其中，“fileName”为需要访问的文件名，“ClassName”为需要访问该文件的类名。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南

总条数： 276

上一页
1
...
4
5
6
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi Clustering操作说明 - 数据湖探索 DLI

配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

DLI使用SMN主题，提示SMN主题不存在，怎么处理？ - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

产品规格 - 数据湖探索 DLI

更新模板 - 数据湖探索 DLI

增强型跨源连接概述 - 数据湖探索 DLI

DIS结果表 - 数据湖探索 DLI

rank - 数据湖探索 DLI

row - 数据湖探索 DLI

cume - 数据湖探索 DLI

number - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

窗口关联 - 数据湖探索 DLI

权限管理 - 数据湖探索 DLI

DLI产品咨询类 - 数据湖探索 DLI

使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线