搜索_华为云

离线Compaction配置 - 数据湖探索 DLI

离线Compaction配置对于MOR表的实时业务，通常设置在写入中同步生成compaction计划，因此需要额外通过DataArts或者脚本调度SparkSQL去执行已经产生的compaction计划。执行参数 set hoodie.compact.inline = true;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

提供地理专业算子：支持全栈Spark能力，具备丰富的Spark空间数据分析算法算子，全面支持结构化的遥感影像数据、非结构化的三维建模、激光点云等巨量数据的离线批处理，支持带有位置属性的动态流数据实时计算处理。 CEP SQL：提供地理位置分析函数对地理空间数据进行实时分析，用户仅需编写SQL便可

 帮助中心 > 数据湖探索 DLI > 产品介绍
Flink作业管理界面对用户进行授权时提示用户不存在怎么办？ - 数据湖探索 DLI

Flink作业管理界面对用户进行授权时提示用户不存在怎么办？问题现象在“作业管理 > Flink作业”，对应作业“操作”列，选择“更多 > 权限管理”，对新用户进行授权操作时提示“No such user. userName:xxxx.”错误。解决方案以上问题可能是由于系统未能识别新用户信息。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
资产识别与管理 - 数据湖探索 DLI

资产识别与管理 DLI 可以通过标签实现资源的标识与管理。使用场景通常您的业务系统可能使用了华为云的多种云服务，您可以为这些云服务下不同的资源实例分别设置标签，各服务的计费详单会体现这些资源实例设置的标签。如果您的业务系统是由多个不同的应用构成，为同一种应用拥有的资源实例设置

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
创建并提交SQL作业 - 数据湖探索 DLI

表1 配置SQL作业信息按键&下拉列描述执行引擎 SQL作业支持Spark和HetuEngine两种引擎： Spark引擎适用于离线分析。 HetuEngine引擎适用于交互式分析。队列下拉选择需要使用的队列。如果没有可用队列，此处显示“default”队列，def

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
安全 - 数据湖探索 DLI
安全 - 数据湖探索 DLI

安全责任共担资产识别与管理身份认证与访问控制数据保护技术审计与日志服务韧性监控安全风险故障恢复更新管理认证证书

 帮助中心 > 数据湖探索 DLI > 产品介绍
Flink作业性能调优 - 数据湖探索 DLI

WHEN flag IN ('android', 'iphone')THEN user_id ELSE NULL END) AS app_uv 可调整为 COUNT(DISTINCT user_id) FILTER(WHERE flag IN ('android', 'iphone'))

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
正则表达式函数 - 数据湖探索 DLI

正则表达式函数概述所有的正则表达式函数都使用Java样式的语法。但以下情况除外：使用多行模式（通过（？m）标志启用）时，只有\ n被识别为行终止符。此外，不支持（？d）标志，因此不能使用。大小写区分模式（通过（？i）标志启用）时，总是以unicode的模式去实现。同时，

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
RDS表有自增主键时怎样在DLI插入数据？ - 数据湖探索 DLI

RDS表有自增主键时怎样在DLI插入数据？在DLI中创建关联RDS表时，如果RDS表包含自增主键或其他自动填充字段，您在DLI中插入数据时可以采取以下措施：插入数据时省略自增字段：在DLI中插入数据时，对于自增主键字段或其他自动填充的字段，您可以在插入语句中省略这些字段。数据

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置DBeaver连接DLI进行数据查询和分析 DBeaver 是一个免费且开源的数据库管理工具，支持多种数据库，通过DBeaver这款可视化数据库管理工具可以查看数据库结构、执行SQL查询和脚本、浏览和导出数据等。本节操作介绍DBeaver连接DLI服务的操作步骤。操作前准备

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
查询批处理作业状态 - 数据湖探索 DLI

查询批处理作业状态功能介绍该API用于查询批处理作业的状态。调试您可以在API Explorer中调试该接口。 URI URI格式： GET /v2.0/{project_id}/batches/{batch_id}/state 参数说明表1 URI参数参数名称是否必选

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
SparkSQL建表参数规范 - 数据湖探索 DLI

SparkSQL建表参数规范规则建表必须指定primaryKey和preCombineField。 Hudi表提供了数据更新的能力和幂等写入的能力，该能力要求数据记录必须设置主键用来识别重复数据和更新操作。不指定主键会导致表丢失数据更新能力，不指定preCombineField会导致主键重复。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。 Spark离线完成Compaction计划的执行，以及Clean和Archive操作，详见Hudi数据表Compaction规范。 Flink作业写MO

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

共享和权限管理。 Serverless DLI DLI完全兼容Apache Spark、Apache Flink生态和接口，是集实时分析、离线分析、交互式分析为一体的Serverless大数据计算分析服务。线下应用可无缝平滑迁移上云，减少迁移工作量。采用批流融合高扩展性框架，为T

帮助中心 > 数据湖探索 DLI > 产品介绍
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

Top-N 功能描述 Top-N 查询是根据列排序找到N个最大或最小的值。最大值集和最小值集都被视为是一种 Top-N 的查询。如果在批处理或流处理的表中需要显示出满足条件的 N 个最底层记录或最顶层记录， Top-N 查询将会十分有用。语法格式 SELECT [column_list]

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

Top-N 功能描述 Top-N 查询是根据列排序找到N个最大或最小的值。最大值集和最小值集都被视为是一种 Top-N 的查询。若在批处理或流处理的表中需要显示出满足条件的 N 个最底层记录或最顶层记录， Top-N 查询将会十分有用。语法格式 SELECT [column_list]

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

Top-N 功能描述 Top-N 查询是根据列排序找到N个最大或最小的值。最大值集和最小值集都被视为是一种 Top-N 的查询。若在批处理或流处理的表中需要显示出满足条件的 N 个最底层记录或最顶层记录， Top-N 查询将会十分有用。语法格式 SELECT [column_list]

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
Bucket调优示例 - 数据湖探索 DLI

Bucket调优示例创建Bucket索引表调优 Hudi表初始化实时任务接入离线Compaction配置父主题： DLI Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
Hudi数据表Compaction规范 - 数据湖探索 DLI

= 'false' // 关闭Archive操作 Spark离线完成Compaction计划的执行，以及Clean和Archive操作在调度平台（可以使用华为的DataArts）运行一个定时调度的离线任务来让Spark完成Hudi表的Compaction计划执行以及Clean和Archive操作。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
欠费说明 - 数据湖探索 DLI
欠费说明 - 数据湖探索 DLI

欠费说明用户在使用DLI服务时，账户的可用额度小于待结算的账单，即被判定为账户欠费。欠费后，可能会影响云服务资源的正常运行，请及时充值。欠费原因已购买套餐包，但使用量超出套餐包额度，进而产生按需费用，同时账户中的余额不足以抵扣产生的按需费用。请参考已购买套餐包，为什么仍然产

 帮助中心 > 数据湖探索 DLI > 计费说明

总条数： 35

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

离线Compaction配置 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

Flink作业管理界面对用户进行授权时提示用户不存在怎么办？ - 数据湖探索 DLI

资产识别与管理 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

安全 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

正则表达式函数 - 数据湖探索 DLI

RDS表有自增主键时怎样在DLI插入数据？ - 数据湖探索 DLI

配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

查询批处理作业状态 - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

Bucket调优示例 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

欠费说明 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线