搜索_华为云

标示符 - 数据湖探索 DLI
标示符 - 数据湖探索 DLI

output_format_classname partition_col_name partition_col_value partition_specs property_name property_value regex_expression result_expression row_format

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Python程序也有依赖一些第三方库，尤其是基于PySpark的融合机器学习相关的大数据分析

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
查看表元数据 - 数据湖探索 DLI

元数据（Metadata）是用来定义数据类型的数据。主要是描述数据自身信息，包含源、大小、格式或其它数据特征。数据库字段中，元数据用于诠释数据仓库的内容。创建表时，会定义元数据，由列名、类型、列描述三列组成。 “元数据”页面将显示目标表的列名、列类型、类型和描述。查看元数据步骤查看元数据的入口有两个，分

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
套餐包计费 - 数据湖探索 DLI
套餐包计费 - 数据湖探索 DLI

DLI提供优惠的资源套餐包，购买套餐包后，资源按照套餐包类型计费。套餐包是用户预先购买的资源使用量配额，超出当前套餐包的额度，将自动转为按需收费。套餐包类型及适用场景表1 套餐包类型及适用场景类型说明适用场景重置规则扫描数据量套餐包按照用户每个作业的数据扫描量（单位为“GB”）收取计算费用。

帮助中心 > 数据湖探索 DLI > 计费说明
创建Bucket索引表调优 - 数据湖探索 DLI

数据量非常小的事实表这种可以在预估很长一段时间的数据增长量的前提下使用非分区表预留稍宽裕一些的桶数来提升读写性能。确认表内桶数 Hudi表的桶数设置，关系到表的性能，需要格外引起注意。以下几点，是设置桶数的关键信息，需要建表前确认。非分区表单表数据总条数 = select count(1)

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
CREATE TABLE语句 - 数据湖探索 DLI

Epoch 以来的经过的时间。返回的 watermark 只有当其不为空且其值大于之前发出的本地 watermark 时才会被发出（以保证 watermark 递增）。每条记录的 watermark 生成表达式计算都会由框架完成。框架会定期发出所生成的最大的 watermark

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义
ALTER TABLE - 数据湖探索 DLI
ALTER TABLE - 数据湖探索 DLI

STRICT，对列的修改，仅对表的元数据产生作用。列修改命令只能修改表/分区的元数据，而不会修改数据本身。用户应确保表/分区的实际数据布局符合元数据定义。不支持更改表的分区列/桶列，也不支持更改ORC表。修改表或分区的存储位置。 ALTER TABLE table_name

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
更新表分区信息（只支持OBS表） - 数据湖探索 DLI

partition_specs 分区字段。 obs_path OBS存储路径。注意事项该命令的主要应用场景是针对分区表，如当手动在OBS上面添加分区目录时，再通过上述命令将该新增的分区信息刷新到元数据库中，通过“SHOW PARTITIONS table_name”命令查看新增的分区。分

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
已购买套餐包，为什么仍然产生按需计费？ - 数据湖探索 DLI

的场景。弹性资源池CU时套餐包的额度按订购周期重置。存储量套餐包按照存储在DLI服务中的数据存储量（单位为“GB”）收取存储费用。适用于在DLI 存储表数据的场景，例如时延敏感类的业务将表存储在DLI，使用存储量套餐包可以节省存储费用。存储套餐的额度每个小时会重置。判断套餐包额度是否超出

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
使用DLI分析电商BI报表 - 数据湖探索 DLI

某电商商城在保持高速发展的同时，沉淀了数亿的忠实用户，积累了海量的真实数据。如何利用BI工具从历史数据中找出商机，是大数据应用在精准营销中的关键问题，也是所有电商平台在做智能化升级时所需要的核心技术。本案例以某商城真实的用户、商品、评论数据（脱敏后）为基础，利用数据湖探索来分析用户和商品的各种数

 帮助中心 > 数据湖探索 DLI > 最佳实践
在DLI控制台删除表 - 数据湖探索 DLI

在DLI控制台删除表根据实际使用情况，您可以通过删除表。注意事项具有正在运行中的作业的数据库或者表不能删除。管理员用户、表的所有者和具有删除表权限的用户可以删除表。数据表删除后，将不可恢复，请谨慎操作。删除表删除表的入口有两个，分别在“数据管理”和“SQL编辑器”页面。在“数据管理”页面删除表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
比较函数 - 数据湖探索 DLI
比较函数 - 数据湖探索 DLI

和分组操作中可以被重写的操作。对于流式查询，该操作在 join 和分组操作中被重写。根据输入行的数量计算查询结果所需的状态可能会无限增长。请提供具有有效保留间隔的查询配置，以防止状态过大。 value IN (sub-query) BOOLEAN 如果 value 等于子查询结果集中的一行则返回

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
删除分区 - 数据湖探索 DLI
删除分区 - 数据湖探索 DLI

本节操作介绍删除分区表的一个或多个分区。分区表分为两种，OBS表和DLI表。在删除分区时，DLI表和OBS表都支持利用指定条件删除分区表的一个或多个分区。OBS表还支持按指定筛选条件删除分区。注意事项所要删除分区的表必须是已经存在的表，否则会出错。所要删除的分区必须是已经存在的，否则会出错，可通过语句中添加“IF

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
查询作业列表 - 数据湖探索 DLI

查询作业列表功能介绍查询当前用户的作业列表，可以根据作业ID作为ID，查询大于ID或小于ID的限定条数的作业，默认查询全部状态的作业，也可以设定运行中或其他状态条件。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v1.0/{projec

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
固定精度型 - 数据湖探索 DLI
固定精度型 - 数据湖探索 DLI

固定精度型名称描述存储空间取值范围字面量 DECIMAL 固定精度的十进制数。精度最高支持到38位，但精度小于18位能保障性能最好。 Decimal有两个输入参数： precision：总位数，默认38 scale：小数部分的位数，默认0 说明：如果小数位为零，即十进制（38

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
Hudi表分区设计规范 - 数据湖探索 DLI

为各个分区的数据量是会有波动的，分区下桶的个数设计一般会按照最大分区数据量计算，这样会出现越细粒度的分区，桶的个数会冗余越多。例如：采用天级分区，平均的日增数据量是3GB，最多一天的日志是8GB，这个会采用Bucket桶数= 8GB/2GB = 4 来创建表；每天的更新数据占比

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
DLI弹性资源池与队列简介 - 数据湖探索 DLI

弹性资源池模式：计算资源的池化管理模式，提供计算资源的动态扩缩容能力，同一弹性资源池中的队列共享计算资源。通过合理设置队列的计算资源分配策略，可以提高计算资源利用率，应对业务高峰期的资源需求。适用场景：适合业务量有明显波动的场合，如周期性的数据批处理任务或实时数据处理需求。支持的队列类型：

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

使用ogg-json读取kafka中的ogg记录，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用CTS审计DLI服务 - 数据湖探索 DLI

使用CTS审计DLI服务通过云审计服务，您可以记录与DLI服务相关的操作事件，便于日后的查询、审计和回溯。表1 云审计服务支持的DLI操作列表操作名称资源类型事件名称创建数据库 database createDatabase 删除数据库 database deleteDatabase

帮助中心 > 数据湖探索 DLI > 用户指南
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

基准测试的度量单位是每小时执行的查询数( QphH@size)，其中“H”表示每小时系统执行复杂查询的平均次数，“size”表示数据库规模的大小，能够反映出系统在处理查询时的能力。TPC-H 是根据真实的生产运行环境来建模的,这使得它可以评估一些其他测试所不能评估的关键性能参数。总而言之，TPC组织颁布的TPC-H

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板

总条数： 712

上一页
1
...
29
30
31
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

标示符 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

查看表元数据 - 数据湖探索 DLI

套餐包计费 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

ALTER TABLE - 数据湖探索 DLI

更新表分区信息（只支持OBS表） - 数据湖探索 DLI

已购买套餐包，为什么仍然产生按需计费？ - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

在DLI控制台删除表 - 数据湖探索 DLI

比较函数 - 数据湖探索 DLI

删除分区 - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

固定精度型 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

使用CTS审计DLI服务 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线