搜索_华为云

为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

overwrite覆盖分区表数据的时候，覆盖了全量数据？当您使用insert overwrite语句覆盖分区表的数据时，如果发现它覆盖了全量数据而不是预期的分区数据，这可能是因为动态分区覆盖功能没有被启用。如果需要动态覆盖DataSource表指定的分区数据，您需要先配置参数 dli

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
bround - 数据湖探索 DLI
bround - 数据湖探索 DLI

式。代表需要被四舍五入的值。该命令与传统四舍五入方式的区别在于，对数字5进行操作时，由前一位数字来决定，前一位数字为奇数，增加一位，前一位数字为偶数，舍弃一位。参数a非DOUBLE类型时，会隐式转换为DOUBLE类型后参与运算。 d 否 DOUBLE、BIGINT、DECIMAL、STRING类型。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
清理多版本数据 - 数据湖探索 DLI

overwrite或者truncate语句时触发，所以当表的多版本数据在保留周期时间外但是后续该表不会再执行insert overwrite或者truncate语句时，多版本保留周期外的数据不会自动清理。可以通过本章节介绍的SQL命令手动进行多版本数据清理。语法格式清理多版本保留周期外数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

时，指定字符串文字以替换空键。支持的Connector Kafka 示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
DLI SDK与API的对应关系 - 数据湖探索 DLI

DLI SDK与API的对应关系 OBS授权表1 OBS授权相关API&SDK的对应关系表 Class Method Java Method Python Method API Authorize OBS授权 authorizeBucket - POST /v1.0/{proj

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

该场景下就需要使用REFRESH TABLE来解决该问题。REFRESH TABLE是用于重新整理某个分区的文件，重用之前的表元数据信息，能够检测到表的字段的增加或者减少，主要用于表中元数据未修改，表的数据修改的场景。语法格式 1 REFRESH TABLE [db_name.]table_name;

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
将OBS数据导入至DLI - 数据湖探索 DLI

有两种方式可查看导入的数据。目前预览只显示导入的前十条数据。在“数据管理”>“库表管理”页面，单击数据库名，在表管理界面对应表的“操作”栏选择“更多”中的“表属性”，在弹框的“预览”页签中，可查看导入的数据在“SQL编辑器”的“数据库”页签中，单击数据库名称，进入对应的表列表，鼠标

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

REPLACE，或者替换所有作业中的函数F1为F2。需要重启Spark SQL队列后新创建的自定义函数F2生效需要重启Spark SQL队列，影响当前运行的作业。重启队列后，影响F1原有功能，F1的功能变为和F2一样。场景二在原有程序包类的基础上新增了类，新创建的函数指定为新增的类，包名不变。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
删除数据库（废弃） - 数据湖探索 DLI

删除数据库（废弃）功能介绍该API用于删除空数据库，默认方式下，若待删除的数据库中存在表，则需先删除其中的所有表。删除表API请参见删除表（废弃）。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： DELETE /v1

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 数据库相关API（废弃）
建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

增强型跨源 ”。选择账号A共享的增强型跨源连接，单击操作列下的“更多 > 绑定弹性资源池”。选择已创建的弹性资源池，单击“确定”完成资源的绑定。若无可选弹性资源池，可参考创建弹性资源池并添加队列创建新的弹性资源池。账号B测试弹性资源池与VPC中资源的网络连通性。若共享VPC下

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
使用DLI分析电商BI报表 - 数据湖探索 DLI

某电商商城在保持高速发展的同时，沉淀了数亿的忠实用户，积累了海量的真实数据。如何利用BI工具从历史数据中找出商机，是大数据应用在精准营销中的关键问题，也是所有电商平台在做智能化升级时所需要的核心技术。本案例以某商城真实的用户、商品、评论数据（脱敏后）为基础，利用数据湖探索来分析用户和商品的各种数

 帮助中心 > 数据湖探索 DLI > 最佳实践
怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

Flink作业”，在作业列表中选择待操作的Flink OpenSource SQL作业。单击操作列的“编辑”，进入作业编辑页面。在右侧的“运行参数”配置区域，选择新的Flink版本。使用Flink 1.15以上版本的引擎执行作业时，需要在自定义配置中配置委托信息，其中key为"flink.dli.job.agency

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
DLI作业开发流程 - 数据湖探索 DLI

如果业务需求需要实时访问和处理来自不同数据源的数据，跨源访问可以减少数据的复制和延迟。跨源访问的必要条件包括“DLI与数据源网络连通”、“DLI可获取数据源的访问凭证”： DLI与数据源网络连通：您可以参考配置DLI与数据源网络连通（增强型跨源连接）配置DLI与数据源的网络连通。管理数据源的凭证：您可以

 帮助中心 > 数据湖探索 DLI > 用户指南
回收权限 - 数据湖探索 DLI
回收权限 - 数据湖探索 DLI

urce中的已授权限，否则会回收失败。Privilege支持的权限类型可参见数据权限列表。 resource可以是queue、database、table、view、column，格式分别为： queue的格式为：queues.queue_name database的格式为：databases

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据权限相关
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

请求费用：用户访问OBS中存储的静态网站文件时产生的请求费用。流量费用：用户使用自定义域名通过公网访问OBS时产生的流量费用。实际产生的费用与存储的文件大小、用户访问所产生的请求次数和流量大小有关，请根据自己的业务进行预估。 DLI 在创建SQL作业前需购买队列，使用DLI的队列资源时，按照队列CU时进行计费。

帮助中心 > 数据湖探索 DLI > 最佳实践
转换函数 - 数据湖探索 DLI
转换函数 - 数据湖探索 DLI

cast转换函数 HetuEngine会将数字和字符值隐式转换成正确的类型。HetuEngine不会把字符和数字类型相互转换。例如，一个查询期望得到一个varchar类型的值，HetuEngine不会自动将bigint类型的值转换为varchar类型。如果有必要，可以将值显式转换为指定类型。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
OVER - 数据湖探索 DLI
OVER - 数据湖探索 DLI

FOLLOWING：定义窗口的上限，即窗口从当前行向后数num行处结束。 UNBOUNDED FOLLOWING：表示窗口没有上限。 ROWS BETWEEN…和RANGE BETWEEN…的区别： ROW为物理窗口，即根据ORDER BY子句排序后，取前N行及后N行的数据计算（与当前行的值无关，只与排序后的行号相关）。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
跨源认证概述 - 数据湖探索 DLI

Password类型的跨源认证：适用于DWS、RDS、DDS、DCS数据源，配置时将数据源的密码信息存储到DLI。详细操作请参考创建Password类型跨源认证。支持跨源认证的数据源与作业类型不同类型的作业支持跨源认证的数据源与认证方式不同。 Spark SQL支持跨源认证的数据源与约束限制请参考表2。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
修改弹性资源池的主机信息 - 数据湖探索 DLI

修改弹性资源池的主机信息操作场景主机信息用于配置主机的IP与域名的映射关系，在作业配置时只需使用配置的域名即可访问对应的主机。在跨源连接创建完成后，支持修改主机信息。常见的访问MRS的HBase集群时需要配置实例的主机名（即域名）与主机对应的IP地址。约束限制已获取MR

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

在下拉列表中选择要使用的队列。选择Spark版本。在下拉列表中选择支持的Spark版本，推荐使用最新版本。不建议长期混用不同版本的Spark/Flink引擎。长期混用不同版本的Spark/Flink引擎会导致代码在新旧版本之间不兼容，影响作业的执行效率。当作业依赖于特定版本的库或组件，

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业

总条数： 966

上一页
1
2
3
4
5
...
49
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

bround - 数据湖探索 DLI

清理多版本数据 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

DLI SDK与API的对应关系 - 数据湖探索 DLI

REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

将OBS数据导入至DLI - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

删除数据库（废弃） - 数据湖探索 DLI

建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

回收权限 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

转换函数 - 数据湖探索 DLI

OVER - 数据湖探索 DLI

跨源认证概述 - 数据湖探索 DLI

修改弹性资源池的主机信息 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线