搜索_华为云

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

是否写入脏数据：如果需要将作业执行过程中处理失败的数据、或者被清洗过滤掉的数据写入OBS中，以便后面查看，可通过该参数配置，写入脏数据前需要先配置好OBS连接。这里保持默认值“否”即可，不记录脏数据。单击“保存并运行”，回到作业管理界面，在作业管理界面可查看作业执行进度和结果。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Hudi数据表Clean规范 - 数据湖探索 DLI

的话近几个小时之内的增量数据可以通过log文件读出，如果保留时长过短，下游flink作业在重启或者异常中断阻塞的情况下，上游增量数据已经Clean掉了，flink需要从parquet文件读增量数据，性能会有下降；如果保留时间过长，会导致log里面的历史数据冗余存储。具体可以按照

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

统将创建DLI临时数据桶。该桶用于存储使用DLI服务产生的临时数据，例如：作业日志、作业结果等。如果不创建该桶，将无法查看作业日志。可以通过配置生命周期规则实现定时删除OBS桶中的对象或者定时转换对象的存储类别。桶名称为系统默认。如果不需要创建DLI临时数据桶，并且希望不再收到

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
最佳实践内容概览 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据使用DLI进行车联网场景驾驶行为数据分析。使用DLI将CSV数据转换为Parquet数据使用DLI将CSV数据转换为Parquet数据的方法。使用DLI分析电商BI报表以某商城真实的用户、商品、评论数据（脱敏后）为基础，介绍使用DLI进行电商BI报表分析的方法。

帮助中心 > 数据湖探索 DLI > 最佳实践
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

class_name [USING resource,...] resource: : JAR file_uri 注意事项如果在数据库中存在同名的函数，系统将会报错。只支持Hive语法创建函数。请注意避免该场景：如果创建的自定义函数F1指定类C1，程序包名JAR1，

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
使用HetuEngine on Hudi - 数据湖探索 DLI

HetuEngine是高性能的交互式SQL分析及数据虚拟化引擎，它与大数据生态无缝融合，实现海量数据秒级交互式查询，并支持跨源跨域统一访问，使能数据湖内、湖间、湖仓一站式SQL融合分析。 HetuEngine对Hudi仅支持select操作，即支持SELECT语法来查询Hudi表中的数据。 HetuEngine暂不支持查询Hudi的增量视图。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
资产识别与管理 - 数据湖探索 DLI

签将很容易帮助您对不同的应用进行使用量分析和成本核算。对DLI来说，标签用于标识购买的队列和创建数据库，对购买的DLI队列和数据库进行分类。为队列或数据库添加标签时，该队列或数据库上所有请求产生的计费话单里都会带上这些标签，您可以针对话单报表做分类筛选，进行更详细的成本分析。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
DLI常用跨源分析开发方式 - 数据湖探索 DLI

HBase 创建HBase关联表插入数据查询数据 scala样例代码 pyspark样例代码 java样例代码 Hbase源表 Hbase结果表 Hbase维表 - CloudTable OpenTSDB 创建OpenTSDB关联表插入数据查询数据 scala样例代码 pyspark样例代码

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
DWS Connector概述 - 数据湖探索 DLI

DWS Connector概述数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DLI将Flink作业从数据仓库服务（DWS）中读取数据。DWS数据库内核兼容PostgreSQL

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
导出DLI表数据至OBS中 - 数据湖探索 DLI

支持跨账号导出数据，即，如果B账户对A账户授权后，A账户拥有B账户OBS桶的元数据信息和权限信息的读取权限，以及路径的读写权限，则A账户可将数据导出至B账户的OBS路径中。导出数据步骤导出数据的入口有两个，分别在“数据管理”和“SQL编辑器”页面。在“数据管理”页面导出数据。在管

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
FROM - 数据湖探索 DLI
FROM - 数据湖探索 DLI

DISTINCT：从结果集移除重复的行。注意事项所要查询的表必须是已经存在的表，否则会出错。 FROM嵌套子查询中，子查询必须要取别名，且别名的命名要早于别名的使用，否则会出错。建议别名不要重名。 FROM后所跟的子查询结果必须带上前面所取的别名，否则会出错。示例返回选了

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
为什么已有View视图的select权限，但是查询不了View？ - 数据湖探索 DLI

为什么已有View视图的select权限，但是查询不了View？问题描述用户A创建了表Table1。用户B基于Table1创建了视图View1。赋予用户C Table1的查询表权限后，用户C查询View失败。根因分析用户C查询View失败的原因是由于用户B不具备Table1的查询表权限。解决措施

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI权限管理类
从Kafka读取数据写入到RDS - 数据湖探索 DLI

登录RDS控制台，单击RDS数据库实例，单击创建的数据库名，如“testrdsdb”，在创建的表“clicktop”所在行的“操作”列，单击“SQL查询”，输入以下查询语句。 select * from `clicktop`; 在“SQL查询”界面，单击“执行SQL”，查看RDS表数据已写入成功。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
从Kafka读取数据写入到DWS - 数据湖探索 DLI

从Kafka读取数据写入到DWS 本指导仅适用于Flink 1.12版本。场景描述该场景为对汽车驾驶的实时数据信息进行分析，将满足特定条件的数据结果进行汇总。汽车驾驶的实时数据信息为数据源发送到Kafka中，再将Kafka数据的分析结果输出到DWS中。例如，输入如下样例数据： {"car_id":"3027"

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

Hive源表简介 Apache Hive 已经成为了数据仓库生态系统中的核心。它不仅仅是一个用于大数据分析和ETL场景的SQL引擎，同样它也是一个数据管理平台，可用于发现，定义，和演化数据。 Flink与Hive的集成包含两个层面，一是利用了Hive的MetaStore作为持

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
查询增强型跨源连接列表 - 数据湖探索 DLI

查询增强型跨源连接列表功能介绍该API用于查询该用户已创建的增强型跨源连接列表。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v2.0/{project_id}/datasource/enhanced-connections 参数说明表1

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
Delta清理和优化 - 数据湖探索 DLI

'2020-01-01'; Z排序 Zordering是另一种加快查询速度的技术。对数据进行Z排序可以重新组织存储中的数据，当您的数据被适当地排序时，可以跳过更多的文件，读取更少的数据，从而运行得更快。要对Z-Order数据进行排序，请在ZORDER BY中指定要对其进行排序的列。 OPTIMIZE

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
浮点型 - 数据湖探索 DLI
浮点型 - 数据湖探索 DLI

分布式查询使用高性能硬件指令进行单精度或者双精度运算时，由于每次执行的顺序不一样，在调用聚合函数，比如SUM()，AVG()，特别是当数据规模非常大时，达到数千万甚至数十亿，其运算结果可能会略有不同。这种情况下，建议使用DECIMAL数据类型来运算。可以使用别名来指定数据类型。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

t文件恢复内部状态和消费位点，保证数据不丢失及聚合算子等内部状态的精确一致语义。同时，为了保证数据不重复，建议使用带主键数据库或者文件系统作为目标数据源，否则下游处理业务需要加上去重逻辑（最新成功Checkpoint记录位点到异常时间段内的数据会重复消费）。图1 Flink作业配置参数

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

booleanExpression ] 语法说明 SELECT语句用于从表中选取数据。 ALL表示返回所有结果。 DISTINCT表示返回不重复结果。注意事项所查询的表必须是已经存在的表，否则会出错。 WHERE关键字指定查询的过滤条件，过滤条件中支持算术运算符，关系运算符，逻辑运算符。 GROUP

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML

总条数： 1508

上一页
1
...
9
10
11
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

最佳实践内容概览 - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

使用HetuEngine on Hudi - 数据湖探索 DLI

资产识别与管理 - 数据湖探索 DLI

DLI常用跨源分析开发方式 - 数据湖探索 DLI

DWS Connector概述 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

FROM - 数据湖探索 DLI

为什么已有View视图的select权限，但是查询不了View？ - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

从Kafka读取数据写入到DWS - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

查询增强型跨源连接列表 - 数据湖探索 DLI

Delta清理和优化 - 数据湖探索 DLI

浮点型 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线