搜索_华为云

创建并提交SQL作业 - 数据湖探索 DLI

首次进入SQL编辑器，页面会提示设置DLI作业桶。该桶用于存储使用DLI服务产生的临时数据，例如：作业日志等。如果不创建该桶，将无法查看作业日志。桶名称为系统默认。在OBS管理控制台页面通过配置桶的生命周期规则，可以实现定时删除OBS桶中的对象或者定时转换对象的存储类别。具体操作请参考通过配置生命周期规则。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
查询批处理作业详情 - 数据湖探索 DLI

Long 批处理作业的创建时间。是单位为“毫秒”的时间戳。 update_time 否 Long 批处理作业的更新时间。是单位为“毫秒”的时间戳。 feature 否 String 作业特性。表示用户作业使用的Spark镜像类型。 basic：表示使用DLI提供的基础Spark镜像。

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
Flink Opensource SQL如何解析复杂嵌套 JSON？ - 数据湖探索 DLI

各数据类型获取元素的方法： - map：map['key'] - array：array[index] - row：row.key array 的起始下标从 1 开始，即 array[1] 是 array 的第一个元素。 array 的元素必须同类型，row 的元素可以不同类型。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Flink Jar作业开发基础样例 - 数据湖探索 DLI

“修改主机信息”章节。 Kafka服务端的端口如果监听在hostname上，则需要将Kafka Broker节点的hostname和IP的对应关系添加到DLI队列中。Kafka Broker节点的hostname和IP请联系Kafka服务的部署人员。前提条件确保已创建弹性资源池和队列。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
了解数据目录、数据库和表 - 数据湖探索 DLI

视图表（View）是一种虚拟表，它不存储实际的数据，而是根据定义的查询逻辑动态生成数据。视图通常用于简化复杂的查询，或者为不同的用户或应用提供定制化的数据视图。视图表可以基于一个或多个表创建，提供了一种灵活的方式来展示数据，而不影响底层数据的存储和组织。库表管理中表的列表页面，表类型为View的即代表视图表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
ClickHouse结果表 - 数据湖探索 DLI

url 是 ClickHouse的url。参数格式为：jdbc:clickhouse://ClickHouseBalancer实例的IP:ClickHouseBalancer实例的http端口/数据库名 ClickHouseBalancer实例的IP地址：登录MRS管理控制台，选择“集群名称

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

OBS的使用涉及以下几项费用：存储费用：静态网站文件存储在OBS中产生的存储费用。请求费用：用户访问OBS中存储的静态网站文件时产生的请求费用。流量费用：用户使用自定义域名通过公网访问OBS时产生的流量费用。实际产生的费用与存储的文件大小、用户访问所产生的请求次数和流量大小有关，请根据自己的业务进行预估。

帮助中心 > 数据湖探索 DLI > 最佳实践
Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？问题描述 Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为不一致根因分析该问题的根因是数据库设置的时区不合理，通常该问题出现时Flink读取的时间和RDS数据库的时间会相差13小时。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

DLI提供了一个通用接口，可用于获取用户在启动Flink作业时设置的委托的临时凭证。该接口将获取到的该作业委托的临时凭证封装到com.huaweicloud.sdk.core.auth.BasicCredentials类中。本操作介绍获取Flink作业委托临时凭证的操作方法。 Spark作业场景 Spark

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

使用canal-json读取kafka中的canal记录，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 >

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
创建DLI表关联HBase - 数据湖探索 DLI

wkey指定的字段只有一个的时候，该字段的类型可以是支持的所有数据类型，并且不需要填写长度。在组合Rowkey的场景中插入Rowkey数据时，如果某个属性的实际数据的长度比属性作为Rowkey时指定的长度要短，则会在数据后面补'\0'字符；如果某个属性的实际数据的长度比属性作

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

使用ogg-json读取kafka中的ogg记录，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 >

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
DESCRIBE - 数据湖探索 DLI
DESCRIBE - 数据湖探索 DLI

(partition_spec) 描述查看指定表的元数据信息。该语法目前只能显示列的元数据信息，等效于语法SHOW COLUMNS。添加EXTENDED关键字会将表的所有元数据信息以“Thrift”序列化的格式显示出来。添加FORMATTED关键字会将表的元数据信息以表格的形式展示。示例显示fruit数据表的列信息：

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 辅助命令语法
FileSystem源表 - 数据湖探索 DLI
FileSystem源表 - 数据湖探索 DLI

本节介绍FileSystem源表的定义，以及创建源表时使用的参数和示例代码。前提条件该场景作业需要建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

b已创建的DLI数据源连接。资源队列选择已创建的DLI SQL类型的队列。数据库名称选择DLI下已创建的数据库。当前示例为在DLI上创建数据库和表中创建的数据库名，即为“testdb”。表名选择DLI下已创建的表名。当前示例为在DLI上创建数据库和表中创建的表名，即为“user_info”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
使用DLI分析电商BI报表 - 数据湖探索 DLI

某电商商城在保持高速发展的同时，沉淀了数亿的忠实用户，积累了海量的真实数据。如何利用BI工具从历史数据中找出商机，是大数据应用在精准营销中的关键问题，也是所有电商平台在做智能化升级时所需要的核心技术。本案例以某商城真实的用户、商品、评论数据（脱敏后）为基础，利用数据湖探索来分析用户和商品的各种数

 帮助中心 > 数据湖探索 DLI > 最佳实践
导出SQL作业结果 - 数据湖探索 DLI

行。压缩格式否导出查询结果数据的压缩方式，选择如下压缩方式。 none bzip2 deflate gzip 存储路径是选择导出的作业结果的OBS桶路径。如果导出方式选择的是“随导出创建指定路径” 在选择桶路径后，需手动输入自定义的指定路径的目录名称，且该目录名称不存

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Confluent Avro Format - 数据湖探索 DLI

ent avro的形式写入作为sink的topic中。根据kafka和ecs所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka和ecs的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
显示函数详情 - 数据湖探索 DLI

显示函数详情功能描述查看指定函数的相关信息。语法格式 1 DESCRIBE FUNCTION [EXTENDED] [db_name.] function_name; 关键字 EXTENDED：显示扩展使用信息。注意事项返回已有函数的元数据（实现类和用法），如果函数不存在，则系统报错。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

执行Checkpoint对业务性能的影响以及异常恢复的时长），同时勾选“异常自动重启”，并勾选“从Checkpoint恢复”。配置后，作业异常重启，会从最新成功的Checkpoint文件恢复内部状态和消费位点，保证数据不丢失及聚合算子等内部状态的精确一致语义。同时，为了保证数据不

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类

总条数： 924

上一页
1
...
8
9
10
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建并提交SQL作业 - 数据湖探索 DLI

查询批处理作业详情 - 数据湖探索 DLI

Flink Opensource SQL如何解析复杂嵌套 JSON？ - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

创建DLI表关联HBase - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

DESCRIBE - 数据湖探索 DLI

FileSystem源表 - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

导出SQL作业结果 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

显示函数详情 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线