搜索_华为云

使用Hive语法创建DLI表 - 数据湖探索 DLI

示例3：使用CTAS语句将源表的全部数据或部分数据创建新的DLI表示例说明：根据示例1：创建DLI非分区表中创建的DLI表table1，使用CTAS语法将table1中的数据复制到table1_ctas表中。在使用CTAS建表的时候，可以忽略被复制的表在建表时所使用的语法，即

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

可以在编辑器下方窗格查看查询结果。删除刚才创建的Hudi表：如果创建的是外表，执行SQL删除表时仅删除Hudi表的元数据，数据仍然存在OBS桶中，需要手动清理。 DROP TABLE IF EXISTS hudi_table; 父主题： DLI中使用Hudi开发作业

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
使用DataSource语法创建DLI表 - 数据湖探索 DLI

示例3：使用CTAS将源表的全部数据或部分数据创建新的DLI表示例说明：根据示例1：创建DLI非分区表中创建的DLI表table1，使用CTAS语法将table1中的数据复制到table1_ctas表中。在使用CTAS建表的时候，可以忽略被复制的表在建表时所使用的语法，即不

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

面。创建Flink作业：点击界面右上角的”创建作业”按钮，在弹出窗口中配置作业名称，类型选择”Flink OpenSource SQL” 写入Flink SQL （不使用Catalog的场景）：这里的sink表通过创建临时表指向Hudi表路径来写入数据，同时在表参数中配置hi

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
新建Flink Jar作业 - 数据湖探索 DLI

Jar作业功能介绍该API用于创建用户自定义的作业，目前支持jar格式，运行在独享队列中。调试您可以在API Explorer中调试该接口。 URI URI格式 POST /v1.0/{project_id}/streaming/flink-jobs 参数说明表1 URI参数说明

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ - 数据湖探索 DLI

“操作”列中的“更多 > 导入保存点”，导入OBS中最新成功的Checkpoint，并从中恢复。登录DLI管理控制台，选择“作业管理 > Flink作业”。在对应Flink作业所在行，选择“操作 > 导入保存点”。在导入保存点界面选择Checkpoint的OBS桶路径，Ch

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
怎样将一个区域中的DLI表数据同步到另一个区域中？ - 数据湖探索 DLI

怎样将一个区域中的DLI表数据同步到另一个区域中？可以使用OBS跨区域复制功能实现，步骤如下：将区域一中的DLI表数据导出到自定义的OBS桶中。具体请参考《数据湖探索用户指南》。通过OBS跨区域复制功能将数据复制至区域二的OBS桶中。具体请参考跨区域复制。根据需要导入或使用对应的数据。父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
创建Flink OpenSource SQL作业 - 数据湖探索 DLI

once：事件仅被处理一次。勾选开启Checkpoint还需配置OBS桶参数： “OBS桶”：选择OBS桶用于保存用户Checkpoint。如果选择的OBS桶是未授权状态，需要单击“OBS授权”。 Checkpoint保存路径为：“桶名/jobs/checkpoint/作业id开头的目录”。说明：

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
创建并提交SQL作业 - 数据湖探索 DLI

本节内容介绍使用DLI的SQL编辑器创建并提交SQL作业。使用须知首次进入SQL编辑器，页面会提示设置DLI作业桶。该桶用于存储使用DLI服务产生的临时数据，例如：作业日志等。如果不创建该桶，将无法查看作业日志。桶名称为系统默认。在OBS管理控制台页面通过配置桶的生命周期规

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
FileSystem结果表 - 数据湖探索 DLI

DFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
在DLI控制台创建数据库和表 - 数据湖探索 DLI

用户可通过管理控制台或SQL语句创建数据库和表，其中SQL语句的操作方法请参见创建数据库、创建OBS表和创建DLI表等。本章节介绍在管理控制台创建数据库和表的操作步骤。 View只能通过SQL语句进行创建，不能通过“创建表”页面进行创建。注意事项当OBS的目录下有同名文件夹和文件时，创建OBS表指向该路径会优先指向文件而非文件夹。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
在DLI使用Delta提交Spark Jar作业 - 数据湖探索 DLI

在DLI使用Delta提交Spark Jar作业 1. 添加如下依赖 <dependency> <groupId>io.delta</groupId> <artifactId>delta-core_2.12</artifactId> <version>2.3

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > DLI中使用Delta开发作业
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

obsEndPoint 是 obs.cn-north-1.myhuaweicloud.com OBS服务的域名。在地区和终端节点获取OBS对应区域的域名。 bucketName 是 - OBS上的桶名称。该桶用于存放Spark程序中使用的jar包、Python程序文件、配置文件等。 obsPath

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

当OBS桶目录下有文件夹和文件同名时，加载数据会优先指向该路径下的文件而非文件夹。建议创建OBS对象时，在同一级中不要出现同名的文件和文件夹。导入分区数据 DLI提供导入数据的接口。您可以使用该接口将存储在OBS中的数据导入到已创建的DLI表或者OBS表指定分区中。示例代码如下： 1 2 3 4 5

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

需要创建一个OBS桶将数据上传到对象存储服务OBS，为后面使用DLI完成数据分析做准备。 OBS的使用涉及以下几项费用：存储费用：静态网站文件存储在OBS中产生的存储费用。请求费用：用户访问OBS中存储的静态网站文件时产生的请求费用。流量费用：用户使用自定义域名通过公网访问OBS时产生的流量费用。

帮助中心 > 数据湖探索 DLI > 最佳实践
创建Flink Jar作业 - 数据湖探索 DLI

用户自定义的依赖文件。其他依赖文件需要自行在代码中引用。依赖文件的管理方式：上传OBS管理程序包：提前将对应的依赖文件上传至OBS桶中。并在此处选择对应的OBS路径。上传DLI管理程序包：提前将对应的依赖文件上传至OBS桶中，并在DLI管理控制台的“数据管理>程序包管理”中创建程序包，具体操作请参考创建DLI程序包。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
配置DLI作业桶 - 数据湖探索 DLI

并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。使用须知请勿将该OBS桶用作其它用途，避免出现作业结果混乱等问题。 OBS桶需要由用户主账户统一设置及修改，子用户无权限。不配置DLI作业桶无法查看作业日志。您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK （推荐）方案1：使用临时AK/SK 建议使用临时AK/SK，获取方式可参见统一身份认证服务_获取临时AK/SK。认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。表1

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

内置依赖包”），这些常用算法库满足了大部分用户的使用场景。对于用户的PySpark程序依赖了内置算法库未提供的程序库该如何呢？其实PySpark本身就已经考虑到这一点了，那就是基于PyFiles来指定依赖，在DLI Spark作业页面中可以直接选取存放在OBS上的Python第三方程序库（支持zip、egg等）。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用DLI分析电商BI报表 - 数据湖探索 DLI

录方式。登录步骤请参考《对象存储服务工具指南》。通过OBS Browser+上传数据。在OBS Browser+页面单击“创建桶”，按照要求选择“区域”和填写“桶名”（例如：DLI-demo），创建桶成功后，返回桶列表，单击桶DLI-demo。OBS Browser+提供强大

 帮助中心 > 数据湖探索 DLI > 最佳实践

总条数： 1169

上一页
1
2
3
4
5
...
59
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Hive语法创建DLI表 - 数据湖探索 DLI

在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

新建Flink Jar作业 - 数据湖探索 DLI

手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ - 数据湖探索 DLI

怎样将一个区域中的DLI表数据同步到另一个区域中？ - 数据湖探索 DLI

创建Flink OpenSource SQL作业 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

在DLI使用Delta提交Spark Jar作业 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

配置DLI作业桶 - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线