搜索_华为云

创建DLI表关联OpenTSDB - 数据湖探索 DLI

创建DLI表关联OpenTSDB 功能描述使用CREATE TABLE命令创建DLI表并关联OpenTSDB上已有的metric，该语法支持CloudTable服务的OpenTSDB和MRS服务的OpenTSDB。前提条件创建DLI表关联OpenTSDB之前需要创建跨源连接。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接OpenTSDB表
Spark作业使用咨询 - 数据湖探索 DLI

Spark作业使用咨询 DLI Spark作业是否支持定时周期任务作业 DLI Spark不支持作业调度，用户可以通过其他服务，例如数据湖管理治理中心DataArts Studio服务进行调度，或者通过API/SDK等方式对作业进行自定义调度。使用DataArts Studio

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本功能描述对于Hive表，我们可以将其作为有界流读出。在这种情况下，Hive表只能在查询时跟踪其最新版本。最新版本的表保留了Hive表的所有数据。注意事项每个连接子任务都需要保留自己的Hive表缓存。请确保Hive表可以放入TM

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

创建Spark作业 Spark作业编辑页面支持执行Spark作业，为用户提供全托管式的Spark计算服务。在总览页面，单击Spark作业右上角的“创建作业”，或在Spark作业管理页面，单击右上角的“创建作业”，均可进入Spark作业编辑页面。进入Spark作业编辑页面，页面会提示系统将创建

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

Hive源表简介 Apache Hive 已经成为了数据仓库生态系统中的核心。它不仅仅是一个用于大数据分析和ETL场景的SQL引擎，同样它也是一个数据管理平台，可用于发现，定义，和演化数据。 Flink与Hive的集成包含两个层面，一是利用了Hive的MetaStore作为持久化的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Hudi Compaction操作说明 - 数据湖探索 DLI

Hudi Compaction操作说明什么是Compaction Compaction用于合并mor表Base和Log文件，Compaction包含两个过程Schedule和Run。Schedule过程会在TimeLine里生成一个Compaction Plan，这个Compaction

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
创建Hive Catalog - 数据湖探索 DLI

创建Hive Catalog 简介 Catalog提供了元数据信息，例如数据库、表、分区、视图以及数据库或其他外部系统中存储的函数和信息。数据处理最关键的方面之一是管理元数据。元数据可以是临时的，例如临时表、或者通过TableEnvironment注册的UDF。元数据也可以是持久化的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
故障恢复 - 数据湖探索 DLI
故障恢复 - 数据湖探索 DLI

故障恢复系统级故障恢复 DLI系统采用存算分离的架构，计算集群基于K8s资源调度和故障切换机制，在系统故障时，支持自动故障恢复。作业级故障恢复 Flink、Spark作业支持配置自动重启恢复机制，在开启自动重启功能后，当作业出现异常时将自动重启恢复作业。父主题：安全

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
API概览 - 数据湖探索 DLI
API概览 - 数据湖探索 DLI

API概览本章节介绍了目前DLI所提供的API列表。表1 DLI API列表类型说明权限相关API 包括队列赋权、查看队列的使用者、数据赋权、查看数据库的使用者、查看表的使用者、查看表的用户权限和查看赋权对象使用者权限信息。全局变量相关API 包括创建全局变量、删除全局变量

 帮助中心 > 数据湖探索 DLI > API参考
创建DLI程序包 - 数据湖探索 DLI

创建DLI程序包 DLI支持用户通过批处理方式将程序包提交至通用队列中运行。如果用户需要更新程序包，可以使用相同的程序包或文件上传至DLI的同一个位置（同一个分组），直接覆盖原有的程序包或文件。前提条件所使用的程序包需提前上传至OBS服务中保存。创建程序包步骤在管理控制台左侧

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
DLI内置依赖包 - 数据湖探索 DLI

DLI内置依赖包 DLI内置依赖包是平台默认提供的依赖包，用户打包Spark或Flink jar作业jar包时，不需要额外上传这些依赖包，以免与平台内置依赖包冲突。 Spark 3.1.1 依赖包表1 Spark 3.1.1 依赖包依赖包名称 accessors-smart-1.2

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
在DLI控制台预览表数据 - 数据湖探索 DLI

在DLI控制台预览表数据 “预览页面”将显示对应表的前10条数据。预览数据步骤预览数据的入口有两个，分别在“数据管理”和“SQL编辑器”页面。在“数据管理”页面预览数据。在管理控制台左侧，单击“数据管理”>“库表管理”。单击需导出数据对应数据库名称，进入该数据库“表管理”

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
日期函数概览 - 数据湖探索 DLI

日期函数概览 DLI所支持的日期函数如表1所示。表1 日期/时间函数函数命令格式返回值功能简介 add_months add_months(string start_date, int num_months) STRING 返回start_date在num_months个月之后的

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
导出SQL作业结果 - 数据湖探索 DLI

导出SQL作业结果导出作业结果是将SQL作业分析后的数据结果按指定格式存储到指定位置。 DLI默认将SQL作业结果存储在DLI作业桶中。同时也支持下载作业结果到本地或导出作业结果到指定的OBS桶。导出作业结果到DLI作业桶 DLI在指定了一个默认的OBS桶作为作业结果的存储位置

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
数据迁移与传输方式概述 - 数据湖探索 DLI

数据迁移与传输方式概述导入数据至OBS DLI支持在不迁移数据的情况下，直接访问OBS中存储的数据进行查询分析。您只需将本地数据导入OBS即可开始使用DLI进行数据分析。导入数据的具体操作请参考上传对象。迁移数据至DLI 为了将分散在不同系统中的数据迁移到DLI，确保数据可以在

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
配置DLI程序包权限 - 数据湖探索 DLI

配置DLI程序包权限针对不同用户，可以通过权限设置分配不同的程序包组或程序包，不同用户之间的作业效率互不影响，保障作业性能。管理员用户、程序包组拥有程序包组的所有权限。不需要进行权限设置，且其他用户无法修改其程序包组权限。管理员用户、程序包的所有者拥有程序包的所有权限。不需要进行权限设置

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
UPDATE - 数据湖探索 DLI
UPDATE - 数据湖探索 DLI

UPDATE 命令功能 UPDATE命令根据列表达式和可选的过滤条件更新Hudi表。命令格式 UPDATE tableIdentifier SET column = EXPRESSION(,column = EXPRESSION) [ WHERE boolExpression]

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
修改DLI程序包所有者 - 数据湖探索 DLI

修改DLI程序包所有者 DLI提供了修改程序包组或程序包的所有者的功能。登录DLI管理控制台，选择“数据管理 > 程序包管理”。在“程序包管理”页面，单击程序包“操作 ”列中的“更多 > 修改所有者”。如果该程序包进行过分组设置，选择“组”或者“程序包”进行修改。图1 修改程序包所有者

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
队列相关API（废弃） - 数据湖探索 DLI

队列相关API（废弃）修改队列网段（废弃）创建队列定时扩缩容计划（废弃）查看队列定时扩缩容计划（废弃）批量删除队列定时扩缩容计划（废弃）单个删除队列定时扩缩容计划（废弃）修改队列定时扩缩容计划（废弃）父主题：历史API

帮助中心 > 数据湖探索 DLI > API参考 > 历史API
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？缺少pymysql模块，可以查看是否有对应的egg包，如果没有，在“程序包管理”页面上传pyFile。具体步骤参考如下：将egg包上传到指定的OBS桶路径下。登录

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类

总条数： 683

上一页
1
...
6
7
8
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建DLI表关联OpenTSDB - 数据湖探索 DLI

Spark作业使用咨询 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

创建Hive Catalog - 数据湖探索 DLI

故障恢复 - 数据湖探索 DLI

API概览 - 数据湖探索 DLI

创建DLI程序包 - 数据湖探索 DLI

DLI内置依赖包 - 数据湖探索 DLI

在DLI控制台预览表数据 - 数据湖探索 DLI

日期函数概览 - 数据湖探索 DLI

导出SQL作业结果 - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

配置DLI程序包权限 - 数据湖探索 DLI

UPDATE - 数据湖探索 DLI

修改DLI程序包所有者 - 数据湖探索 DLI

队列相关API（废弃） - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线