搜索_华为云

创建DLI表关联HBase - 数据湖探索 DLI

荐您使用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。前提条件创建DLI表关联HBase之前需要创建跨源连接。管理控制台操作请参考增强型跨源连接。请确保在DLI队列host文件中添加MRS集群master节点的“/etc/hosts”信息。如何添加

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
创建DLI表关联DWS - 数据湖探索 DLI

先推荐您使用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。前提条件创建DLI表关联DWS之前需要创建跨源连接。管理控制台操作请参考增强型跨源连接。语法格式 1 2 3 4 5 6 CREATE TABLE [IF NOT EXISTS] TABLE_NAME

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DWS表
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

简介 Apache Hive 已经成为了数据仓库生态系统中的核心。它不仅仅是一个用于大数据分析和ETL场景的SQL引擎，同样它也是一个数据管理平台，可用于发现，定义，和演化数据。 Flink与Hive的集成包含两个层面，一是利用了Hive的MetaStore作为持久化的Catal

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
创建DLI表关联RDS - 数据湖探索 DLI

先推荐您使用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。前提条件创建DLI表关联RDS之前需要创建跨源连接。管理控制台操作请参考增强型跨源连接。语法格式 1 2 3 4 5 6 7 CREATE TABLE [IF NOT EXISTS] TABLE_NAME

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接RDS表
创建DLI表关联CSS - 数据湖探索 DLI

先推荐您使用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。前提条件创建DLI表关联CSS之前需要创建跨源连接。管理控制台操作请参考增强型跨源连接。语法格式 1 2 3 4 5 6 7 8 9 10 11 12 CREATE TABLE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
创建DLI表关联DCS - 数据湖探索 DLI

用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。前提条件创建DLI表关联DCS之前需要创建跨源连接，绑定队列。管理控制台操作请参考增强型跨源连接。语法格式指定Key 1 2 3 4 5 6 7 8 9 10 11 CREATE TABLE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DCS表
使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

录异常 Spark作业不支持访问sftp，建议将文件数据上传到OBS，再通过Spark作业进行读取和分析。上传数据到OBS桶：通过OBS管理控制台或者使用命令行工具将存储在sftp中的文件数据上传到OBS桶中。 Spark读取OBS文件数据，详见使用Spark Jar作业读取和查询OBS数据。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

池“dli_resource_pool”、队列“dli_queue_01”。登录DLI管理控制台。在左侧导航栏单击“资源管理 > 弹性资源池”，可进入弹性资源池管理页面。在弹性资源池管理界面，单击界面右上角的“购买弹性资源池”。在“购买弹性资源池”界面，填写具体的弹性资源池参数。

帮助中心 > 数据湖探索 DLI > 快速入门
SDK的获取与安装 - 数据湖探索 DLI

SDK的获取与安装 Java SDK安装方式您可以通过以下两种方式安装Java SDK。导入Maven依赖，适用于使用Maven管理的Java项目。具体操作请参考方法一：通过Maven安装DLI SDK依赖。在集成开发环境中导入JAR文件，适用于使用Eclipse作为集成开

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
创建Hive Catalog - 数据湖探索 DLI

数据处理最关键的方面之一是管理元数据。元数据可以是临时的，例如临时表、或者通过TableEnvironment注册的UDF。元数据也可以是持久化的，例如Hive Metastore中的元数据。Catalog 提供了一个统一的API，用于管理元数据，并使其可以从Table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

如何查看DLI Spark作业的实际资源使用情况查看Spark作业原始资源配置登录DLI 控制台，单击左侧“作业管理”>“Spark作业”，在作业列表中找到需要查看的Spark作业，单击“作业ID”前的，即可查看对应Spark作业的原始资源配置参数。在创建Spark作业时，

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
预览表内容（废弃） - 数据湖探索 DLI

ID，用户可再根据job ID获取预览信息。状态码状态码如表4所示。表4 状态码状态码描述 200 查询成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题：表相关API（废弃）

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
查询批处理作业日志（废弃） - 数据湖探索 DLI

"具体的作业日志信息" ] } 状态码状态码如表4所示。表4 状态码状态码描述 200 查询成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题： Spark批处理相关API（废弃）

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > Spark批处理相关API（废弃）
Hudi开发规范概述 - 数据湖探索 DLI

Hudi开发规范概述范围本节内容介绍DLI-Hudi组件进行湖仓一体、流批一体方案的设计与开发方面的规则，适用于Hudi开发场景的表的设计、管理与作业开发。主要包括以下方面的规范：数据表设计资源配置性能调优常见故障处理常用参数配置术语约定本规范采用以下的术语描述：规则：编程时强制必须遵守的原则。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
Flink作业运行异常，如何定位 - 数据湖探索 DLI

Flink作业运行异常，如何定位在“Flink作业”管理页面，对应作业“操作”列单击“编辑”按钮，在作业运行界面确认作业是否勾选“保存作业日志”参数。图1 保存作业日志是，则执行3。否，则运行日志不会转储OBS桶，需要先执行2保存作业运行日志。在作业运行界面勾选“保存作

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码操作场景本例提供使用Spark作业访问DWS数据源的java样例代码。在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码操作场景本例提供使用Spark作业访问DWS数据源的pyspark样例代码。在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
查询Spark作业日志 - 数据湖探索 DLI

完成设置后DLI作业运行过程中产生的临时数据将会存储在该OBS桶中。图2 设置DLI作业桶查询Spark作业日志登录DLI管理控制台，单击“作业管理 > Spark作业”。选择待查询的Spark作业，单击操作列的“更多 > 归档日志”。系统自动跳转至DLI作业桶日志路径下。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
查询SQL作业日志 - 数据湖探索 DLI

完成设置后DLI作业运行过程中产生的临时数据将会存储在该OBS桶中。图2 设置DLI作业桶查询SQL作业日志登录DLI管理控制台，单击“作业管理 > SQL作业”。选择待查询的SQL作业，单击操作列的“更多 > 归档日志”。系统自动跳转至DLI作业桶日志路径下。选择需要查看的日期，单击操作列的“

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Flink作业提交错误，如何定位 - 数据湖探索 DLI

Flink作业提交错误，如何定位在Flink作业管理页面，将鼠标悬停到提交失败的作业状态上，查看失败的简要信息。常见的失败原因可能包括： CU资源不足：需扩容队列。生成jar包失败：检查SQL语法及UDF等。如果信息不足以定位或者是调用栈错误，可以进一步单击作业名称，进入

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类

总条数： 879

上一页
1
...
14
15
16
...
44
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建DLI表关联HBase - 数据湖探索 DLI

创建DLI表关联DWS - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

创建DLI表关联RDS - 数据湖探索 DLI

创建DLI表关联CSS - 数据湖探索 DLI

创建DLI表关联DCS - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

创建Hive Catalog - 数据湖探索 DLI

如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

预览表内容（废弃） - 数据湖探索 DLI

查询批处理作业日志（废弃） - 数据湖探索 DLI

Hudi开发规范概述 - 数据湖探索 DLI

Flink作业运行异常，如何定位 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

Flink作业提交错误，如何定位 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线