搜索_华为云

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

在SQL编辑器中输入以下语句创建数据库“testdb”。详细的DLI创建数据库的语法可以参考创建DLI数据库。 create database testdb; 后续章节操作都需要在testdb数据库下进行操作。 DataSource和Hive两种语法创建OBS表的区别 DataSource语法和Hive语法主要区别

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
自定义函数类型推导 - 数据湖探索 DLI

自定义函数类型推导操作场景类型推导包含了验证输入值、派生参数和返回值数据类型。从逻辑角度看，Planner需要知道数据类型、精度和小数位数；从 JVM 角度来看，Planner 在调用自定义函数时需要知道如何将内部数据结构表示为JVM对象。 Flink 自定义函数实现了自动的类型推导提取，通过

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
设置Flink作业优先级 - 数据湖探索 DLI

设置Flink作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Flink作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
DLI程序包标签管理 - 数据湖探索 DLI

在“添加/编辑标签”对话框中配置标签参数。表1 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。如果添加预定义标签，用户需要预先在标签管理服务中创建好预定义标签，然后在“标签键”的下拉框中进行选择。用户可以通过单击“查看预定义标签”进入标签管理服务的“预定义标签

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

在Spark作业编辑器中选择对应的Module模块并执行Spark作业。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource.opentsdb。如果选择Spark版本为3.1.1及以上版本时，无需选择Module模块，

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

单数据等结构化、半结构化的KeyValue数据存储。利用DLI，用户可方便地将海量数据高速、低时延写入HBase。前提条件该场景作业需要运行在DLI的独享队列上，因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
存储计费 - 数据湖探索 DLI
存储计费 - 数据湖探索 DLI

以UTC+8时间为准），结算完毕后进入新的计费周期。计费的起点以DLI表的创建时间点为准，终点以DLI表删除时间为准。资源从创建到启动需要一定时长，按需计费的数据存储的起点是DLI表创建成功的时间点，而非创建的时间。您可以在“数据管理 > 库表管理”查看DLI表的创建成功的时间。

帮助中心 > 数据湖探索 DLI > 计费说明
查询作业模板列表 - 数据湖探索 DLI

datasource.opentsdb RDS MySQL: sys.datasource.rds RDS PostGre: 不需要选 DWS: 不需要选 CSS: sys.datasource.css resources Array of Objects JSON对象列表，填写

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
创建DLI表关联DWS - 数据湖探索 DLI

密码泄露的风险，优先推荐您使用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。前提条件创建DLI表关联DWS之前需要创建跨源连接。管理控制台操作请参考增强型跨源连接。语法格式 1 2 3 4 5 6 CREATE TABLE [IF NOT EXISTS]

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DWS表
自定义函数类型推导 - 数据湖探索 DLI

自定义函数类型推导操作场景类型推导包含了验证输入值、派生参数和返回值数据类型。从逻辑角度看，Planner需要知道数据类型、精度和小数位数；从 JVM 角度来看，Planner 在调用自定义函数时需要知道如何将内部数据结构表示为JVM对象。 Flink 自定义函数实现了自动的类型推导提取，通过

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
Flink作业运行异常，如何定位 - 数据湖探索 DLI

击“编辑”按钮，在作业运行界面确认作业是否勾选“保存作业日志”参数。图1 保存作业日志是，则执行3。否，则运行日志不会转储OBS桶，需要先执行2保存作业运行日志。在作业运行界面勾选“保存作业日志”，在“OBS桶”参数选择存储运行日志的OBS桶。单击“启动”重新运行作业。作业重新运行完成后再执行3及后续步骤。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
设置Spark作业优先级 - 数据湖探索 DLI

设置Spark作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Spark作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

在Spark作业编辑器中选择对应的Module模块并执行Spark作业。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource.dws。如果选择Spark版本为3.1.1及以上版本时，无需选择Module模块，

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
预留关键字 - 数据湖探索 DLI
预留关键字 - 数据湖探索 DLI

预留关键字表1罗列了系统预留的关键字，以及它们在其他SQL标准中是否为预留关键字。如果需要使用这些关键字作为标识符，请加注双引号。表1 关键字 Keyword SQL：2016 SQL-92 ALTER reserved reserved AND reserved reserved

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
设置SQL作业优先级 - 数据湖探索 DLI

设置SQL作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个SQL设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
增强型跨源连接权限管理 - 数据湖探索 DLI

目所属的用户账号进行登录。如果被授权的项目属于相同区域（region）的同一用户，则需使用当前账号切换到对应的项目下。应用示例项目B需要访问项目A上的数据源，对应操作如下。对于项目A：使用项目A对应的账号登录DLI服务。通过对应数据源的VPC信息在DLI服务中创建增强型跨源连接“ds”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
SQL作业访问报错：DLI.0003: AccessControlException XXX - 数据湖探索 DLI

AccessControlException XXX。解决措施请检查OBS桶权限，确保账号有权限访问报错信息中提到的OBS桶。如果没有，需要联系OBS桶的管理员添加桶的访问权限。父主题： SQL作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

即可，具体请参考表1。如果需要同时设定扩容和缩容，则需要创建两个弹性扩缩容定时任务，分别设定扩容和缩容的“任务名称”、“最终CUs”和“执行时间”，具体请参考表1。操作步骤如下：在DLI管理控制台左侧，选择“资源管理 > 队列管理”。选择需要设置弹性扩缩容定时任务的队列，

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
使用DLI分析账单消费数据 - 数据湖探索 DLI

格优惠且在周期内独享计算资源。按需计费以小时为单位进行扣费。按需计费又分为按CU时计费和按扫描数据量计费，这两种计费方式是互斥的，可根据需要选择其中一种。建议优先选择按CU时计费，可资源独享，且成本核算清晰。同时，按CU时计费还提供套餐包的购买和使用。 CU时资费=CU数*使用

 帮助中心 > 数据湖探索 DLI > 最佳实践
SQL作业运行慢如何定位 - 数据湖探索 DLI

在OBS目录下，获取归档日志文件夹，详细如下。 Spark SQL作业：查看带有“driver”或者为“container_xxx_000001”的日志文件夹则为需要查看的Driver日志目录。图2 带有driver的归档日志文件夹名示例图3 container_xxx_000001归档日志文件夹示例

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类

总条数： 916

上一页
1
...
31
32
33
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

自定义函数类型推导 - 数据湖探索 DLI

设置Flink作业优先级 - 数据湖探索 DLI

DLI程序包标签管理 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

存储计费 - 数据湖探索 DLI

查询作业模板列表 - 数据湖探索 DLI

创建DLI表关联DWS - 数据湖探索 DLI

自定义函数类型推导 - 数据湖探索 DLI

Flink作业运行异常，如何定位 - 数据湖探索 DLI

设置Spark作业优先级 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

预留关键字 - 数据湖探索 DLI

设置SQL作业优先级 - 数据湖探索 DLI

增强型跨源连接权限管理 - 数据湖探索 DLI

SQL作业访问报错：DLI.0003: AccessControlException XXX - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线