搜索_华为云

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

安装和配置IntelliJ IDEA IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其2019.1往后的版本。安装Maven 开发环境的基本配置（下载并安装 Maven）。用于项目管理，贯穿软件开发生命周期。开发流程 DLI下UDAF函数开发流程参考如下：图1

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
创建Kafka_SSL类型跨源认证 - 数据湖探索 DLI

操作场景通过在DLI控制台创建的Kafka_SSL类型的跨源认证，将Kafka的认证信息存储到DLI，无需在SQL作业中配置账号密码，安全访问Kafka实例。 MRS Kafka开启Kerberos认证，未开启SSL认证时，创建Kerberos类型的认证。建表时通过krb_auth_name关联跨源认证。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务弹性扩缩容定时任务使用场景通常，用户业务繁忙的场景是有周期性的，在某个周期内，用户需要更多的计算资源来处理业务，过了这个周期，则不需要那么多资源。如果用户购买的队列规格比较小，在业务繁忙时会存在资源不足的情况；而如果购买的队列规格比较大，又可能会存在资源浪费的情况。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
创建DLI自定义委托权限 - 数据湖探索 DLI

3及以上版本的引擎执行作业时，当您所需的委托没有包含在DLI系统委托dli_management_agency时，您需要在IAM页面创建相关委托，并在作业配置中添加新建的委托信息。dli_management_agency包含跨源操作、消息通知、用户授权操作所需的权限，除此之外的其他委

 帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
CREATE VIEW语句 - 数据湖探索 DLI
CREATE VIEW语句 - 数据湖探索 DLI

语法说明 TEMPORARY 创建一个有 catalog 和数据库命名空间的临时视图，并覆盖原有的视图。 IF NOT EXISTS 如果该视图已经存在，则不会进行任何操作。示例创建一个名为viewName的视图。 create view viewName as select *

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义
查看弹性资源池的基本信息 - 数据湖探索 DLI

查看弹性资源池的基本信息资源池创建完成后您可以通过管理控制台查看和管理您的弹性资源池。本节操作介绍在管理控制台如何查看弹性资源池基本信息，包括弹性资源池的VPC网段、IPv6网段、创建时间等信息。查看弹性资源池的基本信息登录DLI管理控制台。选择“资源管理 > 弹性资源池”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

编写UDTF函数代码 3 调试，编译代码并导出Jar包 4 上传Jar包到OBS OBS控制台将生成的UDTF函数Jar包文件上传到OBS目录下。 5 创建DLI的UDTF函数 DLI控制台在DLI控制台的SQL作业管理界面创建使用的UDTF函数。 6 验证和使用DLI的UDTF函数 DLI控制台

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

SETS 的 GROUP BY 子句可以生成一个等效于由多个简单 GROUP BY 子句的 UNION ALL 生成的结果集，并且其效率比 GROUP BY 要高。 ROLLUP与CUBE按一定的规则产生多种分组，然后按各种分组统计数据。 CUBE生成的结果集显示了所选列中值的所有组合的聚合。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

SETS 的 GROUP BY 子句可以生成一个等效于由多个简单 GROUP BY 子句的 UNION ALL 生成的结果集，并且其效率比 GROUP BY 要高。 ROLLUP与CUBE按一定的规则产生多种分组，然后按各种分组统计数据。 CUBE生成的结果集显示了所选列中值的所有组合的聚合。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

SETS 的 GROUP BY 子句可以生成一个等效于由多个简单 GROUP BY 子句的 UNION ALL 生成的结果集，并且其效率比 GROUP BY 要高。 ROLLUP与CUBE按一定的规则产生多种分组，然后按各种分组统计数据。 CUBE生成的结果集显示了所选列中值的所有组合的聚合。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
安全 - 数据湖探索 DLI
安全 - 数据湖探索 DLI

安全责任共担资产识别与管理身份认证与访问控制数据保护技术审计与日志服务韧性监控安全风险故障恢复更新管理认证证书

 帮助中心 > 数据湖探索 DLI > 产品介绍
创建视图 - 数据湖探索 DLI
创建视图 - 数据湖探索 DLI

CREATE VIEW：基于给定的select语句创建视图，不会将select语句的结果写入磁盘。 OR REPLACE：指定该关键字后，若视图已经存在将不报错，并根据select语句更新视图的定义。注意事项所要创建的视图必须是当前数据库下不存在的，否则会报错。当视图存在时，可通过增加OR

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 视图相关
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

join关联维表的最新版本功能描述对于Hive表，我们可以将其作为有界流读出。在这种情况下，Hive表只能在查询时跟踪其最新版本。最新版本的表保留了Hive表的所有数据。注意事项每个连接子任务都需要保留自己的Hive表缓存。请确保Hive表可以放入TM任务槽的内存中。建议为streaming-source

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

容，显著提升扩缩容的成功率和操作效率。在全天的任意一个时间段内，弹性资源池中所有队列的最小CU数之和必须小于等于弹性资源池的最小CU数。在全天的任意一个时间段内，弹性资源池中任意一个队列的最大CU必须小于等于弹性资源池的最大CU。同一队列不同扩缩容策略的时间段区间不能有交集。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？在大数据分析的日常工作中，合理分配和管理计算资源，可以提供良好的作业执行环境。您可以根据作业的计算需求和数据规模分配资源、调整任务执行顺序，调度不同的弹性资源池或队列资源以适应不同的工作负载。待提交作业所需的CUs需小于等于弹性资源池的剩余可用CUs，才可以确保作业任务的正常执行。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
使用前必读 - 数据湖探索 DLI
使用前必读 - 数据湖探索 DLI

实现海量数据的秒级交互式查询。 DLI+HetuEngine能够快速处理大规模数据集的查询请求，迅速和高效从大数据中提取信息，极大地简化了数据的管理和分析流程，提升大数据环境下的索引和查询性能。 TB级数据秒级响应： HetuEngine通过自动优化资源与负载的配比，能够对TB

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
使用DLI分析账单消费数据 - 数据湖探索 DLI

本文主要介绍如何使用华为云DLI上的实际消费数据（文中涉及账户的信息已脱敏），在DLI的大数据分析平台上进行分析，找出费用优化的空间，并给出使用DLI过程中降低成本的一些优化措施。流程介绍使用DLI进行账单分析与优化的操作过程主要包括以下步骤：步骤1：获取消费数据。获取账户的实际消费数据。

帮助中心 > 数据湖探索 DLI > 最佳实践
Confluent Avro Format - 数据湖探索 DLI

注册或抓取schema的Confluent Schema Registry的URL。示例 1. 从kafka中作为source的topic中读取json数据，并以confluent avro的形式写入作为sink的topic中根据kafka和ecs所在的虚拟私有云和子网创建相应的跨源，并绑

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
RDS表有自增主键时怎样在DLI插入数据？ - 数据湖探索 DLI

插入数据时省略自增字段：在DLI中插入数据时，对于自增主键字段或其他自动填充的字段，您可以在插入语句中省略这些字段。数据库会自动为这些字段生成值。例如，如果表中有一个名为id的自增主键字段，您可以在插入数据时不包含这个字段，数据库会自动为新插入的行分配一个唯一的id值。使用NULL值：如果您需要在插入数据时

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
使用DataSource语法创建DLI表 - 数据湖探索 DLI

示例3：使用CTAS将源表的全部数据或部分数据创建新的DLI表示例说明：根据示例1：创建DLI非分区表中创建的DLI表table1，使用CTAS语法将table1中的数据复制到table1_ctas表中。在使用CTAS建表的时候，可以忽略被复制的表在建表时所使用的语法，即不论在创建t

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表

总条数： 206

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

创建Kafka_SSL类型跨源认证 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

CREATE VIEW语句 - 数据湖探索 DLI

查看弹性资源池的基本信息 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

安全 - 数据湖探索 DLI

创建视图 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

使用前必读 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

RDS表有自增主键时怎样在DLI插入数据？ - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线