搜索_华为云

查询批处理作业列表 - 数据湖探索 DLI

String 批处理作业所在队列。 create_time 否 Long 批处理作业的创建时间。是单位为“毫秒”的时间戳。 name 否 String 批处理作业名称。 owner 否 String 批处理作业所属用户。 proxyUser 否 String 批处理作业所属代理用户（资源租户）。

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
配置DLI读写外部数据源数据的操作流程 - 数据湖探索 DLI

配置DLI与数据源网络连通：您可以参考配置DLI与数据源网络连通（增强型跨源连接）配置DLI与数据源的网络连通。管理DLI具数据源的访问凭证： Spark 3.3.1及以上版本、Flink 1.15及以上版本的跨源访问场景推荐使用数据加密服务DEW来存储数据源的认证信息，为您解决数据安全、密钥安全、密钥管理复杂等问题。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
Spark 3.3.1版本说明 - 数据湖探索 DLI

Native性能加速 Spark查询语句性能提升。元数据访问性能提升提升Spark在处理大数据时的元数据访问性能，提高数据处理流程效率。提升OBS committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

CU时套餐包的额度会按订购周期重置。 DLI表的数据存储按需计费按照存储在DLI服务中的数据存储量（单位为“GB”）收取存储费用。存储费用=单价*存储数据量（GB）*小时数存储套餐包购买了存储量套餐包，按需使用过程中优先抵扣存储套餐包的规格额度，超过套餐包额度的按照按需计费。存储套餐的额度每个小时会重置。

帮助中心 > 数据湖探索 DLI > 计费说明
怎样查看DLI的数据扫描量？ - 数据湖探索 DLI

怎样查看DLI的数据扫描量？登录DLI管理控制台。选择“作业管理 > SQL作业”。筛选执行队列为default队列，查看相应的作业。单击展开作业，查看已扫描的数据。如图1所示。图1 查看作业扫描量父主题：计费相关问题

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

jar”。参考以下操作步骤上传该作业程序。提交Spark作业之前，需要在OBS中上传数据文件。登录管理控制台在服务列表中，单击“存储”中的“对象存储服务OBS”，进入OBS管理控制台页面。创建桶，这里以桶名“dli-test-obs01”为例。单击“创建桶”。进入“创建桶

 帮助中心 > 数据湖探索 DLI > 快速入门
区域和可用区 - 数据湖探索 DLI

区域和可用区用于描述数据中心的位置，您可以在特定的区域、可用区创建资源。区域（Region）：从地理位置和网络时延维度划分，同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region，通用Region指面向公共租户提供通用

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
创建Flink OpenSource SQL作业 - 数据湖探索 DLI

记录与DLI服务相关的操作事件，便于日后的查询、审计和回溯。云审计服务支持的DLI操作列表详见使用CTS审计DLI服务。关于如何开通云审计服务以及如何查看追踪事件，请参考《云审计服务快速入门》。创建Flink OpenSource SQL作业在DLI管理控制台的左侧导航栏中

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Beeline是数据分析师和数据工程师的重要工具之一，适用于大规模数据处理的场景。Beeline提供了的SQL引擎，使得用户可以使用SQL的语言来执行数据查询、数据分析和管理任务。 Kyuubi是一个分布式 SQL 查询引擎，它提供了标准的SQL接口，使用户能够方便地访问和分析存储在大数据平台中的数据。通过将Be

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

规模消息处理场景中使用。前提条件确保已创建Kafka集群。该场景作业需要运行在DLI的独享队列上，因此要与kafka集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
DWS维表（不推荐使用） - 数据湖探索 DLI

里创建了DWS集群。如何创建DWS集群，请参考《数据仓库服务管理指南》中“创建集群”章节。请确保已创建DWS数据库表。该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
使用CTS审计DLI服务 - 数据湖探索 DLI

uploadResources 删除资源包 resource deleteResource 创建增强型跨源连接 edsconnection createConnection 删除增强型跨源连接 edsconnection deleteConnection 创建经典型跨源连接 edsconnection

帮助中心 > 数据湖探索 DLI > 用户指南
使用Hive语法创建DLI表 - 数据湖探索 DLI

taSource语法的CTAS创建table1_ctas。本例中table1中DLI表的存储格式为orc，而table1_ctas表的存储格式可以为parquet，即CTAS创建的表存储格式可以不同于原表。在AS关键字后使用select语句选择需要插入到table1_ctas表中的数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

sk = "{{mySk}}" ); 数据最终在OBS中的存储目录结构为：obs://obs-sink/car_infos/day=xx/part-x-x。数据生成后，可通过如下SQL语句建立OBS分区表，用于后续批处理：创建OBS分区表。 1 2 3 4 5 6 7 8 create

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

Top-N 功能描述 Top-N 查询是根据列排序找到N个最大或最小的值。最大值集和最小值集都被视为是一种 Top-N 的查询。若在批处理或流处理的表中需要显示出满足条件的 N 个最底层记录或最顶层记录， Top-N 查询将会十分有用。语法格式 SELECT [column_list]

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

Top-N 功能描述 Top-N 查询是根据列排序找到N个最大或最小的值。最大值集和最小值集都被视为是一种 Top-N 的查询。若在批处理或流处理的表中需要显示出满足条件的 N 个最底层记录或最顶层记录， Top-N 查询将会十分有用。语法格式 SELECT [column_list]

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
配置DLI作业桶 - 数据湖探索 DLI

统（Parallel File System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。构造依赖信息，创建SparkSession 导入依赖。涉及到mvn依赖

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

Top-N 功能描述 Top-N 查询是根据列排序找到N个最大或最小的值。最大值集和最小值集都被视为是一种 Top-N 的查询。如果在批处理或流处理的表中需要显示出满足条件的 N 个最底层记录或最顶层记录， Top-N 查询将会十分有用。语法格式 SELECT [column_list]

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

业使用Flink1.15版本、且已在作业中配置允许DLI访问DEW的委托信息。在DLI管理控制台新建“增强型跨源连接”配置DLI与数据源的网络连通。具体操作请参考增强型跨源连接。语法格式 create table tableName( attr_name attr_type

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导

总条数： 568

上一页
1
...
8
9
10
...
29
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询批处理作业列表 - 数据湖探索 DLI

配置DLI读写外部数据源数据的操作流程 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

怎样查看DLI的数据扫描量？ - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

区域和可用区 - 数据湖探索 DLI

创建Flink OpenSource SQL作业 - 数据湖探索 DLI

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

DWS维表（不推荐使用） - 数据湖探索 DLI

使用CTS审计DLI服务 - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

配置DLI作业桶 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线