搜索_华为云

创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ - 数据湖探索 DLI

"obs://dli-test-001/test.csv"); test.csv文件内容如下： Jordon,88,"aa bb" 因为最后一个字段的aa和bb之间存在回车换行。创建OBS外表后，查询test06表数据内容显示如下： name id classno Jordon 88 aa bb"

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复什么是从checkpoint恢复？ Flink Checkpoint 是一种容错恢复机制。这种机制保证了实时程序运行时，遇到异常或者机器问题时能够进行自我恢复。从checkpoint恢复的原则通常当作业执行失败

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
SQL作业如何指定表的部分字段进行表数据的插入 - 数据湖探索 DLI

SQL作业如何指定表的部分字段进行表数据的插入如果需要将数据插入到表中，但只想指定部分字段，可以使用INSERT INTO语句结合SELECT子句来实现。但是DLI目前不支持直接在INSERT INTO语句中指定部分列字段进行数据插入，您需要确保在SELECT子句中选择的字段

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

项不做修改）。图5 导入表数据执行查询执行以下SQL语句，对所有司机在某段时间的异常告警事件进行统计。常用查询语句可以在SQL编辑器中，选择“更多 > 设为模板”设置为模板。设为模板后，后续可以在模板管理页面找到对应模板进行SQL查询和修改。具体操作为：选择“作业模板 >

帮助中心 > 数据湖探索 DLI > 最佳实践
如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度操作场景 Spark作业在执行shuffle类语句，包括group by、join等场景时，常常会出现数据倾斜的问题，导致作业任务执行缓慢。该问题可以通过设置spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
DLI SDK功能矩阵 - 数据湖探索 DLI

DLI SDK功能矩阵 SDK开发指南指导您如何安装和配置开发环境、如何通过调用DLI SDK提供的接口函数进行二次开发。 Java、Python SDK功能矩阵请参见表1 表1 SDK功能矩阵语言功能内容 Java OBS授权介绍将OBS桶的操作权限授权给DLI的Java

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？缺少pymysql模块，可以查看是否有对应的egg包，如果没有，在“程序包管理”页面上传pyFile。具体步骤参考如下：将egg包上传到指定的OBS桶路径下。登录DLI管理控制台，单击“数据管理

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？在Flink 作业中，可以使用CREATE语句来定义Source表和Sink表，并指定它们的连接器类型以及相关的属性。如果需要将数据写入到不同的Elasticsearch集群，您需要为每个集群配置不

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
URL函数 - 数据湖探索 DLI
URL函数 - 数据湖探索 DLI

描述：提取函数用于从HTTP URL（或任何符合RFC 2396标准的URL）中提取内容。 [protocol:][//host[:port]][path][?query][#fragment] 提取的内容不会包含URI的语法分割符，比如“：”或“？”。 url_extract_fragment(url)

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

得数据可以被有效地查询和分析。数据库是一个框架，表是其实质内容。一个数据库包含一个或者多个表。 · 元数据：元数据（Metadata）是用来定义数据类型的数据。主要是描述数据自身信息，包含源、大小、格式或其它数据特征。数据库字段中，元数据用于诠释数据仓库的内容。创建表时，会定义元数据，由列名、类型、列描述三列组成。

帮助中心 > 数据湖探索 DLI > 功能总览
建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

号下创建的VPC和子网共享给账号B。在账号B接受共享以后，账号B可以查看到共享的VPC和子网，并可以使用该共享VPC和子网创建资源。有关共享VPC的更多信息，请参见《虚拟私有云用户指南》的“共享VPC”相关内容。 DLI使用场景企业IT管理账号创建VPC和子网，并将该VPC和

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
权限管理 - 数据湖探索 DLI
权限管理 - 数据湖探索 DLI

M用户进行权限管理，您可以跳过本章节，不影响您使用DLI服务的其他功能。 IAM是华为云提供权限管理的基础服务，无需付费即可使用，您只需要为您账号中的资源进行付费。关于IAM的详细介绍，请参见《IAM产品介绍》。 DLI权限默认情况下，管理员创建的IAM用户没有任何权限，您需要

 帮助中心 > 数据湖探索 DLI > 产品介绍
Hudi表使用约束 - 数据湖探索 DLI

Hetu 2.1.0 0.11.0 如何判断队列支持的计算引擎版本：首先进入DLI的控制台界面，点击左侧菜单栏的”资源管理”-> ”队列管理”。在队列管理的界面筛选并选中需要查询的队列，随后点击窗口底部的窗格，展开隐藏的队列详情页面，在支持版本即可查看可用的计算引擎版本。对于SQL队

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

} 读优化查询：COW表读优化查询等同于快照查询。 MOR表查询在Spark SQL作业中使用元数据服务，或者配置了HMS同步参数，在创建MOR表后，会额外同步创建：“表名_rt”和“表名_ro”两张表。查询后缀为rt的表等同于实时查询，查询后缀为ro的表代表读优化查询。例如：通过Spark

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
套餐包计费 - 数据湖探索 DLI
套餐包计费 - 数据湖探索 DLI

套餐包和具体的区域绑定，购买的套餐只能在绑定的区域使用，不能在其他区域使用。计费时优先使用套餐中的资源，套餐中资源使用完后，超出部分按需付费。套餐包到期后，按需资源不会自动关闭，将会以按需付费的方式继续使用。购买套餐包登录DLI管理控制台。选择“资源管理 > 队列管理”。在队列管理页面，单击“购买套餐包”。

帮助中心 > 数据湖探索 DLI > 计费说明
权限管理概述 - 数据湖探索 DLI

对于新建的用户，需要先登录一次DLI，记录元数据，后续才可正常使用。 IAM是华为云提供权限管理的基础服务，无需付费即可使用，您只需要为您账号中的资源进行付费。关于IAM的详细介绍，请参见《IAM产品介绍》。如果华为云账号已经能满足您的需求，不需要创建独立的IAM用户进行权

 帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
DLI弹性资源池与队列简介 - 数据湖探索 DLI

DLI弹性资源池与队列简介 DLI的计算资源是执行作业的基础，本节内容介绍DLI计算资源的模式和队列类型。什么是弹性资源池和队列？在了解DLI计算资源模式前首先了解弹性资源池和队列的基本概念。弹性资源池是DLI计算资源的一种池化管理模式，可以看做DLI计算资源的集合。DLI

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

insert作业运行成功后，查询OBS表“testcsvdata2source”数据。 select * from testcsvdata2source; 图3 查询结果在OBS桶的“obs://dli-test-021/data”目录下刷新后查询，生成了csv数据文件，文件内容为insert插入的数据内容。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
查询CSS表 - 数据湖探索 DLI
查询CSS表 - 数据湖探索 DLI

查询CSS表 SELECT命令用于查询CSS表中的数据。语法格式 1 SELECT * FROM table_name LIMIT number; 关键字 LIMIT：对查询结果进行限制，number参数仅支持INT类型。注意事项所查询的表必须是已经存在的表，否则会出错。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

SV数据转换为Parquet数据。方案优势提升查询性能如果您在HDFS上拥有基于文本的数据文件或者表，而且正在使用Spark SQL对数据执行查询操作，那么推荐将文本数据文件转换为Parquet数据文件，转换需要时间，但查询性能的提升在某些情况下可能达到约30倍或更高。节省存储空间

 帮助中心 > 数据湖探索 DLI > 最佳实践

总条数： 803

上一页
1
...
4
5
6
...
41
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

SQL作业如何指定表的部分字段进行表数据的插入 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

DLI SDK功能矩阵 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

URL函数 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

权限管理 - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

套餐包计费 - 数据湖探索 DLI

权限管理概述 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

查询CSS表 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线