搜索_华为云

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？缺少pymysql模块，可以查看是否有对应的egg包，如果没有，在“程序包管理”页面上传pyFile。具体步骤参考如下：将egg包上传到指定的OBS桶路径下。登录DLI管理控制台，单击“数据管理

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 Spark作业不支持访问sftp，建议将文件数据上传到OBS，再通过Spark作业进行读取和分析。上传数据到OBS桶：通过OBS管理控制台或者使用命令行工具将存储在sftp中的文件数据上传到OBS桶中。 Spark读取OBS文件数据，详见使用Spark

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

地理大数据分析地理大数据分析地理大数据具有大数据的相关特征，数据体量巨大，例如，全球卫星遥感影像数据量达到PB级。数据种类多，有结构化的遥感影像栅格数据、矢量数据，非结构化的空间位置数据、三维建模数据；在大体量的地理大数据中，通过高效的挖掘工具或者挖掘方法实现价值提炼，是用户非常关注的话题。

帮助中心 > 数据湖探索 DLI > 产品介绍
Hudi存储结构 - 数据湖探索 DLI
Hudi存储结构 - 数据湖探索 DLI

Hudi存储结构 Hudi在写入数据时会根据设置的存储路径、表名、分区结构等属性生成Hudi表。在DLI环境，Hudi表的数据文件存储在OBS上，因此可以通过查看OBS文件检查。如下，展示了Hudi 多级分区COW表存储结构的示意。 hudi_table ├── .hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

x与Spark 3.3.x版本在SQL队列的差异对比 DLI整理了Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异，便于您了解Spark版本升级后SQL队列上运行的作业在适配新版本引擎时的影响。 histogram_numeric函数的返回值的类型不同说明： Spark

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ DLI和MRS都支持Spark组件，但在服务模式、接口方式、应用场景和性能特性上存在一些差异。 DLI服务的Spark组件是全托管式服务，用户对Spark组件不感知，仅仅可以使用该服务，且接口为封装式接口。 DLI的这种

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
在Flink SQL作业中创建表使用EL表达式，作业运行提示DLI.0005错误怎么办？ - 数据湖探索 DLI

在Flink SQL作业中创建表使用EL表达式，作业运行提示DLI.0005错误怎么办？问题现象 Flink SQL作业创建表时，表名使用EL表达式，运行作业时报如下错误： DLI.0005: AnalysisException: t_user_message_input_#{

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？问题现象手动在OBS表的分区目录下上传了分区数据，但是在SQL编辑器中查询该表新增的分区数据时却查询不到。解决方案手动添加分区数据后，需要刷新OBS表的元数据信息。具体操作如下： MSCK REPAIR TABLE

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？在Flink 作业中，可以使用CREATE语句来定义Source表和Sink表，并指定它们的连接器类型以及相关的属性。如果需要将数据写入到不同的Elasticsearch集群，您需要为每个集群配置不同的连接参数，并确保Fl

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
怎样判断当前DLI队列中的作业是否有积压？ - 数据湖探索 DLI

怎样判断当前DLI队列中的作业是否有积压？问题描述需要查看DLI的队列中作业状态为“提交中”和“运行中”的作业数，判断当前队列中的作业是否有积压。解决方案可以通过“云监控服务 CES”来查看DLI队列中不同状态的作业情况，具体操作步骤如下：在控制台搜索“云监控服务 CES”，进入云监控服务控制台。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
FileSytem结果表 - 数据湖探索 DLI

eckpoint恢复”。 checkpoint间隔设置需在输出文件实时性、文件大小和恢复时长之间进行权衡，比如10分钟。使用HDFS时需要绑定相应的跨源，并填写相应的主机信息。使用hdfs时，请配置主NameNode的所在节点信息。参数说明表1 参数说明参数是否必选说明

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
怎样管理在DLI上运行的作业 - 数据湖探索 DLI

怎样管理在DLI上运行的作业管理大量的DLI作业时您可以采用以下方案：作业分组：将几万个作业根据不同的类型分组，不同类型的作业通过不同的队列运行。创建IAM子用户或者创建IAM子用户，将不同类型的作业通过不同的用户执行。具体请参考《数据湖探索用户指南》。此外DLI还

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
DLI如何访问OBS桶中的数据 - 数据湖探索 DLI

DLI如何访问OBS桶中的数据创建OBS表。具体语法请参考《数据湖探索SQL语法参考》。添加分区。具体语法请参考《数据湖探索SQL语法参考》。往分区导入OBS桶中的数据。具体语法请参考《数据湖探索SQL语法参考》。查询数据。具体语法请参考《数据湖探索SQL语法参考》。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表如果需要关联OBS桶中嵌套的JSON格式数据，可以使用异步模式创建表。以下是一个示例的建表语句，展示了如何使用 JSON 格式选项来指定 OBS 中的路径： create table tb1 using json options(path

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ - 数据湖探索 DLI

跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ Spark中没有datetime数据类型，其使用的是TIMESTAMP类型。您可以通过函数进行转换。例如： select cast(create_date as string)

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库问题描述 Spark3.x的作业日志中提示找不到global_temp数据库。根因分析 global_temp数据库是Spark3.x默认内置的数据库，是Spark的全局临时视图。通常在Spark作业执

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
导出DLI表数据至OBS中 - 数据湖探索 DLI

单击需导出数据的表对应的数据库，进入该数据的“表管理”页面。在对应表（DLI表）的“操作”栏中选择“更多”中的“导出”，弹出“导出数据”页面。在“SQL编辑器”页面导出数据。在管理控制台左侧，单击“SQL编辑器”。在左侧导航栏选择“数据库”页签，鼠标左键单击需要导出数据的表对应的数据库名，进入“表”区域。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
使用DLI分析账单消费数据 - 数据湖探索 DLI

确需要使用多少CU时的作业，也可以提前购买对应的CU时套餐包，来降低使用成本。企业中的业务模式较多且经常变化，成本管理员通常并不能全面及时了解花销较大的业务在哪里，哪些是合理的，哪些是不合理的，通过在DLI中对费用明细进行分析，可以及时发现企业花销不合理的地方，及时进行成本管理，进一步降低企业使用华为云的成本。

帮助中心 > 数据湖探索 DLI > 最佳实践
全局变量的使用中，一个子账号是否可以使用其他子账号创建的全局变量 - 数据湖探索 DLI

如果同账号同项目下存在多个相同名称的全局变量时，需要将多余相同名称的全局变量删除，保证同账号同项目下唯一，此时具备该全局变量修改权限的用户均可以修改对应的变量值。如果同账号同项目下存在多个相同名称的全局变量，优先删除用户自建的。如果仅存在唯一名称的全局变量，则具备删除权限即的用户均可删除该全局变量。父主题：

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

基准测试的度量单位是每小时执行的查询数( QphH@size)，其中“H”表示每小时系统执行复杂查询的平均次数，“size”表示数据库规模的大小，能够反映出系统在处理查询时的能力。TPC-H 是根据真实的生产运行环境来建模的,这使得它可以评估一些其他测试所不能评估的关键性能参数。总而言之，TPC组织颁布的TPC-H

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板

总条数： 1001

上一页
1
2
3
4
5
...
51
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

Hudi存储结构 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

在Flink SQL作业中创建表使用EL表达式，作业运行提示DLI.0005错误怎么办？ - 数据湖探索 DLI

手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

怎样判断当前DLI队列中的作业是否有积压？ - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

怎样管理在DLI上运行的作业 - 数据湖探索 DLI

DLI如何访问OBS桶中的数据 - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

全局变量的使用中，一个子账号是否可以使用其他子账号创建的全局变量 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线