搜索_华为云

Spark SQL常用配置项说明 - 数据湖探索 DLI

Spark SQL常用配置项说明本章节为您介绍DLI 批作业SQL语法的常用配置项。表1 常用配置项名称默认值描述 spark.sql.files.maxRecordsPerFile 0 要写入单个文件的最大记录数。如果该值为零或为负，则没有限制。 spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Elasticsearch结果表 - 数据湖探索 DLI

仅在使用CSS类型的跨源认证时配置该参数。 es_auth_name和pwd_auth_name只能配置一个。 es_auth_name 否无 String CSS类型的跨源认证的名称。仅在使用CSS类型的跨源认证时配置该参数。 es_auth_name和pwd_auth_name只能配置一个。示例

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

endpoint指DLI的域名。projectId指项目ID。在地区和终端节点获取DLI对应的Endpoint，从华为云“用户名”>“我的凭证”页面获取项目编号。 “？”后面接其他配置项，每个配置项以“key=value”的形式列出，配置项之间以“;”隔开，这些配置项也可以通过Info对象传入。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
Elasticsearch结果表 - 数据湖探索 DLI

password”参数同时配置。使用账号密码参数时，创建的云搜索服务集群必须开启安全模式并且关闭https。 connector.password 否 Elasticsearch所在集群的密码。该密码参数需和“connector.username”参数同时配置。示例 create

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
导出查询结果 - 数据湖探索 DLI

o格式进行存储。语法格式 1 2 3 4 INSERT OVERWRITE DIRECTORY path USING file_format [OPTIONS(key1=value1)] select_statement; 关键字 USING：指定所存储格式。 O

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

如果选择Spark版本为3.3.1时，支持在Spark参数（--conf)配置计算资源规格参数，且conf的配置优先级高于高级配置指定的值。参数对应关系请参考表5。在Spark参数（--conf)配置计算资源规格参数时，可以配置单位 M/G/K，不配置时候默认单位为byte。表5 控制台计算资源规

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
区域和可用区 - 数据湖探索 DLI

维度划分，同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region，通用Region指面向公共租户提供通用云服务的Region；专属Region指只承载同一类业务或只面向特定租户提供业务服务的专用Region。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？缺少pymysql模块，可以查看是否有对应的egg包，如果没有，在“程序包管理”页面上传pyFile。具体步骤参考如下：将egg包上传到指定的OBS桶路径下。登录DLI管理控制台，单击“数据管理

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
配置DLI与数据源网络连通（增强型跨源连接） - 数据湖探索 DLI

配置DLI与数据源网络连通（增强型跨源连接）增强型跨源连接概述创建增强型跨源连接建立DLI与共享VPC中资源的网络连接 DLI常用跨源分析开发方式父主题：配置DLI读写外部数据源数据

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
在DLI控制台配置表权限 - 数据湖探索 DLI

为新用户或项目赋予权限，新用户或项目指之前不具备此表任何权限的用户或项目。单击表权限管理页面右上角的“授权”按钮。在弹出的“授权”对话框中选择相应的权限。 DLI表具体权限说明请参考表1。图2 DLI表用户授权图3 DLI表项目授权表1 参数配置参数描述授权对象选择“用户授权”或“项目授权”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

DLI提供标准SQL接口，用户仅需使用SQL便可实现海量数据查询分析。SQL语法全兼容标准ANSI SQL 2003。存算分离 DLI解耦计算和存储负载，存算分离架构，存储资源和计算资源按需灵活配置，提高了资源利用率，降低了成本。企业级多租户支持计算资源按租户隔离，数据权限控制到队列、作业，帮助企业实现部门间的数据共享和权限管理。

帮助中心 > 数据湖探索 DLI > 产品介绍
配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

x-dependencies.jar。 DBeaver客户端安装包： DBeaver官网提供了针对不同操作系统的客户端安装包，单击下载DBeaver访问DBeaver官网下载系统对应的DBeaver客户端安装包并完成安装。推荐使用24.0.3版本的DBeaver。连接信息：表1

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
创建Flink OpenSource SQL作业 - 数据湖探索 DLI

和“保存”。 “脏数据策略”选择“保存”时，配置“脏数据转储地址”。单击地址框选择保存脏数据的OBS路径。仅DIS数据源支持配置脏数据策略。（可选）根据需要设置自定义配置。相关参数详情可以参考Flink作业调优。图3 自定义配置单击“保存”，保存作业和相关参数。单击“启

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
最新动态 - 数据湖探索 DLI
最新动态 - 数据湖探索 DLI

用户可以通过DLI内置的TPC-H测试套件进行简单高效的交互式查询，无需用户上传数据，即可以体验DLI的核心功能。商用 TPC-H使用指导 2 支持存储量套餐包 DLI增加存储量套餐包，降低数据存储在DLI中的费用。商用产品价格详情 3 支持计算队列定时扩缩容 DLI提供了队列规格变更定时任务功能。用户可以根

 帮助中心 > 数据湖探索 DLI > 最新动态
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

池内的不同队列资源可以共享，并可以根据队列资源负载配置策略进行分时弹性扩缩容，满足不同的业务需求。 DLI存储资源 DLI存储资源是DLI服务内部存储的资源，用于存储数据库和DLI表，是向DLI导入数据的必备条件，体现用户数据存储在DLI中的数据量。弹性资源池的实际CUs、已使用CUs、CU范围、规格（包周期CU）

帮助中心 > 数据湖探索 DLI > 产品介绍
DLI常用跨源分析开发方式 - 数据湖探索 DLI

创建RDS关联表插入数据查询数据 scala样例代码 pyspark样例代码 java样例代码 Postgres CDC源表 - 父主题：配置DLI与数据源网络连通（增强型跨源连接）

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

资源，并使用DLI访问资源。前提条件账号A已配置DLI云服务委托，且委托需包含DLI Datasource Connections Agency Access，具备访问和使用VPC、子网、路由、对等连接的权限。详细操作请参考配置DLI云服务委托权限。作为资源所有者的账号A已

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
怎样查看我的配额 - 数据湖探索 DLI

我的配额”。系统进入“服务配额”页面。图1 我的配额您可以在“服务配额”页面，查看各项资源的总配额及使用情况。如果当前配额不能满足业务要求，请参考后续操作，申请扩大配额。父主题： DLI资源配额类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI资源配额类
Kafka Sink配置发送失败重试机制 - 数据湖探索 DLI

Kafka Sink配置发送失败重试机制问题描述用户执行Flink Opensource SQL, 采用Flink 1.10版本。Flink Sink写Kafka报错后作业失败： Caused by: org.apache.kafka.common.errors.NetworkException:

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
配置多版本过期数据回收站 - 数据湖探索 DLI

配置多版本过期数据回收站功能描述在DLI数据多版本功能开启后，过期的备份数据后续在执行insert overwrite或者truncate语句时会被系统直接清理。OBS并行文件系统可以通过配置回收站加速删除操作过期的备份数据。通过在表属性添加配置“dli.multi.version

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据

总条数： 671

上一页
1
2
3
4
5
...
34
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark SQL常用配置项说明 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

区域和可用区 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

配置DLI与数据源网络连通（增强型跨源连接） - 数据湖探索 DLI

在DLI控制台配置表权限 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

创建Flink OpenSource SQL作业 - 数据湖探索 DLI

最新动态 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

DLI常用跨源分析开发方式 - 数据湖探索 DLI

建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

怎样查看我的配额 - 数据湖探索 DLI

Kafka Sink配置发送失败重试机制 - 数据湖探索 DLI

配置多版本过期数据回收站 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线