搜索_华为云

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

具体请参考《数据湖探索用户指南》。 MRS服务Spark组件的是建立在客户的购买MRS服务所分配的虚机上，用户可以根据实际需求调整及优化Spark服务，支持各种接口调用。 MRS的这种模式提供了更高的自由度和定制性，适合有大数据处理经验的用户使用。具体请参考《MapReduce服务开发指南》。父主题：

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
DLI请求条件 - 数据湖探索 DLI
DLI请求条件 - 数据湖探索 DLI

包括条件键和运算符，条件键表示策略语句的 Condition 元素，分为全局级条件键和服务级条件键。全局级条件键（前缀为g:）适用于所有操作，服务级条件键（前缀为服务缩写，如dli）仅适用于对应服务的操作。运算符与条件键一起使用，构成完整的条件判断语句。 DLI通过IAM预置了一

 帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
DLI对接LakeFormation - 数据湖探索 DLI

DLI对接LakeFormation功能的使用依赖于“湖仓构建”服务的上线状态，如需了解“湖仓构建”服务的上线范围请参考全球产品和服务。操作流程图1 操作流程约束限制在表1中提供了支持对接LakeFormation获取元数据的队列和引擎类型。查看队列的引擎类型和版本请参考查看队列的基本信息。表1

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
FileSystem结果表 - 数据湖探索 DLI

包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subtask，每个桶将至少包含一个Part文件。将根据配置的滚动策略来创建其他Part文件。对于Row Formats默认的策略是根据Part文件大小进行滚动，需要指

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
怎样查看DLI队列负载？ - 数据湖探索 DLI

怎样查看DLI队列负载？场景概述如果需要确认DLI队列的运行状态，决定是否运行更多的作业时需要查看队列负载。操作步骤在控制台搜索“云监控服务 CES”。图1 搜索CES 进入CES后，在页面左侧“云服务监控”列表中，单击“数据湖探索”。图2 云服务监控选择队列进行查看。图3 查看队列负载

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

返回文件/目录在集群中占用的实际空间，即它考虑了为集群设置的复制因子 quota 名称配额（名称配额是对当前目录树中的文件和目录名称数量的硬性限制） space_quota 空间配额（空间配额是对当前目录树中的文件所使用的字节数量的硬性限制）注意事项使用由DLI提供的元数据服务时，不支持本命令。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
Postgres CDC源表 - 数据湖探索 DLI

参考增强型跨源连接，根据PostgreSQL所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置PostgreSQL的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根据PostgreSQL的地址测试队列连通性。若能连通，则表示跨源已经绑定成功，否则表示未成功。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Hive方言 - 数据湖探索 DLI
Hive方言 - 数据湖探索 DLI

veCatalog 。 Hive方言只支持db.table这种两级的标识符，不支持带有Catalog名字的标识符。更多信息请参考Apache Flink Hive Read & Write。虽然所有Hive版本支持相同的语法，但是一些特定的功能对Hive版本有依赖，请参考Hive

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

使用Dockerfile将作业运行需要的依赖（文件、jar包或者软件）打包到镜像中，生成自定义镜像。将镜像发布到SWR（容器镜像服务）中。在DLI服务作业编辑页面选择自己生成的镜像，运行作业。查看作业执行情况。获取DLI基础镜像请根据队列的架构类型选择相同类型的基础镜像。查看队列的CPU架构类型请参考查看队列的基本信息。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
查询所有表（废弃） - 数据湖探索 DLI

database_name 是 String 查看表所在的数据库名称。表2 query参数参数名称是否必选参数类型说明 keyword 否 String 过滤表名称的关键词。 with-detail 否 Boolean 是否获取表的详细信息（所有者，size等）。默认值为“false”。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
查询所有弹性资源池 - 数据湖探索 DLI

创建弹性资源池的账号。 elastic_resource_pool_name 否 String 弹性资源池名称。 description 否 String 弹性资源池描述信息。 max_cu 否 Integer 配置的最大CU数。 min_cu 否 Integer 配置的最小CU数。

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
对象存储OBS结果表 - 数据湖探索 DLI

包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subtask，每个桶将至少包含一个Part文件。将根据配置的滚动策略来创建其他Part文件。对于Row Formats默认的策略是根据Part文件大小进行滚动，需要指

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
Spark作业使用咨询 - 数据湖探索 DLI

如何查看Spark内置依赖包的版本？ DLI内置依赖包是平台默认提供的依赖包，用户打包Spark或Flink jar作业jar包时，不需要额外上传这些依赖包，以免与平台内置依赖包冲突。查看Spark内置依赖包的版本请参考内置依赖包。资源包管理中的包是否能够下载? 资源包仅提供托管服务，不提供下载功能。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
ClickHouse结果表 - 数据湖探索 DLI

e和Kafka集群所在的虚拟私有云和子网分别创建跨源连接，并绑定所要使用的Flink作业队列。设置ClickHouse和Kafka集群安全组的入向规则，使其对当前将要使用的Flink作业队列网段放通。参考测试地址连通性根据ClickHouse和Kafka的地址测试队列连通性。若

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
从Kafka读取数据写入到RDS - 数据湖探索 DLI

步骤4：创建增强型跨源连接创建DLI连接Kafka的增强型跨源连接在Kafka管理控制台，选择“Kafka专享版”，单击对应的Kafka名称，进入到Kafka的基本信息页面。在“连接信息”中获取该Kafka的“内网连接地址”，在“基本信息”的“网络”中获取该实例的“虚拟私有云”和“子网”信息，方便后续操作步骤使用。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Hudi锁配置说明 - 数据湖探索 DLI

LakeCatMetastoreBasedLockProvider 关闭Hudi锁，或者使用其他的锁实现类时，存在数据丢失/异常的风险。在任何情况下，DLI不对因关闭Hudi锁，或者使用与元数据服务不匹配的锁实现类，而直接或间接导致的任何形式的损失或损害承担责任，包括但不限于商业利润损失、业务中断、数据丢失或其他财务损失。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

x支持自定义k8s的调度器。升级引擎版本后是否对作业有影响：功能增强，支持自定义调度器管理资源的分配和调度。 Spark将不可为null的模式转换为可空说明：在Spark 2.4.x版本中，当用户指定的schema包含不可为空的字段时，Spark会将这些不可为null的模式转换为可空的。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

x版本在SQL队列的差异对比 DLI整理了Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异，便于您了解Spark版本升级后SQL队列上运行的作业在适配新版本引擎时的影响。 histogram_numeric函数的返回值的类型不同说明： Spark SQL中的histo

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
更新SQL作业 - 数据湖探索 DLI
更新SQL作业 - 数据湖探索 DLI

当“checkpoint_enabled”为“true”时，该参数是用户授权保存快照的OBS桶名称。当“log_enabled” 为“true”时，该参数是用户授权保存作业日志的OBS桶名称。 log_enabled 否 Boolean 是否开启作业的日志上传到用户的OBS功能。默认为“false”。 smn_topic

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

projectId 是 - 用户访问的DLI服务使用的项目编号。 region 是 - 对接的DLI服务的Region。根据Spark应用程序的需要，修改“spark-defaults.conf”中的配置项，配置项兼容开源Spark配置项，参考开源Spark的配置项说明。使用Spark-submit提交Spark作业

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI

总条数： 847

上一页
1
...
12
13
14
...
43
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

DLI请求条件 - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

怎样查看DLI队列负载？ - 数据湖探索 DLI

SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

Postgres CDC源表 - 数据湖探索 DLI

Hive方言 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

查询所有表（废弃） - 数据湖探索 DLI

查询所有弹性资源池 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

Spark作业使用咨询 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

Hudi锁配置说明 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

更新SQL作业 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线