搜索_华为云

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

分别上传Jar包到OBS和DLI下。登录OBS控制台，将生成的Jar包文件上传到OBS路径下。将Jar包文件上传到DLI的程序包管理中，方便后续统一管理。登录DLI管理控制台，单击“数据管理 > 程序包管理”。在“程序包管理”页面，单击右上角的“创建程序包”。在“创建程序包”对话框，配置以下参数。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
使用前必读 - 数据湖探索 DLI
使用前必读 - 数据湖探索 DLI

HetuEngine是华为推出的高性能交互式SQL分析及数据虚拟化引擎，能够与大数据生态无缝融合，实现海量数据的秒级交互式查询。 DLI+HetuEngine能够快速处理大规模数据集的查询请求，迅速和高效从大数据中提取信息，极大地简化了数据的管理和分析流程，提升大数据环境下的索引和查询性能。 TB级数据秒级响应：

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
安全 - 数据湖探索 DLI
安全 - 数据湖探索 DLI

安全责任共担资产识别与管理身份认证与访问控制数据保护技术审计与日志服务韧性监控安全风险故障恢复更新管理认证证书

 帮助中心 > 数据湖探索 DLI > 产品介绍
下载并安装JDBC驱动包 - 数据湖探索 DLI

条件：在DLI管理控制台“全局配置 > 工程配置”中完成作业桶的配置。 2024年5月起，新用户可以直接使用DLI服务的“查询结果写入桶”功能，无需开通白名单。对于2024年5月之前开通并使用DLI服务的用户，如需使用“查询结果写入桶”功能，必须提交工单申请加入白名单。方式

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
DLI SDK简介 - 数据湖探索 DLI
DLI SDK简介 - 数据湖探索 DLI

Development Kit）是对DLI服务提供的REST API进行的作业提交的封装，以简化用户的开发工作。用户直接调用DLI SDK提供的接口函数即可实现使用提交DLI SQL和DLI Spark作业。 DLI支持的SDK分为SDK V3和DLI服务自行开发的SDK。（推荐）DLI SDK

帮助中心 > 数据湖探索 DLI > SDK参考
跨源认证权限管理 - 数据湖探索 DLI

赋权：当前用户可将跨源认证的权限赋予其他用户。回收：当前用户可回收其他用户具备的该跨源认证的权限，但不能回收该跨源认证所有者的权限。查看其他用户具备的权限：当前用户可查看其他用户具备的该跨源认证的权限。修改当前用户的权限登录DLI管理控制台。单击“跨源管理 > 跨源认证”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
生成Flink SQL作业的静态流图 - 数据湖探索 DLI

是在作业编辑页面配置的作业占用资源总CU数，需配置与实际占用资源一致，作业实际占用资源根据算子并行数按需申请。 cu_number = 管理单元 + (算子总并行数 / 单TM Slot数) * 单TM所占CU数 manager_cu_number 否 Integer 管理单元CU数。 parallel_number

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库问题描述 Spark3.x的作业日志中提示找不到global_temp数据库。根因分析 global_temp数据库是Spark3.x默认内置的数据库，是Spark的全局临时视图。通常在Spark作业执

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
禁止或恢复表的生命周期 - 数据湖探索 DLI

disable 否禁止表或指定分区的生命周期功能。禁止表本身及其所有分区被生命周期回收，优先级高于恢复表分区生命周期。即当使用禁止表或指定分区的生命周期功能时，设置待禁止或恢复生命周期的表的分区信息是无效的。禁止表的生命周期功能后，表的生命周期配置及其分区的enable和disable标记会被保留。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
计费样例 - 数据湖探索 DLI
计费样例 - 数据湖探索 DLI

示例价格仅供参考，实际计算请以DLI产品价格详情中的信息为准。更多示例参考DLI产品价格详情。计费构成分析基于此案例，可详细计算出按需计费和包年/包月两种不同的计费模式的消费情况。此案例中的单价仅为示例，且计算出的费用为估算值。单价的变动和实际场景中计算出来的费用可能会有偏差。请以华为云官网发布的数据为准。计费模式

 帮助中心 > 数据湖探索 DLI > 计费说明
怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

登录DLI管理控制台。选择“作业管理 > Spark作业”，在作业列表中选择待操作的Spark Jar作业。单击操作列的“编辑”，进入作业编辑页面。在参数配置区域，选择新的Spark版本。使用Spark3.3以上版本的引擎执行作业时，需要Spark参数中配置自定义的委托名称

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

certificate 否无 String Elasticsearch集群的证书在OBS中的位置。仅在开启安全模式，且开启https下需要配置该参数。请先在CSS管理控制台下载证书后将证书上传至OBS，该参数配置的是OBS地址。例如：obs://bucket/path/CloudSearchService

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
创建表时指定表的生命周期 - 数据湖探索 DLI

创建表时指定表的生命周期功能描述 DLI提供了表生命周期管理功能，在创建表时指定表的生命周期。DLI会根据每张表的最后修改时间和表的生命周期来判断是否要回收此表。通过设置表的生命周期，可以帮助您更好的管理数目众多的表，自动清理长期不再使用的数据表，简化数据表的回收流程。同时支持数据恢复设置，避免因误操作丢失数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

Kafka结果表功能描述 DLI将Flink作业的输出数据输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Upsert Kafka结果表 - 数据湖探索 DLI

Kafka结果表功能描述 DLI将Flink作业的输出数据以upsert的模式输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
查看表的用户权限（废弃） - 数据湖探索 DLI

项目编号，用于资源隔离。获取方式请参考获取项目ID。 database_name 是 String 被查询的表所在的数据库名称。 table_name 是 String 被查询的表名称。 user_name 是 String 被查询的用户名称。请求消息无请求参数。响应消息表2 响应参数参数名称是否必选

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）
Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

Flink Jar作业上传配置文件操作流程自定义(JAR)作业支持上传配置文件。将配置文件通过程序包管理上传到DLI；在Flink jar作业的其他依赖文件参数中，选择创建的DLI程序包；在代码中通过ClassName.class.getClassLoader().getR

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境添加Python3包后，找不到指定的Python环境。可以通过在conf文件中，设置spark.yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
ClickHouse - 数据湖探索 DLI
ClickHouse - 数据湖探索 DLI

ClickHouseBalancer实例的IP地址：登录MRS管理控制台，选择“集群名称 > 组件管理 > ClickHouse > 实例”，获取ClickHouseBalancer实例的业务IP。 ClickHouseBalancer端口：登录MRS管理控制台，选择“集群名称 > 组件管理 > ClickHouse

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
创建DLI表关联CSS - 数据湖探索 DLI

X版本时，该参数只需要填写index即可。 pushdown CSS的下压功能是否开启，默认为“true”。包含大量IO传输的表在有where过滤条件的情况下能够开启pushdown降低IO。 strict CSS的下压是否是严格的，默认为“false”。精确匹配的场景下比pushdown降低更多IO。 batch

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表

总条数： 847

上一页
1
2
3
4
5
...
43
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

使用前必读 - 数据湖探索 DLI

安全 - 数据湖探索 DLI

下载并安装JDBC驱动包 - 数据湖探索 DLI

DLI SDK简介 - 数据湖探索 DLI

跨源认证权限管理 - 数据湖探索 DLI

生成Flink SQL作业的静态流图 - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

禁止或恢复表的生命周期 - 数据湖探索 DLI

计费样例 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

Elasticsearch - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

查看表的用户权限（废弃） - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

ClickHouse - 数据湖探索 DLI

创建DLI表关联CSS - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线