搜索_华为云

DLI对接LakeFormation - 数据湖探索 DLI

选择该参数后系统将自动为您的作业添加以下配置项用于连接Lakeformation默认实例下的数据目录。 spark.hadoop.lakecat.catalogname.default=lfcatalog “数据目录名称”还支持在Spark（--conf）参数中配置，且系统优先以Spark（--conf）中配置信息为准。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
查询SQL作业日志 - 数据湖探索 DLI

前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
查询Spark作业日志 - 数据湖探索 DLI

前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
删除数据库 - 数据湖探索 DLI
删除数据库 - 数据湖探索 DLI

EXISTS] db_name [RESTRICT|CASCADE]; 关键字 IF EXISTS：所需删除的数据库不存在时使用，可避免系统报错。注意事项 DATABASE与SCHEMA两者没有区别，可替换使用，建议使用DATABASE。 RESTRICT表示如果该datab

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
查看指定数据库 - 数据湖探索 DLI

db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。注意事项如果所要查看的数据库不存在，则系统报错。示例已参考示例中描述创建对应的数据库，如testdb。查看testdb数据库的相关信息。 1 DESCRIBE DATABASE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

则停止存储数据，以batch.size.entries为准，提交该批次的数据。 es.nodes.wan.only 是否仅通过域名访问es节点，默认为false。使用经典型跨源的连接地址作为es.nodes时，该参数需要配置为true；使用css服务提供的原始内网IP地址作为es

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

配置样例计费模式选择弹性资源池计费模式。按需计费区域选择弹性资源池所在区域。华东-上海二项目每个区域默认对应一个项目，由系统预置。系统默认项目名称弹性资源池名称。 dli_resource_pool 规格选择弹性资源池规格。标准版 CU范围弹性资源池最大最小CU范围。

帮助中心 > 数据湖探索 DLI > 快速入门
身份认证与访问控制 - 数据湖探索 DLI

业等）。 DLI支持的授权项请参见权限管理概述。如表3-1所示，包括了DLI的所有系统权限。系统角色/策略名称描述类别授权方式 DLI FullAccess 数据湖探索所有权限。系统策略具体的授权方式请参考创建IAM用户并授权使用DLI以及《如何创建子用户》和《如何修改用户策略》。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
更新SQL作业 - 数据湖探索 DLI
更新SQL作业 - 数据湖探索 DLI

否 String 作业运行模式： shared_cluster：共享。 exclusive_cluster：独享。 edge_node：边缘节点。默认值为“shared_cluster”。 cu_number 否 Integer 用户为作业选择的CU数量。默认值为“2”。 parallel_number

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
设置多版本备份数据保留周期 - 数据湖探索 DLI

设置多版本备份数据保留周期功能描述在DLI数据多版本功能开启后，备份数据默认保留7天，您可以通过配置系统参数“dli.multi.version.retention.days”调整保留周期。保留周期外的多版本数据后续在执行insert overwrite或者truncate语

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
Doris源表 - 数据湖探索 DLI
Doris源表 - 数据湖探索 DLI

如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。如果使用MRS Doris，请在增强型跨源的主机信息中添加MRS集群所有节点的主机ip信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。集群未启用Kerberos认证（普通模式）使用ad

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
Upsert Kafka - 数据湖探索 DLI
Upsert Kafka - 数据湖探索 DLI

Upsert Kafka 功能描述 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。Upsert Kafka 连接器支持以upsert方式从Kafka topic中读取数据并将数据写入Kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
DLI委托概述 - 数据湖探索 DLI
DLI委托概述 - 数据湖探索 DLI

dli_management_agency 系统默认委托 DLI系统委托，用于将操作权限委托给DLI服务，让DLI服务以您的身份使用其他云服务，代替您进行一些资源运维工作。该委托包含跨源操作、消息通知、用户授权操作所需的权限。详细委托包含的权限请参考表2 dli_data_clean_agency 系统默认委托，需用户自行授权

 帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
查询Flink作业日志 - 数据湖探索 DLI

前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
认证鉴权 - 数据湖探索 DLI
认证鉴权 - 数据湖探索 DLI

ID)/SK(Secret Access Key)加密调用请求。推荐使用AK/SK认证，其安全性比Token认证更高。 Token认证 Token在计算机系统中代表令牌（临时）的意思，拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头，从而通过身份认证，获得操作API的权限。

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
SMN结果表 - 数据湖探索 DLI
SMN结果表 - 数据湖探索 DLI

消息通知服务（Simple Message Notification，简称SMN）为DLI提供可靠的、可扩展的、海量的消息处理服务，它大大简化系统耦合，能够根据用户的需求，向订阅终端主动推送消息。可用于连接云服务、向多个协议推送消息以及集成在产生或使用通知的任何其他应用程序等场景。S

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

配置样例计费模式选择弹性资源池计费模式。按需计费区域选择弹性资源池所在区域。华东-上海二项目每个区域默认对应一个项目，由系统预置。系统默认项目名称弹性资源池名称。 dli_resource_pool 规格选择弹性资源池规格。标准版 CU范围弹性资源池最大最小CU范围。

帮助中心 > 数据湖探索 DLI > 快速入门
Upsert Kafka结果表 - 数据湖探索 DLI

Upsert Kafka结果表功能描述 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。DLI将Flink作业的输出数据以upsert的模式输出到Kafka中。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
管理Spark作业 - 数据湖探索 DLI
管理Spark作业 - 数据湖探索 DLI

作业管理页面。Spark作业管理页面显示所有的Spark作业，作业数量较多时，系统分页显示，您可以查看任何状态下的作业。表1 作业管理参数参数参数说明作业ID 所提交Spark作业的ID，由系统默认生成。名称所提交Spark作业的名称。队列所提交Spark作业所在的队列。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

区列的字段数据。分区表查询时需要指定分区字段，导致查询不到表数据。问题根因 DLI分区内表在导入数据时，如果文件数据没有包含分区字段，则系统会默认指定分区值“__HIVE_DEFAULT_PARTITION__”，当前Spark判断分区为空时，则会直接返回null，不返回具体的数据。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类

总条数： 521

上一页
1
...
15
16
17
...
27
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI对接LakeFormation - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

删除数据库 - 数据湖探索 DLI

查看指定数据库 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

身份认证与访问控制 - 数据湖探索 DLI

更新SQL作业 - 数据湖探索 DLI

设置多版本备份数据保留周期 - 数据湖探索 DLI

Doris源表 - 数据湖探索 DLI

Upsert Kafka - 数据湖探索 DLI

DLI委托概述 - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

认证鉴权 - 数据湖探索 DLI

SMN结果表 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

管理Spark作业 - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线