搜索_华为云

Flink作业咨询类 - 数据湖探索 DLI

Flink作业怎样设置“异常自动重启”？ Flink作业如何保存作业日志？ Flink作业管理界面对用户进行授权时提示用户不存在怎么办？手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ DLI使用SMN主题，提示SMN主题不存在，怎么处理？父主题： Flink作业类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

进行探索。您可以使用本文档提供API对数据湖探索进行相关操作，包括队列、SQL作业、Flink作业、Spark作业和跨源连接等等。支持的全部操作请参见API概览。在调用数据湖探索API之前，请确保已经充分了解数据湖探索相关概念。详细信息请参见产品介绍。父主题： API使用前必读

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
Hudi Clustering操作说明 - 数据湖探索 DLI

Clustering的排序列不允许值存在null，这是Spark RDD的限制。当target.file.max.bytes的值较大时，启动Clustering执行需要提高--executor-memory，否则会导致executor内存溢出。 Clean不支持清理Clustering失败后的残留文件。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Flink Jar作业类 - 数据湖探索 DLI

Jar作业类 Flink Jar作业是否支持上传配置文件，要如何操作？ Flink Jar 包冲突，导致作业提交失败 Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 Flink Jar作业运行报错，报错信息为Authentication failed Flink Jar作

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

String 在 "specific-offset" 启动模式下，启动位点的 binlog 文件名。 scan.startup.specific-offset.pos 否无 Long 在 "specific-offset" 启动模式下，启动位点的 binlog 文件位置。 scan.startup

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
DLI内置依赖包 - 数据湖探索 DLI

jar作业jar包时，不需要额外上传这些依赖包，以免与平台内置依赖包冲突。 Spark 3.1.1 依赖包表1 Spark 3.1.1 依赖包依赖包名称 accessors-smart-1.2.jar hive-shims-scheduler-3.1.0-h0.cbu.mrs.321.r10.jar

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

kyuubi.engine.dli.jdbc.connection.ak AK/SK认证密钥。如果使用AK/SK认证方式。是 accesskey=your-access-key kyuubi.engine.dli.jdbc.connection.sk DLI的区域名称和服务名称。如果使用AK/SK认证方式时配置。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

为了避免因业务修改等需要，手动重启作业后，不丢失数据：对于无内部状态的作业，您可以配置kafka数据源的启动时间或者消费位点到作业停止之前。对于有内部状态的作业，您可以在停止作业时，勾选“触发保存点”。成功后，再次启动作业时，开启“恢复保存点”，作业将从选择的savepoint文件中恢复消费位点及状态。同时，由于Flink

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
怎样管理在DLI上运行的作业 - 数据湖探索 DLI

或者创建IAM子用户，将不同类型的作业通过不同的用户执行。具体请参考《数据湖探索用户指南》。此外DLI还提供了作业管理功能，包括编辑、启动、停止、删除作业，以及导出和导入作业。您可以利用这些功能来定期维护和管理作业。父主题： DLI产品咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
导入数据（废弃） - 数据湖探索 DLI

Pacific Standard Time; PST; GMT-08:00 响应消息表4 响应参数参数名称是否必选参数类型说明 is_success 否 Boolean 请求发送是否成功。“true”表示请求发送成功。 message 否 String 系统提示信息，执行成功时，信息可能为空。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

单击“下一步”配置任务参数，一般情况下全部保持默认即可。该步骤用户可以配置如下可选功能：作业失败重试：如果作业执行失败，可选择是否自动重试，这里保持默认值“不重试”。作业分组：选择作业所属的分组，默认分组为“DEFAULT”。在CDM“作业管理”界面，支持作业分组显示、按组批量启动作业、按分组导出作业等操作。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
创建SQL作业模板 - 数据湖探索 DLI

在“SQL模板”页面右上角，单击“设置”可以选择是否按照分组展示模板。如果选择“按分组展示”，有以下三种展示方式：展开第一个分组、全部展开、全部收起。创建SQL作业模板创建模板的操作入口有两个，分别在“作业模板”和“SQL编辑器”页面。在“作业模板”页面创建模板。在管理

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

数据库即按照数据结构来组织、存储和管理数据的仓库。DLI服务管理权限的基础单元是数据库，赋权以数据库为单位。在DLI中，表和数据库是定义底层数据的元数据容器。表中的元数据让DLI知道数据所在的位置，并指定了数据的结构，例如列名称、数据类型和表名称。数据库是表的逻辑分组。 OBS表、DLI表、CloudTable表

 帮助中心 > 数据湖探索 DLI > 产品介绍
典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

单击“下一步”配置任务参数，一般情况下全部保持默认即可。该步骤用户可以配置如下可选功能：作业失败重试：如果作业执行失败，可选择是否自动重试，这里保持默认值“不重试”。作业分组：选择作业所属的分组，默认分组为“DEFAULT”。在CDM“作业管理”界面，支持作业分组显示、按组批量启动作业、按分组导出作业等操作。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Flink作业运行异常，如何定位 - 数据湖探索 DLI

否，则运行日志不会转储OBS桶，需要先执行2保存作业运行日志。在作业运行界面勾选“保存作业日志”，在“OBS桶”参数选择存储运行日志的OBS桶。单击“启动”重新运行作业。作业重新运行完成后再执行3及后续步骤。在Flink作业列表单击对应作业名称，进入作业详情页面，选择“运行日志”页签。单

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

单击“下一步”配置任务参数，一般情况下全部保持默认即可。该步骤用户可以配置如下可选功能：作业失败重试：如果作业执行失败，可选择是否自动重试，这里保持默认值“不重试”。作业分组：选择作业所属的分组，默认分组为“DEFAULT”。在CDM“作业管理”界面，支持作业分组显示、按组批量启动作业、按分组导出作业等操作。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

下：通过OBS下载数据文件。通过文本编辑器打开数据文件，发现数据量缺失。根据该验证方式，初步定位是因为文件数据量较大，文本编辑器无法全部读取。通过执行查询语句，查询OBS数据进一步进行确认，查询结果确认数据量正确。因此，该问题为验证方式不正确造成。参考信息插入数据的

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
count - 数据湖探索 DLI
count - 数据湖探索 DLI

<colname>) 参数说明表1 参数说明参数是否必选说明 distinct或all 否表示在计数时是否去除重复记录，默认为all，即计算全部记录。如果指定distinct，则只计算唯一值数量。 colname 是列值可以为任意类型。 colname可以为*，即count(*)，返回所有行数。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

请参考表2。作业特性 “所属队列”选择CCE队列时，设置该参数。表示用户作业使用的Spark镜像类型，具体说明如下：基础型：DLI提供的基础镜像，运行非AI相关作业时选择“基础型”。自定义镜像：自定义的Spark镜像，需要选择“容器镜像服务”中设置的镜像名称及版本。依赖jar包（--jars）

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
SQL作业访问外表报错：DLI.0001: org.apache.hadoop.security.AccessControlException: verifyBucketExists on {{桶名}}: status [403] - 数据湖探索 DLI

security.AccessControlException: verifyBucketExists on {{桶名}}: status [403] 问题现象 SQL作业访问外表报错：DLI.0001: org.apache.hadoop.security.AccessControlException:

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类

总条数： 924

上一页
1
2
3
4
5
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink作业咨询类 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

Flink Jar作业类 - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

DLI内置依赖包 - 数据湖探索 DLI

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

怎样管理在DLI上运行的作业 - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

创建SQL作业模板 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

Flink作业运行异常，如何定位 - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

count - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

SQL作业访问外表报错：DLI.0001: org.apache.hadoop.security.AccessControlException: verifyBucketExists on {{桶名}}: status [403] - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线