搜索_华为云

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 DLI Flink作业提交或运行失败时，对应生成的作业日志保存方式，包含以下三种情况：提交失败，只会在submit-client下生成提交日志。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Hive维表 - 数据湖探索 DLI
Hive维表 - 数据湖探索 DLI

e temporal join始终会加入最新版本的时态表。Flink支持分区表和 Hive非分区表的临时连接，对于分区表，Flink 支持自动跟踪Hive表的最新分区。详情可参考：Apache Flink Hive Read & Write 注意事项 Flink目前不支持与Hiv

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？数据湖探索（DLI）服务对于PySpark是原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Py

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
运行Spark作业报java.lang.AbstractMethodError - 数据湖探索 DLI

运行Spark作业报java.lang.AbstractMethodError Spark 2.3对内部接口Logging做了行为变更，如果用户代码里直接继承了该Logging，且编译时使用的是低版本的Spark，那么应用程序在Spark 2.3的环境中运行将会报java.lang

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
提交SQL作业（推荐） - 数据湖探索 DLI

该配置项用于启用或禁用动态分区修剪。在执行SQL查询时，动态分区修剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
使用DLI Flink SQL进行电商实时业务数据分析 - 数据湖探索 DLI

使用DLI Flink SQL进行电商实时业务数据分析应用场景当前线上购物无疑是最火热的购物方式，而电商平台则又可以以多种方式接入，例如通过web方式访问、通过app的方式访问、通过微信小程序的方式访问等等。而电商平台则需要每天统计各平台的实时访问数据量、订单数、访问人数等等

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析
对已创建的上传作业进行鉴权（废弃） - 数据湖探索 DLI

对已创建的上传作业进行鉴权（废弃）功能介绍该API用于检查已创建的上传作业是否合法，并授权合法作业上传数据至DLI。当前接口已废弃，不推荐使用。 URI URI格式： POST /v1.0/{project_id}/uploader/authentication 参数说明表1

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 上传数据相关API（废弃）
迁移DWS数据至DLI - 数据湖探索 DLI

详细的参数配置可以参考：CDM配置DLI目的端参数。单击“下一步”，进入到字段映射界面，CDM会自动匹配源和目的字段。如果字段映射顺序不匹配，可通过拖拽字段调整。如果选择在目的端自动创建类型，这里还需要配置每个类型的字段类型、字段名称。 CDM支持迁移过程中转换字段内容，详细请参见字段转换。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据迁移
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？什么是数据倾斜？数据倾斜是在SQL作业执行中常见的问题，当数据分布不均匀的情况下，一部分计算节点处理的数据量远大于其他节点，从而影响整个计算过程的处理效率。例如观察到SQL执行时间较长，进入SparkUI查看对应SQL的执行状态，如图1所

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Python SDK环境配置 - 数据湖探索 DLI

zip”解压目录下的windows目录。例如：“D:\tmp\dli-sdk-python-1.0.8”。执行如下命令安装DLI服务Python SDK，安装过程中会自动下载第三方依赖库。 python setup.py install 运行结果参见图2所示。图2 安装Python SDK Python开发环境配置

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

目录，该目录在bucketName指定的桶下。如果该目录不存在，程序会自动创建。 localFilePath 是 - 存放Spark程序中使用的jar包、Python程序文件、配置文件等的本地目录。程序会自动将Spark程序依赖到的相关文件上传的OBS路径，并加载到DLI服务端资源包。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
永洪BI制作图表 - 数据湖探索 DLI

图表 ”，将其拖入编辑区域，请参见图4。图4 新建图表选择“name”作为X变量，“age”作为Y变量，将其直接拖入对应的位置，系统将自动生成对应的柱状图，请参见图5。图5 生成图表在“制作图表”页面工具栏中单击“保存”，完成制作图表。父主题：永洪BI对接DLI提交Spark作业

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析 > 永洪BI对接DLI提交Spark作业
典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

典型场景示例：创建弹性资源池并运行作业本章节主要介绍从创建弹性资源池、创建增强型跨源、添加队列到弹性资源池并运行作业的一个完整流程，帮助您更好、更方便的使用弹性资源池。图1 创建弹性资源池运行作业流程图表1 创建新队列时绑定弹性资源池流程说明阶段说明参考文档步骤一：创建弹性资源池

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

头的目录”。说明：如果同时勾选了“开启Checkpoint”和“保存作业日志”，OBS授权一次即可。异常自动重启设置是否启动异常自动重启功能，当作业异常时将自动重启并恢复作业。勾选后需配置下列参数： “异常重试最大次数”：配置异常重试最大次数。单位为“次/小时”。无限：无限次重试。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink OpenSource SQL作业开发指南
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

每次从数据库拉取数据的行数。若指定为0，则会忽略sql hint。 scan.auto-commit 否 true Boolean 是否设置自动提交，以确定事务中的每个statement是否自动提交 pwd_auth_name 否无 String DLI侧创建的Password类型的跨源认证名称。用户若配

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
按需计费的弹性资源池，如果没提交作业运行就不计费？ - 数据湖探索 DLI

按需计费的弹性资源池，如果没提交作业运行就不计费？按需计费的弹性资源池默认勾选专属资源模式，自创建起按自然小时收费。无作业运行仍正常收费。按实际CU进行计费，秒级计费，按小时结算。按需弹性资源池创建成功一小时后方可删除。父主题：计费相关问题

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

每次从数据库拉取数据的行数。若指定为0，则会忽略sql hint。 scan.auto-commit 否 true Boolean 是否设置自动提交，以确定事务中的每个statement是否自动提交 pwd_auth_name 否无 String DLI侧创建的Password类型的跨源认证名称。用户若配

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

详细的参数配置可以参考：CDM配置DLI目的端参数。单击“下一步”，进入到字段映射界面，CDM会自动匹配源和目的字段。如果字段映射顺序不匹配，可通过拖拽字段调整。如果选择在目的端自动创建类型，这里还需要配置每个类型的字段类型、字段名称。 CDM支持迁移过程中转换字段内容，详细请参见字段转换。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
查询Spark作业日志 - 数据湖探索 DLI

查询Spark作业日志登录DLI管理控制台，单击“作业管理 > Spark作业”。选择待查询的Spark作业，单击操作列的“更多 > 归档日志”。系统自动跳转至DLI作业桶日志路径下。选择需要查看的日期，单击操作列的“下载”下载Spark日志到本地。图3 下载Spark作业日志父主题：

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
配置多版本过期数据回收站 - 数据湖探索 DLI

注意事项 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建表SQL语法可以参考使用Hive语法创建OBS表。回收站数据自动清理需要在OBS并行文件系统的桶上配置回收站数据的生命周期规则。具体步骤参考如下：在OBS服务控制台页面左侧选择“并行文件系统”，单击对应的文件系统名称。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 多版本备份恢复数据

总条数： 1085

上一页
1
...
6
7
8
...
55
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

Hive维表 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

运行Spark作业报java.lang.AbstractMethodError - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

使用DLI Flink SQL进行电商实时业务数据分析 - 数据湖探索 DLI

对已创建的上传作业进行鉴权（废弃） - 数据湖探索 DLI

迁移DWS数据至DLI - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

永洪BI制作图表 - 数据湖探索 DLI

典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

按需计费的弹性资源池，如果没提交作业运行就不计费？ - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

配置多版本过期数据回收站 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线