搜索_华为云

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？什么是数据倾斜？数据倾斜是在SQL作业执行中常见的问题，当数据分布不均匀的情况下，一部分计算节点处理的数据量远大于其他节点，从而影响整个计算过程的处理效率。例如观察到SQL执行时间较长，进入SparkUI查看对应SQL的执行状态，如图1所示，查看到一个stage运行时间超过

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
创建DLI程序包 - 数据湖探索 DLI

选择“已有分组”：可选择已有的分组。选择“创建新分组”：可输入自定义的组名称。选择“不分组”：不需要选择或输入组名称。说明：如果选择分组，则对应的权限管理为对应程序包组的权限管理。如果选择不分组，则对应的权限管理为对应程序包的权限管理。程序包组和程序包权限管理请参考程序包权限管理。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
DLI跨源连接报错找不到子网怎么办？ - 数据湖探索 DLI

口功能，因此需要获得VPC（虚拟私有云）的VPC Administrator权限。客户未给VPC服务授权导致DLI跨源连接报错找不到子网。处理步骤登录DLI管理控制台，选择“全局配置 > 服务授权”。在委托设置页面，按需选择所需的委托权限。其中“DLI Datasource

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
新建跨源连接，显示已激活，但使用时提示communication link failure错误怎么办？ - 数据湖探索 DLI

检查DLI队列对应网段是否开放，若没有，则在vpc中添加出方向网段。在DLI服务找到跨源连接绑定队列对应的网段图6 查找跨源连接绑定队列对应的网段在虚拟私有云安全组中查看DLI队列对应的网段是否已配置。图7 查看vpc中对应安全组中DLI队列对应网段如果没有配置，则进行添加。图8

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
FileSytem结果表 - 数据湖探索 DLI

type' = '' ); 注意事项该建表语法的数据输出目录为OBS时，OBS必须为并行文件系统，不能为OBS桶。使用fileSystem时必须开启checkpoint，保证作业的一致性。 format.type为parquet时，支持的数据类型为string, boolean, tinyint

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？问题现象 DLI分区内表导入了CSV文件数据，导入的文件数据没有包含对应分区列的字段数据。分区表查询时需要指定分区字段，导致查询不到表数据。问题根因 DLI分区内表在导入数据时，如果文件数据没

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
pyspark样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建增强跨源连接，并绑定包年/包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。通过DataFrame API 访问 import相关依赖

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

SQL作业存在join小表操作时，会触发自动广播所有executor，使得join快速完成。但同时该操作会增加executor的内存消耗，如果executor内存不够时，导致作业运行失败。解决措施排查执行的SQL中是否有使用“/*+ BROADCAST(u) */”强制做broadcastjoin。如果有，则需要去掉该标识。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

年/包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现详解导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。数据类型的使用，请参考Format章节。 Hive 方言支持的 DDL 语句，Flink 1.15 当前仅支持使用Hive语法创建OBS表和使用hive语法的DLI Lakehouse表。使用Hive语法创建OBS表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

TypeSerializer 序列化的字节序列。示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 >

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
BlackHole结果表 - 数据湖探索 DLI

Connector允许接收所有输入记录，常用于高性能测试和UDF 输出，其不是实质性Sink。Blackhole结果表是系统内置的Connector。例如，如果您在注册其他类型的Connector结果表时报错，但您不确定是系统问题还是结果表WITH参数错误，您可以将WITH参数修改为'connector'

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
BlackHole结果表 - 数据湖探索 DLI

Connector允许接收所有输入记录，常用于高性能测试和UDF 输出，其不是实质性Sink。Blackhole结果表是系统内置的Connector。例如，如果您在注册其他类型的Connector结果表时报错，但您不确定是系统问题还是结果表WITH参数错误，您可以将WITH参数修改为'connector'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

参考增强型跨源连接，在DLI上根据MySQL和Kafka所在的虚拟私有云和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。设置MySQL和Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性分别根据MySQL和Kafka的地址测试队列连通性。若能连通，则表示跨源已经绑定成功，否则表示未成功。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误 - 数据湖探索 DLI

hadoop.fs.obs.OBSIOException错误问题现象在DataArts Studio上运行DLI SQL脚本，执行结果的运行日志显示语句执行失败，错误信息为： DLI.0999: RuntimeException: org.apache.hadoop.fs.obs

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

参考增强型跨源连接，在DLI上根据MySQL和Kafka所在的虚拟私有云和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。设置MySQL和Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性分别根据MySQL和Kafka的地址测试队列连通性。若能连通，则表示跨源已经绑定成功，否则表示未成功。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
BlackHole - 数据湖探索 DLI
BlackHole - 数据湖探索 DLI

处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭证。配置文件或者环境变量中密文存放，使用时解密，确保安全。Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

15语法概览。 Flink 1.15需要配置租户面自定义委托，并在作业中配置委托信息。委托的权限需要根据作业具体的业务场景需求进行配置。详情操作请参考DLI自定义委托。 Flink 1.15作业管理凭据的方法： Flink OpenSource SQL中推荐使用DEW管理密码密钥等访问凭据信息。请参考Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码操作场景本例提供使用Spark作业访问DWS数据源的java样例代码。在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
使用DLI进行账单分析与优化 - 数据湖探索 DLI

本文主要介绍如何使用华为云DLI上的实际消费数据（文中涉及账户的信息已脱敏），在DLI的大数据分析平台上进行分析，找出费用优化的空间，并给出使用DLI过程中降低成本的一些优化措施。流程介绍使用DLI进行账单分析与优化的操作过程主要包括以下步骤：步骤1：获取消费数据。获取账户的实际消费数据。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析

总条数： 629

上一页
1
...
26
27
28
...
32
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

创建DLI程序包 - 数据湖探索 DLI

DLI跨源连接报错找不到子网怎么办？ - 数据湖探索 DLI

新建跨源连接，显示已激活，但使用时提示communication link failure错误怎么办？ - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

BlackHole结果表 - 数据湖探索 DLI

BlackHole结果表 - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误 - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

BlackHole - 数据湖探索 DLI

Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

使用DLI进行账单分析与优化 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线