搜索_华为云

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

长，最好大于Checkpoint的完成时间，建议设置为5分钟。 Exactly Once模式保证每条数据只被消费一次，At Least Once模式每条数据至少被消费一次，请依据业务情况选择。勾选“异常自动恢复”和“从Checkpoint恢复”，根据自身业务情况选择重试次数。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink OpenSource SQL作业开发指南
在DLI控制台配置数据库权限 - 数据湖探索 DLI

Guest权限的介绍和开通方法，详细参见《权限策略》和《统一身份认证服务用户指南》中的创建用户组。注意事项如果需要查看管理员或者其他用户账号下的数据库，需要对当前用户授权（显示权限），具体请参考常用操作与系统权限关系。数据库和表赋权对象具有层级关系，用户赋予上一层级的权限会自动继承到下一层级对象上，层级关系为：数据库>表>列。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？问题现象使用DLI插入数据到OBS临时表文件，数据量有差异。根因分析出现该问题可能原因如下：作业执行过程中，读取数据量错误。验证数据量的方式不正确。通常在执行插入数据操作后，如需确认插入数据量是否正确，建议通过查询语句进行查询。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？在Flink 作业中，你可以使用CREATE语句来定义Source表和Sink表，并指定它们的连接器类型以及相关的属性。如果需要将数据写入到不同的Elasticsearch集群，您需要为每个集群配置

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
将OBS数据导入至DLI - 数据湖探索 DLI

本节操作介绍将OBS上的数据导入到DLI控制台的表中。注意事项导入数据时只能指定一个路径，路径中不能包含逗号。如果将CSV格式数据导入分区表，需在数据源中将分区列放在最后一列。不建议对同一张表并发导入数据，因为有一定概率发生并发冲突，导致导入失败。导入文件支持CSV，Parquet，

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

select * from testcsvdatasource; 图1 查询结果本地修改原始的OBS表文件“test.csv”，增加一行“Aarn,98,20”数据，重新替换OBS桶目录下的“test.csv”文件。 Jordon,88,23 Kim,87,25 Henry

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
使用SQL作业模板开发并提交SQL作业 - 数据湖探索 DLI

板直接执行SQL操作。当前系统提供了多条标准的TPC-H查询语句模板，您可以按需选择自定义模板或系统模板创建SQL作业。本样例演示通过一个TPC-H样例模板开发并提交SQL作业的基本流程：操作步骤登录DLI管理控制台。在DLI管理控制台，选择“作业模板 > SQL模板”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
创建数据库 - 数据湖探索 DLI
创建数据库 - 数据湖探索 DLI

创建数据库功能描述创建数据库。语法格式 1 2 3 CREATE [DATABASE | SCHEMA] [IF NOT EXISTS] db_name [COMMENT db_comment] [WITH DBPROPERTIES (property_name=property_value

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 数据库
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

当前仅适用于在默认default队列中提交作业按扫描数据量计费。 CU是弹性资源池的计价单位。 1CU= 1Core 4GMem。不同规格对应的计算能力不一样，规格越高计算能力越好。 default队列中提交作业按扫描数据量计费。计费模式 DLI在不同的计费项下有不同的计费模式，具体详见表2说明。

帮助中心 > 数据湖探索 DLI > 计费说明
创建数据库 - 数据湖探索 DLI
创建数据库 - 数据湖探索 DLI

创建数据库功能描述创建数据库。语法格式 1 2 3 CREATE [DATABASE | SCHEMA] [IF NOT EXISTS] db_name [COMMENT db_comment] [WITH DBPROPERTIES (property_name=property_value

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

的能力。装载测试是第一项测试，测试装载数据的时间，这项操作非常耗时。Power 测试是在数据装载测试完成后，数据库处于初始状态，未进行其它任何操作，特别是缓冲区还没有被测试数据库的数据，被称为raw查询。Power测试要求22 个查询顺序执行1 遍，同时执行一对RF1 和RF2 操作。最后进行Throughput

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
创建SQL作业模板 - 数据湖探索 DLI

样例数据说明。在“SQL模板”页面右上角，单击“设置”可以选择是否按照分组展示模板。如果选择“按分组展示”，有以下三种展示方式：展开第一个分组、全部展开、全部收起。创建SQL作业模板创建模板的操作入口有两个，分别在“作业模板”和“SQL编辑器”页面。在“作业模板”页面创建模板。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
Python SDK环境配置 - 数据湖探索 DLI

Python SDK环境配置操作场景在进行二次开发时，要准备的开发环境如表1所示。表1 开发环境准备项说明操作系统 Windows系统，推荐Windows 7及以上版本。安装Python Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

窗口去重功能描述窗口去重是一种特殊的去重，它根据指定的多个列来删除重复的行，保留每个窗口和分区键的第一个或最后一个数据。对于流式查询，与普通去重不同，窗口去重只在窗口的最后返回结果数据，不会产生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

LOG.info("Params: " + params.toString()); // Kafka连接地址 String bootstrapServers; // Kafka消费组 String kafkaGroup;

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink Jar作业开发指南
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中问题现象 SQL作业中存在join操作，作业提交后状态一直是运行中，没有结果返回。问题根因 Spark SQL作业存在join小表操作时，会触发自动广播所有executor，使得join快速完成。但同时该操

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

数据倾斜是在SQL作业执行中常见的问题，当数据分布不均匀的情况下，一部分计算节点处理的数据量远大于其他节点，从而影响整个计算过程的处理效率。例如观察到SQL执行时间较长，进入SparkUI查看对应SQL的执行状态，如图1所示，查看到一个stage运行时间超过20分钟且只剩余一个task在运行，即为数据倾斜的情况。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误 - 数据湖探索 DLI

service not known 问题根因第一次执行DLI SQL脚本，用户没有在DLI控制台上同意隐私协议导致在DataArts Studio运行SQL脚本报错。解决方案登录DLI控制台，选择“SQL编辑器”，输入任意执行一个SQL语句，比如“select 1”。弹出隐

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
SQL作业运行慢如何定位 - 数据湖探索 DLI

GC”关键字，查看日志中是否有时间连续，并且频繁出现“Full GC”的日志信息。图5 Full GC日志 FullGC问题原因定位和解决：原因1 小文件过多：当一个表中的小文件过多时，可能会造成Driver内存FullGC。登录DLI控制台，选择SQL编辑器，在SQL编辑器页面选择问题作业的队列和数据库。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

username 否数据库认证用户名，需要和'connector.password'一起配置 connector.password 否数据库认证密码，需要和'connector.username'一起配置 connector.read.partition.column 否用于对输入进行分区的列名

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表

总条数： 530

上一页
1
...
21
22
23
...
27
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

在DLI控制台配置数据库权限 - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

将OBS数据导入至DLI - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

使用SQL作业模板开发并提交SQL作业 - 数据湖探索 DLI

创建数据库 - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

创建数据库 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

创建SQL作业模板 - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线