搜索_华为云

Flink SQL作业类 - 数据湖探索 DLI

null错误 Flink SQL作业消费Kafka后sink到es集群，作业执行成功，但未写入数据 Flink Opensource SQL如何解析复杂嵌套 JSON？ Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ Flink Opensource

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
Hudi数据表Compaction规范 - 数据湖探索 DLI

新版本的Parquet文件，那旧版本的文件就不能被Clean清理，增加存储压力。提交Spark jar作业时，CPU与内存比例为1:4~1:8。 Compaction作业是将存量的parquet文件内的数据与新增的log中的数据进行合并，需要消耗较高的内存资源，按照之前的表设计

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

key'配合使用。未配置'primary key'时，支持copy及insert两种模式追加写入。配置'primary key'，支持copy、upsert以及insert三种模式更新写入。注意：由于dws不支持更新分布列，因而配置的更新主键必须包含dws表中定义的所有分布列。 connector

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Java SDK概述 - 数据湖探索 DLI
Java SDK概述 - 数据湖探索 DLI

SDK 访问指定服务的 API ，您需要确认已在DLI控制台开通当前服务并完成服务授权。 Java SDK 支持 Java JDK 1.8 及其以上版本。关于Java开发环境的配置请参考Java SDK环境配置。关于Java SDK的获取与安装请参考SDK的获取与安装。使用SDK工

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
迁移数据场景概述 - 数据湖探索 DLI

为了将分散在不同系统中的数据迁移到DLI，确保数据可以在DLI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。图1

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
管理DLI全局变量 - 数据湖探索 DLI

改权限的用户均可以修改对应的变量值。删除全局变量在“全局变量”页面，单击变量“操作”列中的“删除”，可删除对应的变量。如果同账号同项目下存在多个相同名称的全局变量，优先删除用户自建的。如果仅存在唯一名称的全局变量，则具备删除权限即的用户均可删除该全局变量。变量删除后，SQL中将无法使用该变量。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
SHOW_INVALID_PARQUET - 数据湖探索 DLI

注意事项使用由DLI提供的元数据服务时，不支持本命令。权限需求由DLI提供的元数据服务 SQL权限： database table 无 SELECT 细粒度权限：dli:table:select 由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？ - 数据湖探索 DLI

建议排查代码，确认是否有内存泄漏。图2 Full GC 处理步骤如果频繁Full GC, 建议排查代码，是否有内存泄漏。增加单TM所占的资源。联系技术支持，修改集群心跳配置参数。父主题： Flink作业性能调优类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
提交SQL作业（推荐） - 数据湖探索 DLI

ERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full GC。在这种情况下，可以配置该参数为fals

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
查询作业模板列表 - 数据湖探索 DLI

用户已上传到DLI资源管理系统的类型为file的资源包名。也支持指定OBS路径，例如：obs://桶名/包名。 modules Array of Strings 依赖的系统资源模块名，具体模块名可通过查询组内资源包（废弃）接口查看。 DLI系统提供了用于执行跨源作业的依赖模块，各个不同的服务对应的模块列表如下：

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

Kafka源表功能描述创建source流从Kafka获取数据，作为作业的输入数据。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
DLI程序包标签管理 - 数据湖探索 DLI

在“添加/编辑标签”对话框中配置标签参数。表1 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。如果添加预定义标签，用户需要预先在标签管理服务中创建好预定义标签，然后在“标签键”的下拉框中进行选择。用户可以通过单击“查看预定义标签”进入标签管理服务的“预定

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
BI工具连接DLI方案概述 - 数据湖探索 DLI

BI工具是数据分析的强大助手，提供数据可视化、报表生成和仪表板创建等功能。 DLI服务通过对数据的融合分析处理，可以为BI工具提供标准的、有效的高质量数据，供给后续的数据统计分析使用。通过连接到DLI，BI工具可以更加灵活的使用DLI访问和分析数据，帮助企业快速做出基于数据的决策。 DLI为BI工具提供了便捷的连接方法：

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
OPTIMIZE - 数据湖探索 DLI
OPTIMIZE - 数据湖探索 DLI

OPTIMIZE 命令功能 OPTIMIZE命令用于优化数据在存储中的布局，提高查询速度。注意事项由于Optimize是一项耗时的活动，因此需要根据更好的最终用户查询性能与优化计算时间之间的权衡来确定运行Optimized的频率。分区表优化需要设置参数spark.sql.force

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
扫描量计费 - 数据湖探索 DLI
扫描量计费 - 数据湖探索 DLI

期；当您的账号因按需资源自动扣费导致欠费后，账号将变成欠费状态，资源将陆续进入宽限期和保留期。图2 按需计费的DLI资源生命周期欠费预警系统会在每个计费周期后的一段时间对按需计费资源进行扣费。当您的账户被扣为负值时，我们将通过邮件、短信和站内信的方式通知到华为账号的创建者。

帮助中心 > 数据湖探索 DLI > 计费说明
Flink作业性能调优 - 数据湖探索 DLI

出，说明的是该消费组当前待消费的数据总量。如果Flink作业对接的是kafka专享版，则可通过云监控服务(CES)进行查看。具体可选择“云服务监控 > 分布式消息服务 > kafka专享版” ，单击“kafka实例名称 > 消费组” ，选择具体的消费组名称，查看消费组的指标信息。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
创建DLI表关联HBase - 数据湖探索 DLI

wkey指定的字段只有一个的时候，该字段的类型可以是支持的所有数据类型，并且不需要填写长度。在组合Rowkey的场景中插入Rowkey数据时，如果某个属性的实际数据的长度比属性作为Rowkey时指定的长度要短，则会在数据后面补'\0'字符；如果某个属性的实际数据的长度比属性作

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

aegg包所在的OBS路径。分组设置和分组名称根据情况选择。单击“确定”完成程序包上传。在报错的Spark作业编辑页面，“依赖python文件”处选择已上传的egg程序包，重新运行Spark作业。 pyspark作业对接MySQL，需要创建跨源链接，打通DLI和RDS之间的网络。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类

总条数： 538

上一页
1
...
19
20
21
...
27
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink SQL作业类 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

Java SDK概述 - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

管理DLI全局变量 - 数据湖探索 DLI

SHOW_INVALID_PARQUET - 数据湖探索 DLI

Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？ - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

查询作业模板列表 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

DLI程序包标签管理 - 数据湖探索 DLI

BI工具连接DLI方案概述 - 数据湖探索 DLI

OPTIMIZE - 数据湖探索 DLI

扫描量计费 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

创建DLI表关联HBase - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线