搜索_华为云

最新动态 - 数据湖探索 DLI
最新动态 - 数据湖探索 DLI

DLI增加存储量套餐包，降低数据存储在DLI中的费用。商用产品价格详情 3 支持计算队列定时扩缩容 DLI提供了队列规格变更定时任务功能。用户可以根据自己的业务周期或者使用情况，基于现有队列规格，在不同的时间或者周期内设置不同的队列大小，以满足自己的业务需求，节约成本。商用定时扩容/缩容 2020年6月序号

 帮助中心 > 数据湖探索 DLI > 最新动态
责任共担 - 数据湖探索 DLI
责任共担 - 数据湖探索 DLI

户的安全责任在于对使用的IaaS、PaaS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API网关和高级安全服务，各项云服务，租户数据，以及身份账号和密钥管理等方面的安全配置。《华为云安全白皮

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

Interger 每个批量请求的最大缓冲操作数。可以设置'0'为禁用它。 sink.bulk-flush.max-size 否 2mb MemorySize 每个批量请求的缓冲操作在内存中的最大值。单位必须为 MB。可以设置为'0'来禁用它。 sink.bulk-flush.interval

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Spark增量读取Hudi参数规范 - 数据湖探索 DLI

增量查询之前必须指定当前表的查询为增量查询模式，并且查询后重写设置表的查询模式如果增量查询完，不重新将表查询模式设置回去，将影响后续的实时查询示例以SQL作业为例：配置参数 hoodie.tableName.consume.mode=INCREMENTAL // 必须设置当前表读取为增量读取模式 hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
Hudi表索引设计规范 - 数据湖探索 DLI

数据读写占用的内存空间都是原始数据大小（包括空值也是会占用内存的），2GB在大数据计算过程中，处于单task读写可接受范围之内。如果是单个Bucket的数据量超过了该值范围，可能会有什么影响？读写任务可能会出现OOM的问题，解决方法就是提升单个task的内存占比。读写性能

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

15版本的Jar作业开发指导请参考Flink Jar写入数据到OBS开发指南。配置文件使用方法方案一：直接在main函数里面加载文件内容到内存，然后广播到各个taskmanager，这种方式适合那种需要提前加载的少量变量。方案二：在open里面初始化算子的时候加载文件，可以使用相对路径/绝对路径的方式

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

弹性资源池至少可以满足弹性资源池中所有队列按最小CU运行，尽量满足队列按最大CU运行。规格（包周期CU）：购买弹性资源池时选择的CU范围的最小值即弹性资源池规格。规格是包周期弹性资源池特有的。规格部分以包周期的计费，规格之外的部分按需计费。数据库数据库即按照数据结构来组织、存储和管理数据的

 帮助中心 > 数据湖探索 DLI > 产品介绍
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

SQL读取Hudi表数据。更多具体使用可参考开源社区文档：Hudi。注意事项建议Hudi作为Source表时设置限流 Hudi表作为Source表时，为防止数据上限超过流量峰值导致作业出现异常，建议设置限流（read.rate.limit），限流上限应该为业务上线压测的峰值。及时对Hudi表进行Compaction，防止Hudi

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
配置DLI程序包权限 - 数据湖探索 DLI

针对不同用户，可以通过权限设置分配不同的程序包组或程序包，不同用户之间的作业效率互不影响，保障作业性能。管理员用户、程序包组拥有程序包组的所有权限。不需要进行权限设置，且其他用户无法修改其程序包组权限。管理员用户、程序包的所有者拥有程序包的所有权限。不需要进行权限设置，且其他用户无法修改其程序包权限。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
变更普通队列规格 - 数据湖探索 DLI

变更普通队列规格前提条件新创建的包年包月计费队列需要运行作业后才可进行规格变更。本节操作仅适用于普通队列，不适用于弹性资源池队列。注意事项目前只支持64CUs以上规格包年包月队列进行规格变更。如果在“规格变更”页面提示“Status of queue xxx is assigning

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
SQL作业开发类 - 数据湖探索 DLI

怎样查看DLI SQL日志？怎样查看DLI的执行SQL记录？执行SQL作业时产生数据倾斜怎么办？ SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中为什么SQL作业一直处于“提交中”？父主题： SQL作业类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类
SQL作业运行慢如何定位 - 数据湖探索 DLI

GC”的日志信息。图5 Full GC日志 FullGC问题原因定位和解决：原因1 小文件过多：当一个表中的小文件过多时，可能会造成Driver内存FullGC。登录DLI控制台，选择SQL编辑器，在SQL编辑器页面选择问题作业的队列和数据库。执行以下语句，查看作业中表的文件数量。“表名”替换为具体问题作业中的表名称。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
表相关 - 数据湖探索 DLI
表相关 - 数据湖探索 DLI

out.println(table); return table; } DataType.DECIMAL的默认精度为(10,0)，设置Decimal类型精度的方法如下： 1 Column c11 = new Column("c11", new DecimalTypeInfo(25

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

在提交导入作业前，可选择设置导入数据的格式，如样例所示，调用ImportJob对象的setStorageType接口设置数据存储类型为csv，数据的具体格式通过调用ImportJob对象的setCsvFormatInfo接口进行设置。在提交导入作业前，可选择设置导入数据的分区并配置

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
新建跨源连接，显示已激活，但使用时提示communication link failure错误怎么办？ - 数据湖探索 DLI

failure”错误。将原有跨源连接删除重新创建。再次创建时，必须确保所选“安全组”、“虚拟私有云”、“子网””和“目的地址”与RDS中的设置完全一致。请选择正确的“服务类型”，本示例中为“RDS”。图1 创建经典型跨源连接-RDS 检查安全组网络（vpc）配置。若按照步骤

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中使用Spark将数据写入到DLI表中，主要设置如下参数： fs.obs.access.key fs.obs.secret.key fs.obs.impl fs.obs.endpoint 示例如下： import logging from operator

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Orc Format - 数据湖探索 DLI
Orc Format - 数据湖探索 DLI

String 指定要使用的格式，这里应该是 'orc'。 Orc 格式也支持来源于 Table properties 的表属性。举个例子，您可以设置 orc.compress=SNAPPY 来允许spappy压缩。数据类型映射 Orc 格式类型的映射和 Apache Hive 是兼容的。下面的表格列出了

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Spark 3.1.1版本说明 - 数据湖探索 DLI

Spark 3.1.1版本说明数据湖探索（DLI）遵循开源Spark计算引擎的发布一致性。本文介绍Spark 3.1.1版本所做的变更说明。更多Spark 3.1.1版本说明请参考Spark Release Notes。 Spark 3.1.1版本发布时间版本名称发布时间

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

7或8.0.x。该场景作业需要DLI与MySQL建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
创建表时指定表的生命周期 - 数据湖探索 DLI

on表。生命周期单位为天，取值为正整数。生命周期只能在表级别设置，不能在分区级设置。为分区表指定的生命周期，适用于该表所有的分区。生命周期设置后，DLI表和OBS表支持数据备份，OBS表的备份目录需要手工设置。且备份目录应选择在并行文件系统上，备份目录必须和原表目录在同一个

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理

总条数： 521

上一页
1
...
5
6
7
...
27
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

最新动态 - 数据湖探索 DLI

责任共担 - 数据湖探索 DLI

Elasticsearch - 数据湖探索 DLI

Spark增量读取Hudi参数规范 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

配置DLI程序包权限 - 数据湖探索 DLI

变更普通队列规格 - 数据湖探索 DLI

SQL作业开发类 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

表相关 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

新建跨源连接，显示已激活，但使用时提示communication link failure错误怎么办？ - 数据湖探索 DLI

Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Orc Format - 数据湖探索 DLI

Spark 3.1.1版本说明 - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线