搜索_华为云

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

码的编写与作业的开发，使用Notebook灵活的进行数据分析与探索，本节操作介绍使用Notebook作业提交DLI作业的操作步骤。关于Jupyter Notebook的详细操作指导，请参见Jupyter Notebook使用文档。使用Notebook实例提交DLI作业适用于在

 帮助中心 > 数据湖探索 DLI > 用户指南
JSON Format - 数据湖探索 DLI
JSON Format - 数据湖探索 DLI

是LITERAL的时候，指定字符串常量替换 Map 中的空 key 值。示例该示例是从kafka的一个topic中读取数据，并使用kafka sink将数据写入到kafka的另一个topic中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

8。配置Java环境变量JAVA_HOME。查询弹性云服务器ECS详细信息，获取ECS的“私有IP地址”。使用增强型跨源连接打通DLI队列和Livy实例所在的VPC网络。具体操作可以参考增强型跨源连接。 DLI Livy工具下载及安装本次操作下载的DLI Livy版本为apache-livy-0.7.2.0107-bin

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
CLEANARCHIVE - 数据湖探索 DLI
CLEANARCHIVE - 数据湖探索 DLI

CLEANARCHIVE 命令功能用于对Hudi表的归档文件进行清理，以减少Hudi表的数据存储及读写压力。命令格式按文件容量进行清理，需要配置参数： hoodie.archive.file.cleaner.policy = KEEP_ARCHIVED_FILES_BY_SIZE;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
Hudi数据表Clean规范 - 数据湖探索 DLI

Clean也是Hudi表的维护操作之一，该操作对于MOR表和COW表都需要执行。Clean操作的目的是为了清理旧版本文件（Hudi不再使用的数据文件），这不但可以节省Hudi表List过程的时间，也可以缓解存储压力。规则 Hudi表必须执行Clean。对于Hudi的MOR、COW表，都需要开启Clean。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

如果原队列使用的是弹性资源池类型的计算资源，那么新建队列不涉及计算资源的费用变化。如果原队列使用的是非弹性资源池的类型的计算资源，那么使用弹性资源池资源新建队列后计算资源的费用将发生变化，具体情况以计算资源的价格详情为准。示例1：使用SQL队列，将Spark版本从Spark 2.4.x升级至Spark 3

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

如何查看DLI Spark作业的实际资源使用情况查看Spark作业原始资源配置登录DLI 控制台，单击左侧“作业管理”>“Spark作业”，在作业列表中找到需要查看的Spark作业，单击“作业ID”前的，即可查看对应Spark作业的原始资源配置参数。在创建Spark作业时，

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
FileSystem结果表 - 数据湖探索 DLI

与文件最终提交之间会进行文件合并。这些Pending状态的文件将首先被提交为一个以.开头的临时文件。这些临时文件随后将会按照用户指定的策略和合并方式进行合并，最终生成合并后的Pending状态的文件。然后这些文件将被发送给Committer并提交为正式文件，在这之后，原始的临时文件也会被删除掉。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
SHALLOW CLONE - 数据湖探索 DLI
SHALLOW CLONE - 数据湖探索 DLI

命令在特定版本创建现有Delta表的浅拷贝。被克隆的信息包括：schema、分区信息、数据文件路径等。对克隆表所做的任何更改都只会影响克隆本身，而不会影响源表，只要它们不触及源数据。注意克隆表可能仍会指向源表的数据文件，当源表做了vacuum操作时，可能导致克隆表找不到文件。命令格式 CREATE

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
如何获取AK/SK？ - 数据湖探索 DLI

I发起请求的访问者身份，与密码的功能相似。用户通过调用API接口进行云资源管理（如创建集群）时，需要使用成对的AK/SK进行加密签名，确保请求的机密性、完整性和请求双方身份的正确性。获取AK/SK操作步骤如下：注册并登录华为云管理控制台。将鼠标移动到右上角用户名上，在下拉列表中单击“我的凭证”。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
使用DLI的跨源认证管理数据源访问凭证 - 数据湖探索 DLI

使用DLI的跨源认证管理数据源访问凭证跨源认证概述创建CSS类型跨源认证创建Kerberos跨源认证创建Kafka_SSL类型跨源认证创建Password类型跨源认证跨源认证权限管理父主题：配置DLI读写外部数据源数据

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
对象存储OBS结果表 - 数据湖探索 DLI

与文件最终提交之间会进行文件合并。这些Pending状态的文件将首先被提交为一个以.开头的临时文件。这些临时文件随后将会按照用户指定的策略和合并方式进行合并，最终生成合并后的Pending状态的文件。然后这些文件将被发送给Committer并提交为正式文件，在这之后，原始的临时文件也会被删除掉。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

在执行与最新的Hive表的时间关联时，Hive表将被缓存到Slot内存中，然后通过键将流中的每条记录与表进行关联，以确定是否找到匹配项。将最新的Hive表用作时间表不需要任何额外的配置。使用以下属性配置Hive表缓存的TTL。在缓存过期后，将重新扫描Hive表以加载最新的数据。参数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

DLI控制台选择刚上传到OBS的UDAF函数的Jar文件，由DLI进行纳管。 6 创建DLI的UDAF函数 DLI控制台在DLI控制台的SQL作业管理界面创建使用的UDAF函数。 7 验证和使用DLI的UDAF函数 DLI控制台在DLI作业中使用创建的UDAF函数。操作步骤新

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Java SDK要求使用JDK1.8或更高版本。考虑到后续版本的兼容性，推荐使用1.8版本。下载JDK。从Oracle官网下载并安装JDK1.8版本安装包。本例使用jdk-8u261-linux-x64.tar.gz。将jdk上传到linux服务器对应的目录下并执行解压命令，此处上传到/usr/local目录下。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
查询Flink作业日志 - 数据湖探索 DLI

不配置DLI作业桶无法查看作业日志。您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
使用CDM迁移数据至DLI - 数据湖探索 DLI

度。步骤2：创建数据源与CDM的数据连接本例以MySQL数据源为例，介绍创建数据源与CDM的数据连接的操作步骤。进入CDM主界面，单击左侧导航上的“集群管理”，找到步骤1：创建CDM集群章节创建的集群“cdm-aff1”。单击CDM集群后的“作业管理”，进入作业管理界面。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
创建DLI自定义委托权限 - 数据湖探索 DLI

（OBS）、内容分发网络（CDN）等。授权后，用户根据权限使用全局服务的资源。指定区域项目资源：授权后，IAM用户根据权限使用所选区域项目中的资源，未选择的区域项目中的资源，该IAM用户将无权访问。指定企业项目资源：授权后，IAM用户根据权限使用所选企业项目中的资源。如企业项

 帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
计费相关问题 - 数据湖探索 DLI

计费相关问题 DLI的计费模式有哪些？包年/包月计费模式的DLI资源可以和按需计费模式相互转换吗？数据湖队列什么情况下是空闲状态？怎样排查DLI计费异常？已购买套餐包，为什么仍然产生按需计费？怎样查看套餐包资源的使用情况？怎样查看DLI的数据扫描量？按需计费的弹性资源池，如果没提交作业运行就不计费？

帮助中心 > 数据湖探索 DLI > 计费说明
FileSytem结果表 - 数据湖探索 DLI

ckpoint恢复”。 checkpoint间隔设置需在输出文件实时性、文件大小和恢复时长之间进行权衡，比如10分钟。使用HDFS时需要绑定相应的跨源，并填写相应的主机信息。使用hdfs时，请配置主NameNode的所在节点信息。参数说明表1 参数说明参数是否必选说明

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表

总条数： 1096

上一页
1
...
6
7
8
...
55
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

JSON Format - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

CLEANARCHIVE - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

SHALLOW CLONE - 数据湖探索 DLI

如何获取AK/SK？ - 数据湖探索 DLI

使用DLI的跨源认证管理数据源访问凭证 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

使用CDM迁移数据至DLI - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

计费相关问题 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线