搜索_华为云

数据迁移与传输方式概述 - 数据湖探索 DLI

迁移数据至DLI 为了将分散在不同系统中的数据迁移到DLI，确保数据可以在DLI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
设置Spark作业优先级 - 数据湖探索 DLI

spark.dli.job.priority=x 登录DLI管理控制台。单击“作业管理 > Spark作业”。选择待配置的作业，单击操作列下的编辑。在“Spark参数”中配置spark.dli.job.priority参数。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
DLI Hudi开发规范 - 数据湖探索 DLI

DLI Hudi开发规范 Hudi开发规范概述 Hudi数据表设计规范 Hudi数据表管理操作规范 Spark on Hudi开发规范 Bucket调优示例

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
查询指定资源实例的标签信息 - 数据湖探索 DLI

增强型跨源连接ID：在DLI管理控制台的“增强型跨源连接”列表页获取“连接ID”即为增强型跨源连接ID。数据库ID：添加标签时候传入的数据库ID即数据库名。您可以在DLI控制台的“库表管理”页面查看数据库名称。

帮助中心 > 数据湖探索 DLI > API参考 > 资源标签相关API
最新动态 - 数据湖探索 DLI
最新动态 - 数据湖探索 DLI

商用队列管理概述 2 支持Spark作业开发者模式用户可以在DLI管理控制台采用API接口模式设置参数及参数值。商用创建批处理作业API 2020年5月序号功能名称功能描述阶段相关文档 1 支持数据扫描量套餐包 DLI增加数据扫描量套餐包，降低数据扫描量费用。

帮助中心 > 数据湖探索 DLI > 最新动态
Flink作业委托场景开发指导 - 数据湖探索 DLI

Flink作业委托场景开发指导 Flink Opensource SQL使用DEW管理访问凭据 Flink Jar 使用DEW获取访问凭证读写OBS 获取Flink作业委托临时凭证用于访问其他云服务父主题： Flink作业开发指南

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

在DLI管理控制台的左侧导航栏中，单击数据管理>“程序包管理”，然后单击创建，并使用OBS中的jar包创建相应的程序包。在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

根据如下公式，配置作业的“CU数量”、“管理单元”与“最大并行数”： CU数量 = 管理单元 + (算子总并行数 / 单TM Slot数) * 单TM所占CU数例如：CU数量为9CU，管理单元为1CU，最大并行数为16，则计算单元为8CU。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

在DLI管理控制台，购买弹性资源池和队列资源，用于提供执行作业所需的计算资源。单击“作业管理 > Spark作业”，新建Spark作业。在作业管理页面，单击作业操作列的“编辑”，进入作业运行参数编辑页面。

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
增强型跨源连接概述 - 数据湖探索 DLI

增强型跨源连接概述为什么要创建增强型跨源连接？ DLI跨源分析场景连接外部数据源时，由于数据源的VPC与DLI VPC不同，网络无法连通，导致DLI无法读取数据源数据。DLI提供的增强型跨源连接功能可以实现DLI与数据源的网络连通。本节操作为您介绍跨VPC的数据源网络连通方案：

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 - 数据湖探索 DLI

到DLI管理控制台，左侧导航栏选择“作业管理 > Flink作业”，在对应的Flink作业所在行，操作列下单击“编辑”。在“运行参数”下，查看“开启Checkpoint”参数是否开启。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Flink作业咨询类 - 数据湖探索 DLI

Flink作业管理界面对用户进行授权时提示用户不存在怎么办？手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ DLI使用SMN主题，提示SMN主题不存在，怎么处理？父主题： Flink作业类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
创建集群（废弃） - 数据湖探索 DLI

可选择16CU，64CU和256CU三种规格，如果需要更大配额，请联系DLI服务管理员。 cidr_in_vpc 否 String vpc的网段。 cidr_in_mgntsubnet 否 String 管理子网的网段。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 集群相关API（废弃）
MRS配置 - 数据湖探索 DLI
MRS配置 - 数据湖探索 DLI

MRS配置 DLI跨源连接中配置MRS主机信息在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。对接MRS HBase需要在DLI队列的host文件中添加MRS集群节点的/etc/hosts信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索 DLI > 用户指南> 数据管理> 程序包管理> 内置依赖包”），这些常用算法库满足了大部分用户的使用场景。对于用户的PySpark程序依赖了内置算法库未提供的程序库该如何呢？

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
产品规格 - 数据湖探索 DLI
产品规格 - 数据湖探索 DLI

产品规格弹性资源池产品规格弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存）。弹性资源池的单位为CU，1CU包含1CPU和4GB内存。您可以在弹性资源池中创建多个队列，队列之间的计算资源支持共享。通过合理设置队列的计算资源池分配策略，提高计算资源利用率。 DLI

帮助中心 > 数据湖探索 DLI > 产品介绍
查询作业模板列表 - 数据湖探索 DLI

jars Array of Strings 用户已上传到DLI资源管理系统的类型为jar的程序包名。也支持指定OBS路径，例如：obs://桶名/包名。 pyFiles Array of Strings 用户已上传到DLI资源管理系统的类型为pyFile的资源包名。

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
下载并安装JDBC驱动包 - 数据湖探索 DLI

下载并安装JDBC驱动包操作场景 JDBC用于连接DLI服务，您可以在Maven获取JDBC安装包，或在DLI管理控制台下载JDBC驱动文件。本文介绍通过JDBC连接DLI并提交SQL作业。获取服务端连接地址连接DLI服务的地址格式为：jdbc:dli://<endPoint

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
FileSystem结果表 - 数据湖探索 DLI

FileSystem结果表功能描述 FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

登录DLI管理控制台，选择“作业管理 > Spark作业”，进入到Spark作业的界面。提交Hudi相关的Spark jar作业需要选择Spark版本为3.3.1，且使用的通用队列需要支持Hudi。单击右上角的”创建作业”即可提交Spark jar的作业。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业

总条数： 313

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据迁移与传输方式概述 - 数据湖探索 DLI

设置Spark作业优先级 - 数据湖探索 DLI

DLI Hudi开发规范 - 数据湖探索 DLI

查询指定资源实例的标签信息 - 数据湖探索 DLI

最新动态 - 数据湖探索 DLI

Flink作业委托场景开发指导 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

增强型跨源连接概述 - 数据湖探索 DLI

Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 - 数据湖探索 DLI

Flink作业咨询类 - 数据湖探索 DLI

创建集群（废弃） - 数据湖探索 DLI

MRS配置 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

产品规格 - 数据湖探索 DLI

查询作业模板列表 - 数据湖探索 DLI

下载并安装JDBC驱动包 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线