搜索_华为云

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

内容复制到基础镜像中 USER omm 其中，主要包含了以下步骤：设置pip的可用仓库地址。使用pip3安装tensorflow算法包。将安装了算法包的临时镜像builder里的内容复制到基础镜像中（这一步主要是为了减小镜像体积），用于生成最终的自定义镜像。利用Dockerfile生成自定义镜像。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

b,"","1 2",ab Spark 3.3.1 "a b",,"1 2",ab 新增支持自适应Skip partial agg功能的配置说明： Spark3.3.x版本中新增支持自适应Skip partial agg功能，即当Partial Agg效果不佳时，可以直接跳过，避免Partial

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

Jar作业等操作不支持该操作修改了作业对资源的算法逻辑。例如原有的算法的语句是执行加减运算，当前需要恢复的状态将算法的语句修改成为乘除取余的运算，是无法从checkpoint直接恢复的。修改“静态流图” 不支持该操作修改了作业对资源的算法逻辑。修改“单TM所占CU数”参数支持

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

nector之外，还可以对接云上Mysql、GaussDB、MRS HBase、DMS、DWS、OBS等，开箱即用；在资源方面，产品可以自适应业务的流量，智能对资源进行弹性伸缩，保障业务稳定性，不需要人工进行额外调试。 DLI Flink与MRS Flink的功能对比如表1所示。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

挖掘工具或者挖掘方法实现价值提炼，是用户非常关注的话题。优势提供地理专业算子：支持全栈Spark能力，具备丰富的Spark空间数据分析算法算子，全面支持结构化的遥感影像数据、非结构化的三维建模、激光点云等巨量数据的离线批处理，支持带有位置属性的动态流数据实时计算处理。 CEP

帮助中心 > 数据湖探索 DLI > 产品介绍
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索 DLI > 用户指南> 数据管理> 程序包管理> 内置依赖包”），这些常用算法库满足了大部分用户的使用场景。对于用户的PySpark程序依赖了内置算法库未提供的程序库该如何呢？其实PySpark本身

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
二进制函数和运算符 - 数据湖探索 DLI

varbinary 计算二进制块的SHA 1哈希值。 sha2(string, integer) → string 安全散列算法2，是一种密码散列函数算法标准，其输出长度可以取224位，256位， 384位、512位，分别对应SHA-224、SHA-256、SHA-384、SHA512

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

产品优势纯SQL操作 DLI提供标准SQL接口，用户仅需使用SQL便可实现海量数据查询分析。SQL语法全兼容标准ANSI SQL 2003。存算分离 DLI解耦计算和存储负载，存算分离架构，存储资源和计算资源按需灵活配置，提高了资源利用率，降低了成本。企业级多租户支持计算

 帮助中心 > 数据湖探索 DLI > 产品介绍
认证鉴权 - 数据湖探索 DLI
认证鉴权 - 数据湖探索 DLI

Access Key)：与访问密钥ID结合使用的密钥，对请求进行加密签名，可标识发送方，并防止请求被修改。使用AK/SK认证时，您可以基于签名算法使用AK/SK对请求进行签名，也可以使用专门的签名SDK对请求进行签名。详细的签名方法和SDK使用方法请参见API签名指南。签名SDK

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
数据保护技术 - 数据湖探索 DLI

enable 打开taskmanager之间通信的SSL开关。否 true security.ssl.algorithms 设置SSL加密的算法。否 TLS_DHE_RSA_WITH_AES_128_GCM_SHA256,TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
创建队列 - 数据湖探索 DLI
创建队列 - 数据湖探索 DLI

ai：AI增强型（仅SQL的x86_64专属队列支持选择）默认值为“basic”。说明： AI增强型即队列加载了AI镜像，该镜像在基础镜像的基础上集成了AI相关的算法包。 tags 否 Array of Objects 队列的标签，使用标签标识云资源。包括“标签键”和“标签值”，具体请参考表3。 ela

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
对象存储OBS结果表 - 数据湖探索 DLI

对象存储OBS结果表功能描述 FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 Notebook是基于开源JupyterLab进行了深度优化的交互式数据分析挖掘模块，提供在线的开发和调试能力，用于编写和调测模型训练代码。完成DLI对接Notebook实例后，您可以基于Notebook提供的Web交互的开发环境同时完成代

 帮助中心 > 数据湖探索 DLI > 用户指南
查询所有队列 - 数据湖探索 DLI

ai：AI增强型（仅SQL的x86_64专属队列支持选择）默认值为“basic”。说明： AI增强型即队列加载了AI镜像，该镜像在基础镜像的基础上集成了AI相关的算法包。 resource_type 否 String 队列所属资源类型。 vm：ecf集群 container：容器化集群（k8s） cu_spec

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

使用DLI提交Spark Jar作业操作场景 DLI允许用户提交编译为Jar包的Spark作业，Jar包中包含了Jar作业执行所需的代码和依赖信息，用于在数据查询、数据分析、机器学习等特定的数据处理任务中使用。在提交Spark Jar作业前，将程序包上传至OBS，并将程序包与数据和作业参数一起提交以运行作业。

帮助中心 > 数据湖探索 DLI > 快速入门
FileSytem结果表 - 数据湖探索 DLI

FileSytem结果表功能描述 FileSystem结果表用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。数据生成后，可直接对生成的目录创建非DLI表，通过DLI SQL进行下一步处理分析，并且输出数据目录支持分区表结构。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
SHOW TBLPROPERTIES TABLE|VIEW - 数据湖探索 DLI

(1 row) --查看show_table1的压缩算法 SHOW TBLPROPERTIES show_table1('orc.compression.codec'); SHOW TBLPROPERTIES

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

nk），然后 MySQL CDC Source 将多个块分配给多个 reader 以并行读取表的数据。无锁算法 MySQL CDC source 使用增量快照算法, 避免了数据库锁的使用，因此不需要 “RELOAD” 权限。并发读取增量快照读取提供了并行读取快照数据的能力。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
FileSystem结果表 - 数据湖探索 DLI

FileSystem结果表功能描述 FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？在大数据分析的日常工作中，合理分配和管理计算资源，可以提供良好的作业执行环境。您可以根据作业的计算需求和数据规模分配资源、调整任务执行顺序，调度不同的弹性资源池或队列资源以适应不同的工作负载。待提交作业所需的CUs需小于等于弹性资源池的

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类

总条数： 26

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

二进制函数和运算符 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

认证鉴权 - 数据湖探索 DLI

数据保护技术 - 数据湖探索 DLI

创建队列 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

查询所有队列 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

SHOW TBLPROPERTIES TABLE|VIEW - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线