搜索_华为云

Python SDK环境配置 - 数据湖探索 DLI

开发环境准备项说明操作系统 Windows系统，推荐Windows 7及以上版本。安装Python Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual C++编译环境Visual C++ build tools 或者 Visual Studio。安装Python依赖库

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量（例如Spark初始化完成后，Flink消费Kafka时过滤掉2小时之前的数据），如果无法对kafka消息进行过滤，则可以考虑先实时接入生成offset，再truncate table ，再历史导入，再开启实时。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
创建DLI自定义委托权限 - 数据湖探索 DLI

所有资源：授权后，IAM用户可以根据权限使用账号中所有资源，包括企业项目、区域项目和全局服务资源。全局服务资源：全局服务部署时不区分区域，访问全局级服务，不需要切换区域，全局服务不支持基于区域项目授权。如对象存储服务（OBS）、内容分发网络（CDN）等。授权后，用户根据权限使用全局服务的资源。指定区域

 帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用）非弹性资源池模式的队列是DLI的上一代计算资源管理方式，按使用需求购买和释放资源，需要预先估计资源使用需求再进行购买。优先推荐使用弹性资源池队列，提高资源使用的灵活性和资源利用效率。购买弹性资源池并在弹性资源池中添加队列请参考创建弹性资源池并添加队列。用户

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

ROWGE”相同。该帧包含从分区的开始到当前行的最后一个对等方的所有行。在没有ORDER BY的情况下，所有行都被视为对等行，因此未绑定的前导和当前行之间的范围等于未绑定的前导和未绑定的后续之间的范围。例如：下面的查询将salary表中的信息按照每个部门员工工资的大小进行排序。 --创建数据表并插入数据

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

名称：添加的队列的名称。类型：根据作业需要选择队列类型。本示例选择为：通用队列。 SQL队列类型：用于运行Spark SQL和HetuEngine作业。通用队列类型：用于运行Flink和Spark Jar作业。其他参数请根据需要配置。图3 添加队列配置完基本参数后，单击“下一步”，在队列

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
逻辑运算符 - 数据湖探索 DLI
逻辑运算符 - 数据湖探索 DLI

逻辑运算符常用的逻辑操作符有AND、OR和NOT，它们的运算结果有三个值，分别为TRUE、FALSE和NULL，其中NULL代表未知。优先级顺序为：NOT>AND>OR。运算规则请参见表1，表中的A和B代表逻辑表达式。表1 逻辑运算符运算符返回类型描述 A AND B

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 运算符
获取DLI委托信息（废弃） - 数据湖探索 DLI

Strings 角色。目前只支持： obs_adm：DLI获得访问和使用OBS的委托权限。 dis_adm：访问和使用DIS数据源，需要获得访问和使用DIS（数据接入服务）DIS Administrator权限。 ctable_adm：访问和使用CloudTable（表格存储服务）的CloudTable

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 委托相关API（废弃）
DWS Connector概述 - 数据湖探索 DLI

数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DLI将Flink作业从数据仓库服务（DWS）中读取数据。DWS数据库内核兼容PostgreSQL，PostgreSQL数据库可存

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

special_start_time), 'yyyymmdd') = substr('20220601',1,8) 父主题： DLI数据库和表类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
计费样例 - 数据湖探索 DLI
计费样例 - 数据湖探索 DLI

link作业和Spark作业。SQL作业的计费包括存储计费和计算计费，Flink作业和Spark作业的计费只有计算计费。示例价格仅供参考，实际计算请以DLI产品价格详情中的信息为准。更多示例参考DLI产品价格详情。计费构成分析基于此案例，可详细计算出按需计费和包年/包月两种不同的计费模式的消费情况。

帮助中心 > 数据湖探索 DLI > 计费说明
Bucket调优示例 - 数据湖探索 DLI

Bucket调优示例创建Bucket索引表调优 Hudi表初始化实时任务接入离线Compaction配置父主题： DLI Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

初步认识华为云数据湖探索，了解数据湖探索的基本功能、应用场景、基本概念和使用限制，有助于您更准确地匹配实际业务。产品介绍什么是DLI 应用场景使用限制与其他云服务的关系 03 入门购买DLI队列后，您可以运行SQL作业和Spark作业，开启您的数据湖探索使用之旅。使用前须知准备工作

 帮助中心 > 数据湖探索 DLI > 成长地图
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

s自定义镜像中注册的镜像。 VPC接入：开启VPC接入接入功能请联系客户支持开启Notebook实例的VPC接入白名单功能。安全组请配置为步骤2：创建虚拟私有云和安全组中创建的安全组，且安全组需要对DLI弹性资源池网段放通TCP的8998和30000-32767端口。参数配

 帮助中心 > 数据湖探索 DLI > 用户指南
新建SQL作业 - 数据湖探索 DLI
新建SQL作业 - 数据湖探索 DLI

标签的键的最大长度为128个字符，标签的键可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格，不能以_sys_开头。 value 是 String 标签的值。说明：标签值的最大长度为255个字符，标签的值可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
创建Bucket索引表调优 - 数据湖探索 DLI

type=BUCKET hoodie.bucket.index.num.buckets=5 判断使用分区表还是非分区表根据表的使用场景一般将表分为事实表和维度表：事实表通常整表数据规模较大，以新增数据为主，更新数据占比小，且更新数据大多落在近一段时间范围内（年或月或天），下游读取该表进行ET

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
费用账单 - 数据湖探索 DLI
费用账单 - 数据湖探索 DLI

在控制台顶部菜单栏中选择“费用与成本 > 费用账单”。选择“流水和明细账单 > 明细账单”，在筛选条件中选择“资源ID”，并输入1.e中获取的资源ID，单击图标即可搜索该资源的账单。这里设置的统计维度为“按资源名称/ID”，统计周期为“按账期”，您也可以设置其他统计维度和周期，详细介绍请参见流水与明细账单。

帮助中心 > 数据湖探索 DLI > 计费说明
Kafka - 数据湖探索 DLI
Kafka - 数据湖探索 DLI

会覆盖这些配置如'key.deserializer'和'value.deserializer'。 format 是无 String 序列化和反序列化Kafka消息的value的格式。该配置项和 'value.format' 二者必需其一。关于Kafka消息的消息键和消息体请参考消息键（Key）与消息体（Value）的格式。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
窗口聚合 - 数据湖探索 DLI
窗口聚合 - 数据湖探索 DLI

“window_start” 和 “window_end” 列。和普通的 GROUP BY 子句一样，窗口聚合对于每个组会计算出一行数据。和其他连续表上的聚合不同，窗口聚合不产生中间结果，只在窗口结束产生一个总的聚合结果，另外，窗口聚合会清除不需要的中间状态。更多介绍和使用请参考开源社区文档：窗口聚合。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
下载并安装JDBC驱动包 - 数据湖探索 DLI

切换到“管理访问密钥”页面。单击左侧“新增访问密钥”按钮，输入“登录密码”和“短息验证码”。单击“确定”，下载证书。下载成功后，在credentials文件中即可获取AK和SK信息。认证用的AK和SK硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业

总条数： 109

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Python SDK环境配置 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

逻辑运算符 - 数据湖探索 DLI

获取DLI委托信息（废弃） - 数据湖探索 DLI

DWS Connector概述 - 数据湖探索 DLI

join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

计费样例 - 数据湖探索 DLI

Bucket调优示例 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

新建SQL作业 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

费用账单 - 数据湖探索 DLI

Kafka - 数据湖探索 DLI

窗口聚合 - 数据湖探索 DLI

下载并安装JDBC驱动包 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线