搜索_华为云

导出数据（废弃） - 数据湖探索 DLI

被导出数据的表所在的数据库名称。 table_name 是 String 被导出数据的表名称。 compress 是 String 导出数据的压缩方法。目前支持gzip、bzip2、deflate压缩方式；若不希望压缩，则输入none。 queue_name 否 String 指定执行该

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
DWS源表（不推荐使用） - 数据湖探索 DLI

DWS的更多信息，请参见《数据仓库服务管理指南》。推荐使用DWS服务自研的DWS Connector。 DWS-Connector的使用方法请参考dws-connector-flink。前提条件请务必确保您的账户下已在数据仓库服务（DWS）里创建了DWS集群。如何创建DW

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
DLI弹性资源池与队列简介 - 数据湖探索 DLI

（HetuEngine）、通用队列。了解DLI的队列类型请参考DLI队列类型。弹性资源池模式的通用队列和SQL队列不支持跨可用区。使用方法：先创建弹性资源池，然后在弹性资源池中创建队列并分配计算资源，队列关联到具体的作业和数据处理任务。购买弹性资源池并在弹性资源池中添加队列

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

DISTINCT 则对所有值去重后计算 VARIANCE([ ALL | DISTINCT ] expression) VAR_SAMP() 的同义方法。 RANK() 返回值在一组值中的排名。结果是 1 加上分区顺序中当前行之前或等于当前行的行数。排名在序列中不一定连续。 DENSE_RANK()

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
管理DLI全局变量 - 数据湖探索 DLI

给新用户设置全局变量权限时，该用户所在用户组的所属区域需具有Tenant Guest权限。关于Tenant Guest权限的介绍和开通方法，详细参见《权限策略》和《统一身份认证服务用户指南》中的创建用户组。全局变量用户授权单击“全局配置 > 全局变量”页面，单击全局变量“

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

obs_jar_paths：对应资源包的OBS路径，参数构成为：{bucketName}.{obs域名}/{jarPath}/{jarName}。例如："https://bucketname.obs.cn-north-1.myhuaweicloud.com/jarname.jar" group_name：资源包所属分组名称。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
Upsert Kafka结果表 - 数据湖探索 DLI

Upsert Kafka结果表功能描述 DLI将Flink作业的输出数据以upsert的模式输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

Kafka结果表功能描述 DLI将Flink作业的输出数据输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
userDefined结果表 - 数据湖探索 DLI

nk OpenSource SQL作业编辑页的UDF Jar参数上传。具体Flink OpenSource SQL作业创建指导可以参考https://support.huaweicloud.com/usermanual-dli/dli_01_0498.html。语法格式 create

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
弹性资源池扩缩容历史记录 - 数据湖探索 DLI

操作完成时间。 status String 扩缩容成功或者失败的状态。 fail_reason String 失败原因。请求示例 GET https://{endpoint}/v3/{project_id}/elastic-resource-pools/{elastic_resour

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
上传jar类型分组资源（废弃） - 数据湖探索 DLI

是否异步上传资源包。请求示例从OBS上传jar包至DLI，并定义分组名称为gatk。 { "paths": [ "https://test.obs.xxx.com/test_dli.jar" ], "group": "gatk" } 响应示例 {

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
JSON Format - 数据湖探索 DLI
JSON Format - 数据湖探索 DLI

且会以相同的格式输出。 json.map-null-key.mode 否 'FALL' String 指定处理 Map 中 key 值为空的方法。当前支持的值有：'FAIL'，'DROP'和'LITERAL'。 Option 'FAIL' 将抛出异常，如果遇到 Map 中 key 值为空的数据。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

数据种类多，有结构化的遥感影像栅格数据、矢量数据，非结构化的空间位置数据、三维建模数据；在大体量的地理大数据中，通过高效的挖掘工具或者挖掘方法实现价值提炼，是用户非常关注的话题。优势提供地理专业算子：支持全栈Spark能力，具备丰富的Spark空间数据分析算法算子，全面支持结

 帮助中心 > 数据湖探索 DLI > 产品介绍
配置DLI程序包权限 - 数据湖探索 DLI

管理员用户给新用户设置程序包组或程序包权限时，管理员用户所在用户组的所属区域需具有Tenant Guest权限。关于Tenant Guest权限的介绍和开通方法，详细参见《权限策略》和《统一身份认证服务用户指南》中的创建用户组。配置程序包组或程序包权限在“程序包管理”页面，选择要授权的程序包组

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
从Kafka读取数据写入到DWS - 数据湖探索 DLI

步骤6：发送数据和查询结果使用Kafka客户端向步骤2：创建Kafka的Topic中的Topic发送数据，模拟实时数据流。 Kafka生产和发送数据的方法请参考DMS - 连接实例生产消费信息。发送样例数据如下： {"car_id":"3027", "car_owner":"lilei",

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

Kafaka端发送数据。使用Kafka客户端向步骤2：创建Kafka的Topic中的Topic发送数据，模拟实时数据流。 Kafka生产和发送数据的方法请参考：DMS - 连接实例生产消费信息。发送样例数据如下： {"order_id":"202103241000000001", "or

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

是否异步上传资源包。请求示例从OBS上传python文件至DLI，并定义分组名称为gatk。 { "paths": [ "https://test.obs.xxx.com/dli_tf.py" ], "group": " gatk" } 响应示例 {

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
Hudi表索引设计规范 - 数据湖探索 DLI

处于单task读写可接受范围之内。如果是单个Bucket的数据量超过了该值范围，可能会有什么影响？读写任务可能会出现OOM的问题，解决方法就是提升单个task的内存占比。读写性能下降，因为单个task的处理的数据量变大，导致处理耗时变大。父主题： Hudi数据表设计规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
查询作业执行进度信息 - 数据湖探索 DLI

作业的运行进度，因为没有子作业在运行，sub_job_id不展示。如果有子作业在运行中，则展示该子作业的运行进度，progress的计算方法为：子作业已经完成的task数除以子作业总的task数。此时progress表示子作业的运行进度，sub_job_id展示。 sub_jobs

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

本例以通过DataGen表产生随机数据并输出到Mysql结果表中为例，介绍Flink Opensource SQL使用DEW管理访问凭据的配置方法。创建DLI与Mysql的增强型跨源连接。详细步骤请参考创建增强型跨源连接。创建DLI访问DEW的委托并完成委托授权。详细步骤请参考自定义DLI委托权限。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导

总条数： 230

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

导出数据（废弃） - 数据湖探索 DLI

DWS源表（不推荐使用） - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

管理DLI全局变量 - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

userDefined结果表 - 数据湖探索 DLI

弹性资源池扩缩容历史记录 - 数据湖探索 DLI

上传jar类型分组资源（废弃） - 数据湖探索 DLI

JSON Format - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

配置DLI程序包权限 - 数据湖探索 DLI

从Kafka读取数据写入到DWS - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

查询作业执行进度信息 - 数据湖探索 DLI

Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线