搜索_华为云

实时聚类 - 数据湖探索 DLI
实时聚类 - 数据湖探索 DLI

实时聚类聚类算法是非监督算法中非常典型的一类算法，经典的K-Means算法通过提前确定类别数目，计算数据点之间的距离来分类。对于离线静态数据集，我们可以依赖领域中知识来确定类别数目，运行K-Means算法可以取得比较好的聚类效果。但是对于在线实时流数据，数据是在不断变化和演进，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > StreamingML
欠费说明 - 数据湖探索 DLI
欠费说明 - 数据湖探索 DLI

欠费后需要及时充值，详细操作请参见账户充值。若DLI的队列、弹性资源池等资源不再使用，您可以将他们删除，以免继续扣费。您可以在“费用中心 > 总览”页面设置“可用额度预警”功能，当可用额度、通用代金券和现金券的总额度低于预警阈值时，系统自动发送短信和邮件提醒。当产生欠费后，请您及时充值使可用

 帮助中心 > 数据湖探索 DLI > 计费说明
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

Python SDK概述操作场景 DLI SDK让您无需关心请求细节即可快速使用数据湖探索服务。本节操作介绍如何在Python环境获取并使用SDK。使用须知要使用DLI Python SDK访问指定服务的 API ，您需要确认已在DLI管理控制台开通当前服务并完成服务授权。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

登录数据湖探索管理控制台，选择“SQL作业”，在要修改的作业所在行的“操作”列，单击“编辑”进入SQL编辑器界面。在SQL编辑器界面，单击“设置”，在“配置项”尝试添加以下几个Spark参数进行解决。参数项如下，冒号前是配置项，冒号后是配置项的值。 spark.sql.enableToString:false

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
使用Hive语法创建DLI表 - 数据湖探索 DLI

= true ); 示例6：创建textfile格式的非分区表，并设置ROW FORMAT 示例说明：本例创建名为table4的textfile类型的非分区表，并设置ROW FORMAT相关格式（ROW FORMAT功能只支持textfile类型的表）。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 创建DLI表
配置DLI云服务委托权限 - 数据湖探索 DLI

限。更新DLI委托权限（dli_management_agency）在DLI控制台左侧导航栏中单击“全局配置 > 服务授权”。在委托设置页面，按需选择以下场景的权限。单击权限卡片上的可以查看包含的详细的权限策略。委托说明如表1所示。表1 dli_management_agency委托包含的权限

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
套餐包计费 - 数据湖探索 DLI
套餐包计费 - 数据湖探索 DLI

续使用。购买套餐包登录DLI管理控制台。选择“资源管理 > 队列管理”。在队列管理页面，单击“购买套餐包”。在“购买套餐包”页面设置相关参数。表2 参数说明参数名称描述区域选择所在的区域。不同区域的云服务之间内网互不相通；请就近选择靠近您业务的区域，可减少网络时延，提高访问速度。

帮助中心 > 数据湖探索 DLI > 计费说明
Spark SQL语法概览 - 数据湖探索 DLI

自定义函数相关语法创建函数删除函数显示函数详情显示所有函数数据多版本相关语法创建OBS表时开启数据多版本修改表时开启或关闭数据多版本设置多版本备份数据保留周期查看多版本备份数据恢复多版本备份数据配置多版本过期数据回收站清理多版本数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

UpsertKafka 示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列-->找到作业的所属队列-->更多-->测试

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

UpsertKafka 示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列-->找到作业的所属队列-->更多-->测试

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
pyspark样例代码 - 数据湖探索 DLI

IntegerType, StringType, Row from pyspark.sql import SparkSession 创建会话并设置AK/SK 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。 1

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
批作业SQL语法概览 - 数据湖探索 DLI

自定义函数相关语法创建函数删除函数显示函数详情显示所有函数数据多版本相关语法创建OBS表时开启数据多版本修改表时开启或关闭数据多版本设置多版本备份数据保留周期查看多版本备份数据恢复多版本备份数据配置多版本过期数据回收站清理多版本数据父主题： Spark SQL语法参考（即将下线）

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线）
EdgeHub输出流（EOS） - 数据湖探索 DLI

field_delimiter 否属性分隔符。当“encode”为“csv”时，用于指定csv字段分隔符，默认为“,"。当“encode”为“json”时，不需要设置属性之间的分隔符。 json_config 否当“encode”为“json”时，可以通过该参数指定json字段和流定义字段的映射关系，格式为：

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输出流
使用Hive语法创建DLI表 - 数据湖探索 DLI

= true ); 示例6：创建textfile格式的非分区表，并设置ROW FORMAT 示例说明：本例创建名为table4的textfile类型的非分区表，并设置ROW FORMAT相关格式（ROW FORMAT功能只支持textfile类型的表）。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
增强型跨源连接标签管理 - 数据湖探索 DLI

在对应连接的“操作”列，选择“更多”>“标签”。进入标签管理页面，显示当前连接的标签信息。单击“添加/编辑标签”，弹出“添加/编辑标签”对话框，配置参数。标签键和标签值设置完成后，单击“添加”，将标签加入到输入框中。图1 添加标签表1 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
常用操作与系统权限关系 - 数据湖探索 DLI

ALTER_TABLE_RECOVER_PARTITION 恢复表分区 √ × √ √ ALTER_TABLE_SET_LOCATION 设置分区路径 √ × √ √ GRANT_PRIVILEGE 表的赋权 √ × √ √ REVOKE_PRIVILEGE 表权限的回收 √ ×

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
EdgeHub输入流（EOS） - 数据湖探索 DLI

field_delimiter 否属性分隔符。当“encode”为“csv”时，用于指定csv字段分隔符，默认为“,"。当“encode”为“json”时，不需要设置属性之间的分隔符。 json_config 否当“encode”为“json”时，可以通过该参数指定json字段和流定义字段的映射关系，格式为：

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输入流
标示符 - 数据湖探索 DLI
标示符 - 数据湖探索 DLI

non_equi_join_condition number partition_col_name partition_col_value partition_specs property_name property_value regex_expression result_expression select_statement

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线）
DLI弹性资源池与队列简介 - 数据湖探索 DLI

图1 DLI计算资源模式弹性资源池模式：计算资源的池化管理模式，提供计算资源的动态扩缩容能力，同一弹性资源池中的队列共享计算资源。通过合理设置队列的计算资源分配策略，可以提高计算资源利用率，应对业务高峰期的资源需求。适用场景：适合业务量有明显波动的场合，如周期性的数据批处理任务或实时数据处理需求。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
初始化DLI客户端 - 数据湖探索 DLI

险，建议在配置文件或者环境变量中密文存放, 使用时解密, 确保安全。本示例以ak和sk保存在环境变量中为例，运行本示例前请先在本地环境中设置环境变量xxx_SDK_AK和xxx_SDK_SK。 regionName ：所属区域名称 projectId ：项目ID 通过以下方式可

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置

总条数： 574

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

实时聚类 - 数据湖探索 DLI

欠费说明 - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

配置DLI云服务委托权限 - 数据湖探索 DLI

套餐包计费 - 数据湖探索 DLI

Spark SQL语法概览 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

批作业SQL语法概览 - 数据湖探索 DLI

EdgeHub输出流（EOS） - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

增强型跨源连接标签管理 - 数据湖探索 DLI

常用操作与系统权限关系 - 数据湖探索 DLI

EdgeHub输入流（EOS） - 数据湖探索 DLI

标示符 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线