搜索_华为云

SQL作业运行慢如何定位 - 数据湖探索 DLI

参考图10可以看到数据倾斜时，单个任务的shuffle数据远大于其他Task的数据，导致该任务耗时时间变长。图10 数据倾斜示例图数据倾斜原因和解决： Shuffle的数据倾斜基本是由于join中的key值数量不均衡导致。对join连接条件进行group by 和count，统计每个连接条件的key值的数量。示例如下：

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
查看弹性资源池的基本信息 - 数据湖探索 DLI

支持查看以下信息：弹性资源池名称、弹性资源池创建用户、创建时间、弹性资源池VPC网段、弹性资源池是否启用IPv6，如果开启IPv6将显示具体的子网的IPv6网段。关于弹性资源池的实际CUs、已使用CUs、CU范围、规格（包周期CU）的含义请参考弹性资源池的实际CUs、已使用CUs、CU范围、规格（包周期CU）。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
DWS维表（不推荐使用） - 数据湖探索 DLI

将二者生成的宽表信息写入Kafka结果表中，其具体步骤如下：参考增强型跨源连接，在DLI上根据DWS和Kafka所在的虚拟私有云和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。设置DWS和Kafka的安全组，添加入向规则使其对Flink的队列网段放通

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
通过跨源表向CloudTable Hbase表导入数据，executor报错：RegionTooBusyException - 数据湖探索 DLI

n 问题现象客户通过DLI跨源表向CloudTable Hbase导入数据，原始数据：HBASE表，一个列簇，一个rowkey运行一个亿的模拟数据，数据量为9.76GB。导入1000W条数据后作业失败。原因分析查看driver错误日志。查看executor错误日志。查看task错误日志。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

SELECT 基本语句排序分组连接子句别名SELECT 集合运算SELECT WITH...AS CASE...WHEN

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Flink作业相关 - 数据湖探索 DLI
Flink作业相关 - 数据湖探索 DLI

System.out.println(result); } 查询作业APIG网关服务访问地址 DLI提供查询Flink作业APIG访问地址的接口。您可以使用该接口查询作业APIG网关服务访问地址。示例代码如下： 1 2 3 4 5 private static void

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
分配队列至项目 - 数据湖探索 DLI

架构规划企业项目，将分布在不同区域的资源按照企业项目进行统一管理，同时可以为每个企业项目设置拥有不同权限的用户组和用户。 DLI支持在创建队列时选择企业项目，本节操作为您介绍DLI队列资源如何绑定、修改企业项目。当前仅支持对未加入弹性资源池的队列资源修改企业项目。前提条件在

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

1版本停止服务后，正在使用该版本的作业有哪些影响？在Spark 3.1.1 EOS时间后创建的队列，在执行作业时不支持选择已经EOS的计算引擎。历史创建的队列仍然可以使用Spark 2.3.2执行作业，但作业执行过程中出现的错误，不再提供该版本的任何技术服务支持，请您尽快更换至新版本的计算引擎。 DLI

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

2版本停止服务后，正在使用该版本的作业有哪些影响？在Spark 2.3.2 EOS时间后创建的队列，在执行作业时不支持选择已经EOS的计算引擎。历史创建的队列仍然可以使用Spark 2.3.2执行作业，但作业执行过程中出现的错误，不再提供该版本的任何技术服务支持，请您尽快更换至新版本的计算引擎。 DLI

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
Bucket调优示例 - 数据湖探索 DLI

Bucket调优示例创建Bucket索引表调优 Hudi表初始化实时任务接入离线Compaction配置父主题： DLI Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

Console上执行UDTF相关操作时，需要使用自建的SQL队列。不同的IAM用户使用UDTF时，除了创建UDTF函数的用户，其他用户如果需要使用时，需要先进行授权才可使用对应的UDTF函数。授权操作参考如下：登录DLI管理控制台，选择“ 数据管理 > 程序包管理”页面，选择对应的UDTF Jar包，单击

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在DLI控制台修改数据库所有者 - 数据湖探索 DLI

作”栏中的“更多 > 修改数据库”。在弹出的对话框中，输入新的所有者用户名（已存在的用户名），单击“确定”。在“SQL编辑器”页面修改数据库所有者。在管理控制台左侧，单击“SQL编辑器”。在左侧导航栏单击选择“数据库”页签，鼠标左键单击对应数据库右侧的，在列表菜单中选择“修改数据库”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
配置Flink作业权限 - 数据湖探索 DLI

查看其他用户具备的权限：当前用户可查看其他用户具备的该作业的权限。为已有权限的用户赋予权限或回收权限。在对应作业“用户权限信息”区域的用户列表中，选择需要修改权限的用户，在“操作”列单击“权限设置”。在作业“权限设置”对话框中，对当前用户具备的权限进行修改。详细权限描述如表1所示。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

S表即可对OBS上的数据进行分析和处理。本指导中的操作内容包括：创建OBS表、导入OBS表数据、插入和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。前提条件已创建OBS的桶。具体OBS操作可以参考《对象存储服务用户指南》。本指导中的OBS桶名都为“dli-test-021”。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

前提条件该场景作业需要运行在DLI的独享队列上，因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。若使用MRS

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Flink作业开发指南 - 数据湖探索 DLI

OpenSource SQL作业开发 Flink Jar作业开发基础样例使用Flink Jar写入数据到OBS开发指南使用Flink Jar连接开启SASL_SSL认证的Kafka 使用Flink Jar读写DIS开发指南 Flink作业委托场景开发指导

 帮助中心 > 数据湖探索 DLI > 开发指南
创建JDBC维表 - 数据湖探索 DLI
创建JDBC维表 - 数据湖探索 DLI

connector.url 是数据库的URL connector.table 是读取数据库中的数据所在的表名 connector.driver 否连接数据库所需要的驱动。若未配置，则会自动通过URL提取 connector.username 否数据库认证用户名，需要和'connector

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
产品公告 - 数据湖探索 DLI
产品公告 - 数据湖探索 DLI

1.1版本停止服务（EOS）公告 DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 DLI经典型跨源连接下线（EOL）公告 DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 DLI Spark 2.3.2版本停止服务（EOS）公告

 帮助中心 > 数据湖探索 DLI > 服务公告
复杂类型 - 数据湖探索 DLI
复杂类型 - 数据湖探索 DLI

随机变量的概率分布范围分为几个等份的数值点，常用的有中位数（即二分位数）、四分位数、百分位数等。quantile digest是一个分位数的集合，当需要查询的数据落在某个分位数附近时，就可以用这个分位数做为要查询数据的近似值。它的精度可以调节，但更高精度的结果会带来空间的昂贵开销。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
Flink作业常用操作 - 数据湖探索 DLI

适用于当用户切换区域、项目或用户时，需要创建相同的作业，而作业比较多的情况。此时，不需要重新创建作业，只需要将原有的作业导出，再在新的区域、项目或者使用新的用户登录后，导入作业即可。如果需要导入自建的作业，建议使用创建作业的功能。具体请参考创建Flink OpenSource SQL作业，创建Flink

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业

总条数： 953

上一页
1
...
19
20
21
...
48
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SQL作业运行慢如何定位 - 数据湖探索 DLI

查看弹性资源池的基本信息 - 数据湖探索 DLI

DWS维表（不推荐使用） - 数据湖探索 DLI

通过跨源表向CloudTable Hbase表导入数据，executor报错：RegionTooBusyException - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

Flink作业相关 - 数据湖探索 DLI

分配队列至项目 - 数据湖探索 DLI

DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

Bucket调优示例 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

在DLI控制台修改数据库所有者 - 数据湖探索 DLI

配置Flink作业权限 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

Flink作业开发指南 - 数据湖探索 DLI

创建JDBC维表 - 数据湖探索 DLI

产品公告 - 数据湖探索 DLI

复杂类型 - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线