搜索_华为云

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

partitions参数提高并行度操作场景 Spark作业在执行shuffle类语句，包括group by、join等场景时，常常会出现数据倾斜的问题，导致作业任务执行缓慢。该问题可以通过设置spark.sql.shuffle.partitions提高shuffle read task的并行度来进行解决。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
转换函数 - 数据湖探索 DLI
转换函数 - 数据湖探索 DLI

); select cast(186 as varchar); try_cast(value AS type) → type 与cast()相似，区别是转换失败返回null。 select try_cast(1860 as tinyint); _col0 ------- NULL

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
regexp_replace - 数据湖探索 DLI
regexp_replace - 数据湖探索 DLI

nce次匹配pattern的子串，以及之后匹配pattern的子串，全都替换成指定字符串replace_string后，返回结果字符串。相似函数：regexp_replace1，regexp_replace1函数用于将source字符串中第occurrence次匹配patter

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
CREATE VIEW语句 - 数据湖探索 DLI
CREATE VIEW语句 - 数据湖探索 DLI

CREATE VIEW语句语法定义 CREATE VIEW [IF NOT EXISTS] view_name [{columnName [, columnName ]* }] [COMMENT view_comment] AS query_expression 功能描述

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

不会在排名序列中产生间隙。 ROW_NUMBER() 在窗口分区内根据 rows 的排序为每一行分配一个唯一的序列号，从一开始。ROW_NUMBER 和 RANK 相似。ROW_NUMBER 按顺序对所有行进行编号（例如 1，2，3，4，5）。RANK 为等值 row 提供相同的序列值（例如 1，2，2，4，5）。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
创建Flink Jar作业 - 数据湖探索 DLI

= 管理单元 * 4。 Spark资源并行度由Executor数量和Executor CPU核数共同决定。管理单元设置管理单元的CU数。并行数作业的并行数是指作业中各个算子的并行执行的子任务的数量，即算子子任务数就是其对应算子的并行度。说明：并行数不能大于计算单元（CU数量-管理单元CU数量）的4倍。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
条件表达式 - 数据湖探索 DLI
条件表达式 - 数据湖探索 DLI

(3 rows) COALESCE coalesce(value[, ...]) 返回参数列表中的第一个非空value。与CASE表达式相似，仅在必要时计算参数。可类比MySQL的nvl功能，经常用于转空值为0或者' '（空字符）。 select coalesce(a,0)

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

云容器引擎-成长地图 | 华为云数据湖探索数据湖探索（Data Lake Insight，简称DLI）是完全兼容Apache Spark、Apache Flink、HetuEngine生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。用户不需

 帮助中心 > 数据湖探索 DLI > 成长地图
创建视图 - 数据湖探索 DLI
创建视图 - 数据湖探索 DLI

创建视图功能描述创建视图。语法格式 1 CREATE [OR REPLACE] VIEW view_name AS select_statement; 关键字 CREATE VIEW：基于给定的select语句创建视图，不会将select语句的结果写入磁盘。 OR REP

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 视图相关
字符串函数和运算符 - 数据湖探索 DLI

);-- hello world jaro_distance(STRING str1, STRING str2) 描述：比较两个字符串的相似度。 select JARO_DISTANCE('hello', 'hell');-- 0.9333333333333332 FNV_HASH(type

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Upsert Kafka结果表 - 数据湖探索 DLI

sink.parallelism 否 (none) Interger 定义upsert-kafka sink 算子的并行度。默认情况下，由框架确定并行度，与上游链接算子的并行度保持一致。 properties.* 否 (none) String 该选项可以传递任意的 Kafka 参数。选项的后缀名必须匹配定义在

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

Maxwell Format 功能描述 Flink 支持将 Maxwell JSON 消息解释为 INSERT/UPDATE/DELETE 消息到 Flink SQL 系统中。在许多情况下，这对于利用此功能很有用。例如：将数据库中的增量数据同步到其他系统审计日志数据库的实时物化视图

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启）操作场景本节操作介绍创建Flink作业时，配置流应用实现高可靠性能的操作方法。操作步骤用户在消息通知服务（SMN）中提前创建一个“主题”，并将其指定的邮箱或者手机号添加至主题订阅中。此时指定的邮箱或者手机会收到请求订阅的通知，单击链接确认订阅即可。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
窗口关联 - 数据湖探索 DLI
窗口关联 - 数据湖探索 DLI

INNER/LEFT/RIGHT/FULL OUTER INNER/LEFT/RIGHT/FULL OUTER 这几种窗口关联的语法非常相似，我们在这里只举一个 FULL OUTER JOIN 的例子。当执行窗口关联时，所有具有相同 key 和相同滚动窗口的数据会被关联在一起。这里给出一个基于

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
测试地址连通性 - 数据湖探索 DLI

测试地址连通性 DLI提供的“测试地址连通性”用于验证DLI队列与目标地址之间的网络连通性。常用于读写外部数据源场景，在配置了跨源连接后，检验DLI队列与绑定的跨源对端地址之间的通信能力。测试队列与数据源地址连通性登录DLI管理控制台，选择“资源管理 > 队列管理”。在“

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
数学函数和运算符 - 数据湖探索 DLI

96);-- 0.6244717358814612 cosine_similarity(x, y) → double 返回稀疏向量x和y之间的余弦相似度。 SELECT cosine_similarity (MAP(ARRAY['a'],ARRAY[1.0]),MAP(ARRAY['a']

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
生成Flink SQL作业的静态流图 - 数据湖探索 DLI

单TM所占CU数 manager_cu_number 否 Integer 管理单元CU数。 parallel_number 否 Integer 最大并行度。并行数为作业每个算子的并行数，适度增加并行数会提高作业整体算力，但也须考虑线程增多带来的切换开销，上限是计算单元CU数的4倍，最佳实践为计算单元CU数的1-2倍。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
图解数据湖探索 - 数据湖探索 DLI

图解数据湖探索

 帮助中心 > 数据湖探索 DLI > 产品介绍
增强型跨源连接概述 - 数据湖探索 DLI

使用DLI增强型跨源时，弹性资源池/队列的网段与数据源网段不能重合。访问跨源表需要使用已经创建跨源连接的队列。跨源表不支持Preview预览功能。检测连通性要求检测跨源连接的连通性时对IP约束限制如下： IP必须为合法的IP地址，用“.”分隔的4个十进制数，范围是0-255。测试时IP地址后

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
在DLI控制台配置数据库权限 - 数据湖探索 DLI

在DLI控制台配置数据库权限数据库权限操作场景针对不同用户，可以通过权限设置分配不同的数据库权限。管理员用户和数据库的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其数据库权限。给新用户设置数据库权限时，该用户所在用户组的所属区域需具有Tenant Guest权限。关于Tenant

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源

总条数： 318

上一页
1
2
3
4
5
...
16
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

转换函数 - 数据湖探索 DLI

regexp_replace - 数据湖探索 DLI

CREATE VIEW语句 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

条件表达式 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

创建视图 - 数据湖探索 DLI

字符串函数和运算符 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

窗口关联 - 数据湖探索 DLI

测试地址连通性 - 数据湖探索 DLI

数学函数和运算符 - 数据湖探索 DLI

生成Flink SQL作业的静态流图 - 数据湖探索 DLI

图解数据湖探索 - 数据湖探索 DLI

增强型跨源连接概述 - 数据湖探索 DLI

在DLI控制台配置数据库权限 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线