搜索_华为云

regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

相似函数：regexp_replace1，regexp_replace1函数用于将source字符串中第occurrence次匹配pattern的子串，替换成指定字符串replace_string后，返回结果字符串。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

ROW_NUMBER 和 RANK 相似。ROW_NUMBER 按顺序对所有行进行编号（例如 1，2，3，4，5）。RANK 为等值 row 提供相同的序列值（例如 1，2，2，4，5）。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
创建Flink Jar作业 - 数据湖探索 DLI

Spark资源并行度由Executor数量和Executor CPU核数共同决定。管理单元设置管理单元的CU数。并行数作业的并行数是指作业中各个算子的并行执行的子任务的数量，即算子子任务数就是其对应算子的并行度。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
条件表达式 - 数据湖探索 DLI
条件表达式 - 数据湖探索 DLI

与CASE表达式相似，仅在必要时计算参数。可类比MySQL的nvl功能，经常用于转空值为0或者' '（空字符）。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Upsert Kafka结果表 - 数据湖探索 DLI

sink.parallelism 否 (none) Interger 定义upsert-kafka sink 算子的并行度。默认情况下，由框架确定并行度，与上游链接算子的并行度保持一致。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
字符串函数和运算符 - 数据湖探索 DLI

as varbinary));-- aGVsbG8gd29ybGQ= select base64decode('aGVsbG8gd29ybGQ=');-- hello world jaro_distance(STRING str1, STRING str2) 描述：比较两个字符串的相似度

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
窗口关联 - 数据湖探索 DLI
窗口关联 - 数据湖探索 DLI

INNER/LEFT/RIGHT/FULL OUTER INNER/LEFT/RIGHT/FULL OUTER 这几种窗口关联的语法非常相似，我们在这里只举一个 FULL OUTER JOIN 的例子。当执行窗口关联时，所有具有相同 key 和相同滚动窗口的数据会被关联在一起。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
数学函数和运算符 - 数据湖探索 DLI

select wilson_interval_upper(1, 5, 1.96);-- 0.6244717358814612 cosine_similarity(x, y) → double 返回稀疏向量x和y之间的余弦相似度。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

注意事项建议Hudi作为Source表时设置限流 Hudi表作为Source表时，为防止数据上限超过流量峰值导致作业出现异常，建议设置限流（read.rate.limit），限流上限应该为业务上线压测的峰值。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
percentile - 数据湖探索 DLI
percentile - 数据湖探索 DLI

B 是参数B控制近似的精确度，B值越大，近似度越高，默认值为10000。当列中非重复值的数量小于B时，返回精确的百分数。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库存（items）的 0.5 百分位，精确度100。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 Notebook是基于开源JupyterLab进行了深度优化的交互式数据分析挖掘模块，提供在线的开发和调试能力，用于编写和调测模型训练代码。

帮助中心 > 数据湖探索 DLI > 用户指南
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

这与rank（）相似，不同的是tie值不会在序列中产生间隙。 ntile(n)→ bigint 描述：用于将分组数据按照顺序切分成n片，返回当前切片值。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Print - 数据湖探索 DLI
Print - 数据湖探索 DLI

sink.parallelism 否无 Integer 为Print结果表定义并行度。默认情况下，并行度由框架决定，与上游并行度一致。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
聚合函数概览 - 数据湖探索 DLI

参数B控制近似的精确度，B值越大，近似度越高，默认值为10000。当列中非重复值的数量小于B时，返回精确的百分数。 stddev_pop stddev_pop(col) DOUBLE 返回指定列的偏差。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
SQL作业使用咨询 - 数据湖探索 DLI

DLI暂不支持本地测试Spark作业，您可以安装DLI Livy工具，通过Livy工具提供的交互式会话能力调测Spark作业。推荐使用使用Livy提交Spark Jar作业。 DLI 表(OBS表 / DLI 表 )数据支持删除某行数据吗？

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Spark作业开发类 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 Spark jar 如何读取上传文件添加Python包后，找不到指定的Python环境为什么Spark jar 作业一直处于“提交中”？父主题： Spark作业相类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

MRS的这种模式提供了更高的自由度和定制性，适合有大数据处理经验的用户使用。具体请参考《MapReduce服务开发指南》。父主题： DLI产品咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

write.index_bootstrap.tasks 否环境默认并行度 Integer “index.bootstrap.enabled”开启后有效，增加任务数提升启动速度，默认值为环境默认并行度。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

如果为 false，则源的并行度由 config 设置。 table.exec.hive.infer-source-parallelism.max 1000 Integer 设置源运算符的最大推断并行度。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Hudi常见配置参数 - 数据湖探索 DLI

true hoodie.bloom.index.use.caching 为true时，将通过减少用于计算并行度或受影响分区的IO来缓存输入的RDD以加快索引查找。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考

总条数： 60

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

regexp - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

条件表达式 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

字符串函数和运算符 - 数据湖探索 DLI

窗口关联 - 数据湖探索 DLI

数学函数和运算符 - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

percentile - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

Print - 数据湖探索 DLI

聚合函数概览 - 数据湖探索 DLI

SQL作业使用咨询 - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线