搜索_华为云

数据类型隐式转换 - 数据湖探索 DLI

数据类型隐式转换简介隐式转换对照表

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

与传统自建Hadoop集群相比，Serverless架构的DLI还具有以下优势：表1 Serverless DLI与传统自建Hadoop集群对比的优势优势维度数据湖探索 DLI 自建Hadoop系统低成本资金成本按照实际扫描数据量或者CU时收费，可变成本，成本可节约50%。

帮助中心 > 数据湖探索 DLI > 产品介绍
percentile - 数据湖探索 DLI
percentile - 数据湖探索 DLI

否则返回NULL。 B 是参数B控制近似的精确度，B值越大，近似度越高，默认值为10000。当列中非重复值的数量小于B时，返回精确的百分数。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库存（items）的 0.5 百分位，精确度100。命令示例如下： select P

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

使用“包年/包月”和“按需计费-非专属”的队列，请退订队列资源后，重新购买弹性资源池，使用新购的弹性资源池执行作业。 “弹性资源池队列”对比“包年/包月”和“按需计费”计费模式队列有哪些优势？ “包年/包月”和“按需计费”队列：固定资源规格，当作业任务对资源的请求量发生变化时，会导致队列资源浪费或者资源不足的问题。

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

1.0 (5 rows) dense_rank()→ bigint 描述：返回值在一组值中的排名。这与rank（）相似，不同的是tie值不会在序列中产生间隙。 ntile(n)→ bigint 描述：用于将分组数据按照顺序切分成n片，返回当前切片值。NTILE不支持ROWS

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

k、Flink程序就可轻松完成多数据源的联合计算分析，挖掘和探索数据价值。发布区域：全部 Serverless DLI与自建Hadoop对比优势 DLI使用约束与限制 OBS 2.0支持权限管理 DLI服务不仅在服务本身有一套完善的权限控制机制，同时还支持通过统一身份认证服务（Identity

帮助中心 > 数据湖探索 DLI > 功能总览
Print - 数据湖探索 DLI
Print - 数据湖探索 DLI

如果为false，则表示输出数据到taskmanager的out中。 sink.parallelism 否无 Integer 为Print结果表定义并行度。默认情况下，并行度由框架决定，与上游并行度一致。示例参考创建Flink OpenSource作业，创建flink opensource sql作业，运行如下

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
聚合函数概览 - 数据湖探索 DLI

col, p [, B]) DOUBLE 返回组内数字列近似的第p位百分数（包括浮点数），p值在[0,1]之间。参数B控制近似的精确度，B值越大，近似度越高，默认值为10000。当列中非重复值的数量小于B时，返回精确的百分数。 stddev_pop stddev_pop(col) DOUBLE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
Spark作业开发类 - 数据湖探索 DLI

库？如何在DLI中运行复杂PySpark程序？如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 Spark jar 如何读取上传文件添加Python包后，找不到指定的Python环境为什么Spark jar 作业一直处于“提交中”？

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

MRS服务Spark组件的是建立在客户的购买MRS服务所分配的虚机上，用户可以根据实际需求调整及优化Spark服务，支持各种接口调用。 MRS的这种模式提供了更高的自由度和定制性，适合有大数据处理经验的用户使用。具体请参考《MapReduce服务开发指南》。父主题： DLI产品咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

write.index_bootstrap.tasks 否环境默认并行度 Integer “index.bootstrap.enabled”开启后有效，增加任务数提升启动速度，默认值为环境默认并行度。 hoodie.bucket.index.num.buckets 否 5 Integer

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

如果为 true，则根据拆分数推断源并行度。如果为 false，则源的并行度由 config 设置。 table.exec.hive.infer-source-parallelism.max 1000 Integer 设置源运算符的最大推断并行度。 Load Partition Splits

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Hudi常见配置参数 - 数据湖探索 DLI

000000001），在磁盘空间上进行权衡以降低误报率。 0.000000001 hoodie.bloom.index.parallelism 索引查找的并行度，其中涉及Spark Shuffle。默认情况下，根据输入的工作负载特征自动计算的。 0 hoodie.bloom.index.prune

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
实时任务接入 - 数据湖探索 DLI

'10', //flink写入并行度 'hoodie.datasource.write.keygenerator.type' = 'COMPLEX',

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

parallelism 否无 int 定义查找连接运算符的自定义并行度。默认情况下，如果未定义此选项，则规划器将通过考虑全局配置（如果定义了选项“lookup.parallelism”）来推导并行度，否则将考虑输入运算符的并行度。 lookup.batch.interval 否 1s Duration

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
JDBC - 数据湖探索 DLI
JDBC - 数据湖探索 DLI

写入到数据库失败后的最大重试次数。 sink.parallelism 否无 Integer 用于定义JDBC sink算子的并行度。默认情况下，并行度是由框架决定，即与上游并行度一致。分区扫描功能介绍为了加速Source任务实例中的数据读取，Flink为JDBC表提供了分区扫描功能。以下参

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
查询作业列表 - 数据湖探索 DLI

用，指定作业运行使用的DLI基础Flink镜像的版本。 operator_config 否 String 各算子并行度参数，以json的形式展示各算子id和并行度。 static_estimator_config 否 String 静态流图资源预估参数，以json的形式展示。 real_cu_number

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

precombine.field 是无 String 数据合并字段。 read.tasks 否 4 Integer 读hudi表task并行度。 read.streaming.enabled 是 false Boolean 设置 true 开启流式增量模式，false批量读。建议值为true

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
查询作业详情 - 数据湖探索 DLI

用，指定作业运行使用的DLI基础Flink镜像的版本。 operator_config 否 String 各算子并行度参数，以json的形式展示各算子id和并行度。 static_estimator_config 否 String 静态流图资源预估参数，以json的形式展示。 runtime_config

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

exactly-once none sink.parallelism 否无 Integer 定义Kafka sink算子的并行度。默认情况下，由框架确定并行度，与上游链接算子的并行度保持一致。 ssl_auth_name 否无 String DLI侧创建的Kafka_SSL类型的跨源认证名称。Kafka配置SSL时使用该配置。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表

总条数： 74

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据类型隐式转换 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

percentile - 数据湖探索 DLI

DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

Print - 数据湖探索 DLI

聚合函数概览 - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

实时任务接入 - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

JDBC - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线