搜索_华为云

创建Bucket索引表调优 - 数据湖探索 DLI

创建Bucket索引表调优创建Bucket索引表调优 Bucket索引常用设置参数： Spark： hoodie.index.type=BUCKET hoodie.bucket.index.num.buckets=5 Flink index.type=BUCKET hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。数据类型的使用，请参考Format章节。语法格式 1 2 3 4 5 6 7 8 9 10 11 create

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
函数概览 - 数据湖探索 DLI
函数概览 - 数据湖探索 DLI

函数概览 DLI提供了的decode1、javahash、max_pt等函数的说明如下。表1 其他新增函数说明函数命令格式返回值功能简介 decode1 decode1(<expression>, <search>, <result>[, <search>, <result>]

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 其他函数
Teradata函数 - 数据湖探索 DLI
Teradata函数 - 数据湖探索 DLI

Teradata函数以下函数提供Teradata SQL的能力。字符串函数 char2hexint(string) 描述：返回字符串的UTF-16BE编码的十六进制表示形式。 index(string, substring) 描述：同strpos() 函数。日期函数本节中的函数使用与Teradata

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Kafka - 数据湖探索 DLI
Kafka - 数据湖探索 DLI

SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭证。配置文件或者

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
清理多版本数据 - 数据湖探索 DLI

清理多版本数据功能描述多版本数据保留周期是在表每次执行insert overwrite或者truncate语句时触发，所以当表的多版本数据在保留周期时间外但是后续该表不会再执行insert overwrite或者truncate语句时，多版本保留周期外的数据不会自动清理。可以

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

userDefined源表功能描述您可通过编写代码实现从云生态或者开源生态获取数据，再把获取到的数据作为Flink作业的输入数据。前提条件自定义source类需要继承类RichParallelSourceFunction，并指定数据类型为Row。例如自定义类MySource：public

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
修改主机信息 - 数据湖探索 DLI

修改主机信息功能介绍该API用于在跨源中修改数据源主机信息，仅支持全量覆盖。调试您可以在API Explorer中调试该接口。 URI URI格式 PUT /v2.0/{project_id}/datasource/enhanced-connections/{connection_id}

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
算术函数 - 数据湖探索 DLI
算术函数 - 数据湖探索 DLI

算术函数表1 算术函数运算符描述 + numeric 返回 numeric。 - numeric 返回 numeric 的相反数。 numeric1 + numeric2 返回 numeric1 加 numeric2 numeric1 - numeric2 返回 numeric1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

应用场景 DLI服务适用于海量日志分析、异构数据源联邦分析、大数据ETL处理。海量日志分析游戏运营数据分析游戏公司不同部门日常通过游戏数据分析平台，分析每日新增日志获取所需指标，通过数据来辅助决策。例如：运营部门通过平台获取新增玩家、活跃玩家、留存率、流失率、付费率等，了解

 帮助中心 > 数据湖探索 DLI > 产品介绍
DIS结果表 - 数据湖探索 DLI
DIS结果表 - 数据湖探索 DLI

DIS结果表功能描述 DLI将Flink作业的输出数据写入数据接入服务（DIS）中。适用于将数据过滤后导入DIS通道，进行后续处理的场景。数据接入服务（Data Ingestion Service，简称DIS）为处理或分析流数据的自定义应用程序构建数据流管道，主要解决云服务外

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？数据湖探索（DLI）服务对于PySpark是原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Py

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

> New > Terminal”，进入到Terminal界面。图5 进入到Terminal界面执行以下命令进入到livy配置目录下，查看spark配置文件。 cd /home/ma-user/livy/conf/ vi spark-defaults.conf 确认包含spark

帮助中心 > 数据湖探索 DLI > 用户指南
userDefined结果表 - 数据湖探索 DLI

userDefined结果表功能描述您可通过编写代码实现将DLI处理之后的数据写入到指定的云生态或者开源生态。前提条件已编写代码实现自定义sink类：自定义sink类需要继承Flink开源类：RichSinkFunction，并指定数据类型为：Tuple2<Boolean

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

grade.science[1]'), JSON_VAL(message,'$.grade.dddd') from kafkaSource; 查看taskmanager的out文件的输出结果 +I[null, James, [80,85], [80,85], 85, null] 父主题：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
弹性资源池CU设置 - 数据湖探索 DLI

弹性资源池CU设置 CU设置主要是为了控制弹性资源池扩缩容的最大最小CU范围，避免无限制的资源扩容风险。例如，当前弹性资源池CU设置的最大CU为256CU，并且该弹性资源池添加了2个队列，2个队列扩缩容策略最小CU数为64CU，这时如果该弹性资源池再添加一个队列并且该队列最小C

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
创建队列定时扩缩容计划（废弃） - 数据湖探索 DLI

创建队列定时扩缩容计划（废弃）功能介绍该API用于创建队列定时扩缩容计划，对指定的队列创建定时规格变更计划。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v1/{project_id}/queues/{queue_name}/plans

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 队列相关API（废弃）
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

grade.science[1]"),JSON_VAL(message,"$.grade.dddd") from kafkaSource; 查看sink中kafka的topic中的输出结果 {"message1":null,"message2":"swq","message3":"[80

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

grade.science[1]"), JSON_VAL(message,"$.grade.dddd") FROM kafkaSource; 查看输出结果 {"message1":null,"message2":"swq","message3":"[80,85]","message4":"[80

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
Hudi表分区设计规范 - 数据湖探索 DLI

Hudi表分区设计规范规则分区键不可以被更新： Hudi具有主键唯一性机制，但在分区表的场景下通常只能保证分区内主键唯一，因此如果分区键的值发生变更后，会导致相同主键的行记录出现多条的情况。在以日期分区的场景，可采用数据的创建时间为分区字段，切记不要采用数据更新时间做分区。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范

总条数： 810

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建Bucket索引表调优 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

函数概览 - 数据湖探索 DLI

Teradata函数 - 数据湖探索 DLI

Kafka - 数据湖探索 DLI

清理多版本数据 - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

修改主机信息 - 数据湖探索 DLI

算术函数 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

DIS结果表 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

userDefined结果表 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

弹性资源池CU设置 - 数据湖探索 DLI

创建队列定时扩缩容计划（废弃） - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线