搜索_华为云

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

为Parquet数据。方案优势提升查询性能如果您在HDFS上拥有基于文本的数据文件或者表，而且正在使用Spark SQL对数据执行查询操作，那么推荐将文本数据文件转换为Parquet数据文件，转换需要时间，但查询性能的提升在某些情况下可能达到约30倍或更高。节省存储空间

 帮助中心 > 数据湖探索 DLI > 最佳实践
JSON函数 - 数据湖探索 DLI
JSON函数 - 数据湖探索 DLI

但是，像JSON_VALUE这样的函数允许在遇到错误时定义回退行为。但是宽松模式会将错误转换为空序列。特殊字符$表示JSON路径中的根节点。路径可以访问属性（$.a）、数组元素（$.a[0].b）或数组中的所有元素（$.a[*].b）。已知限制：当前并非所有宽松模式的特性都得到了正确的支持。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
认证鉴权 - 数据湖探索 DLI
认证鉴权 - 数据湖探索 DLI

候将Token加到请求消息头，从而通过身份认证，获得操作API的权限。 Token的有效期为24小时，需要使用一个Token鉴权时，可以先缓存起来，避免频繁调用。 Token可通过调用获取用户Token接口获取，调用本服务API需要project级别的Token，即调用获取用户Token接口时，请求body中auth

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
SHOW_COMMIT_FILES - 数据湖探索 DLI
SHOW_COMMIT_FILES - 数据湖探索 DLI

指定的instant所更新或插入的文件位于哪个分区 file_id 指定的instant所更新或插入的文件的ID previous_commit 指定的instant所更新或插入的文件的文件名中的时间戳 total_records_updated 该文件中多少个record被更新 t

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
在Spark SQL作业中使用UDF - 数据湖探索 DLI

</dependency> </dependencies> 图5 pom文件中添加配置在工程路径的“src > main > java”文件夹上鼠标右键，选择“New > Package”，新建Package和类文件。图6 新建Package和类文件 Package根据需要定义，本示例定义为：“com

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
ARCHIVELOG - 数据湖探索 DLI
ARCHIVELOG - 数据湖探索 DLI

"obs://bucket/path/h1"; 注意事项首先需要执行clean命令，在clean命令清理了历史的数据文件后，Timeline上与清理的数据文件对应的Instant才允许归档。不管是否进行compaction操作，至少会保留hoodie.compact.inline

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
从Kafka读取数据写入到RDS - 数据湖探索 DLI

从Kafka读取数据写入到RDS 本指导仅适用于Flink 1.12版本。场景描述该场景为根据商品的实时点击量，获取每小时内点击量最高的3个商品及其相关信息。商品的实时点击量数据为输入源发送到Kafka中，再将Kafka数据的分析结果输出到RDS中。例如，输入如下样例数据：

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
JDBC维表 - 数据湖探索 DLI
JDBC维表 - 数据湖探索 DLI

每次从数据库拉取数据的行数。默认值为0，表示忽略该提示。 lookup.cache.max-rows 否维表配置，缓存的最大行数，超过该值时，最先添加的数据将被标记为过期。-1表示不使用缓存。 lookup.cache.ttl 否维表配置，缓存超时时间，超过该时间的数据会被剔除。格式为：{length

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
字符串函数和运算符 - 数据湖探索 DLI

字符串函数和运算符字符串运算符 ||表示字符连接 SELECT 'he'||'llo'; --hello 字符串函数这些函数假定输入字符串包含有效的UTF-8编码的Unicode代码点。不会显式检查UTF-8数据是否有效，对于无效的UTF-8数据，函数可能会返回错误的结果。可

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
DESCRIBE DATABASE| SCHEMA - 数据湖探索 DLI

schema_name 描述 DATABASE和SCHEMA在此处是等价的，可互换的，它们有这相同的含义。该语法用于显示SCHEMA的名称、注释、还有它在文件系统上的根路径。可选项EXTENDED可以用来显示SCHEMA的数据库属性。示例 CREATE SCHEMA web; DESCRIBE

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 辅助命令语法
Hudi表分区设计规范 - 数据湖探索 DLI

是全表读取，或者按照对应业务ID过滤。基于以上考虑，维度表采用天分区会导致文件数过多，而且是全表读取，会导致所需要的文件读取Task过多，采用大颗粒度的日期分区，例如年分区，可以有效降低分区个数和文件数量；对于增量不是很大的维度表，也可以采用非分区表。如果维度表的总数据量很大或

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
SHOW_HOODIE_PROPERTIES - 数据湖探索 DLI

SHOW_HOODIE_PROPERTIES 命令功能查看指定hudi表的hoodie.properties文件中的配置。命令格式 call show_hoodie_properties(table => '[table_name]'); 参数描述表1 参数描述参数描述

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境添加Python3包后，找不到指定的Python环境。可以通过在conf文件中，设置spark.yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用DLI分析电商BI报表 - 数据湖探索 DLI

击桶DLI-demo。OBS Browser+提供强大的拖拽上传功能，您可以将本地的一个或多个文件或者文件夹拖拽到对象存储的对象列表或者并行文件系统的对象列表中；同时您也可以将文件或文件夹拖拽到指定的目录上，这样可以上传到指定的目录中。单击Best_Practice_04.zi

帮助中心 > 数据湖探索 DLI > 最佳实践
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

</dependency> </dependencies> 图5 pom文件中添加配置在工程路径的“src > main > java”文件夹上鼠标右键，选择“New > Package”，新建Package和类文件。 Package根据需要定义，本示例定义为：“com.dli.demo”

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
CLEAN - 数据湖探索 DLI
CLEAN - 数据湖探索 DLI

CLEAN 命令功能用于根据配置对Timeline上的Instant进行clean，删除老旧的历史版本文件，以减少hudi表的数据存储及读写压力。命令格式 RUN CLEAN ON tableIdentifier; RUN CLEAN ON tablelocation; 参数描述

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

'obs://....') using json：指定使用 JSON 格式。 options：用于设置表的选项。 path：指定OBS中JSON文件的路径。父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

快照查询（Snapshot Queries）可以读到最新的commit/compaction产生的快照。对于MOR表，还会在查询中合并最新的delta log文件的内容，使读取的数据近实时。增量查询增量查询（Incremental Queries）只会查询到给定的commit/compaction之后新增的数据。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
SHOW_INVALID_PARQUET - 数据湖探索 DLI

SHOW_INVALID_PARQUET 命令功能查看执行路径下损坏的parquet文件。命令格式 call show_invalid_parquet(path => 'path') 参数描述表1 参数描述参数描述是否必填 path 需要查询的FS路径是示例 call

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明

总条数： 484

上一页
1
...
9
10
11
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

JSON函数 - 数据湖探索 DLI

认证鉴权 - 数据湖探索 DLI

SHOW_COMMIT_FILES - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

ARCHIVELOG - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

JDBC维表 - 数据湖探索 DLI

字符串函数和运算符 - 数据湖探索 DLI

DESCRIBE DATABASE| SCHEMA - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

SHOW_HOODIE_PROPERTIES - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

CLEAN - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

SHOW_INVALID_PARQUET - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线